AI驅(qū)動技術(shù)創(chuàng)新 金山辦公探索智能辦公新思路

發(fā)布時間:2023-02-07 20:49:41  |  來源:財訊網(wǎng)  

“一個成熟的辦公軟件,應(yīng)該學(xué)會自己做PPT。”

這是金山辦公副總裁姚冬在2021年金山辦公技術(shù)開放日上的發(fā)言。

從2017年姚冬牽頭成立AI團(tuán)隊至今,金山辦公已經(jīng)完成了OCR、文檔翻譯、圖文識別檢測等多領(lǐng)域應(yīng)用的落地,一些研究也已被AI頂會收錄。

30多年的長期技術(shù)積累,金山辦公在辦公領(lǐng)域早已形成了自己的核心優(yōu)勢。智能化時代,金山辦公是如何在WPS上開展技術(shù)創(chuàng)新與應(yīng)用實踐的?AI技術(shù)又該如何更好的落地?

用工程思維組建AI團(tuán)隊

IBM Watson首席技術(shù)官Rob High曾表示,AI的主旨是幫助激發(fā)人們的創(chuàng)造力而非自己創(chuàng)造。

不少業(yè)內(nèi)專家也表示,受技術(shù)所限,今天的AI還無法完全替代那些創(chuàng)造力的部分。而在非創(chuàng)造力的部分,尤其是一些需要重復(fù)性工作的部分,如機(jī)器翻譯、自動會議紀(jì)要、自動排版等,AI可以幫助人們大幅提高辦公效率。

2017年,金山辦公就已開始了對AI的布局。那時,市場上的AI創(chuàng)業(yè)團(tuán)隊多數(shù)是學(xué)術(shù)背景出身,姚冬則決定從工程思維出發(fā)組建團(tuán)隊。“我在起步階段的想法是,如何將工程研發(fā)體系建立起來,怎么做出一些產(chǎn)品和功能,讓AI能在工程上落地。”

直到今天,在AI團(tuán)隊內(nèi)部,算法和工程的邊界并不明顯,姚冬更加注重培養(yǎng)工程師的全棧能力。

姚冬現(xiàn)場講解金山辦公的程序員文化

成立5年來,金山辦公的AI團(tuán)隊在每一階段側(cè)重于不同的目標(biāo),分“三步走”戰(zhàn)略。前兩年,團(tuán)隊更強調(diào)積累AI研發(fā)能力,包括算法能力,工程能力,數(shù)據(jù)采集,數(shù)據(jù)分析能力等。后兩年更注重將技術(shù)產(chǎn)品化,關(guān)注AI產(chǎn)品能力。

姚冬也表示,在未來很長一段時間內(nèi),AI團(tuán)隊會將重心放到第三步——產(chǎn)品業(yè)務(wù)化、技術(shù)場景化。只有將產(chǎn)品變成業(yè)務(wù),融入到具體場景中,對用戶及公司產(chǎn)生價值,創(chuàng)造營收和利潤,才能實現(xiàn)長期可持續(xù)發(fā)展。

支持離線AI計算的深度學(xué)習(xí)框架KSAI-lite

2021年7月,金山辦公在首屆技術(shù)開放日的現(xiàn)場,宣布開源業(yè)界首個面向辦公領(lǐng)域的深度學(xué)習(xí)框架KSAI-lite。這套框架具有免費、開源、跨端的特性,自適應(yīng)國內(nèi)外主流軟硬件平臺,包括國產(chǎn)信創(chuàng)環(huán)境,在OCR、機(jī)器翻譯、智能校對等場景具有顯著優(yōu)勢。

這套框架的一個特色功能在于能夠離線做AI計算。姚冬介紹,面向辦公領(lǐng)域的框架與其他通用的框架不同,并非所有的AI計算都在服務(wù)端進(jìn)行,有些計算一定要在客戶端完成。這主要出于幾個原因,一是用戶數(shù)據(jù)需要保密,不能上傳,必須在用戶的電腦上處理,甚至有的客戶不聯(lián)網(wǎng)或在內(nèi)網(wǎng),必須在客戶端完成計算;還有的計算要求算法執(zhí)行快且實時,如果上傳到服務(wù)器再返回,時間就過長了。

因此,可以離線做AI計算的框架就格外重要,無需依賴服務(wù)器,在斷網(wǎng)的情況下,單機(jī)、手機(jī)或PC上都能使用。并且,這段框架一定要跨平臺,跨多個設(shè)備,不必為每一個移動設(shè)備或PC設(shè)備單獨開發(fā)一套。

未來KSAI-lite還會在更豐富的平臺適配能力、更個性的開發(fā)方式、更穩(wěn)定的業(yè)務(wù)支持能力上持續(xù)發(fā)力,為金山辦公產(chǎn)品線和整個業(yè)界提供更多AI能力的支持。

在開放框架的同時,金山辦公AI團(tuán)隊還開放出了一些內(nèi)部模型,如KSAI OCR開源模型。姚冬表示,團(tuán)隊后續(xù)還有計劃開放更多模型,如校對、翻譯模型,先在內(nèi)部落地,在應(yīng)用迭代成熟后再對外開放。

智能寫作VS AI中臺

如今,金山辦公旗下WPS已經(jīng)衍生出了智能輔助寫作功能,只要根據(jù)提綱就能自動生成文字段落,幫用戶打底稿。

而在智能寫作能力背后,其實是由一個統(tǒng)一的AI中臺對外輸出。目前,金山辦公AI中臺面向計算機(jī)視覺、自然語言處理、語音處理等算法研究方向,圍繞辦公領(lǐng)域,開發(fā)出了近100項AI能力。

AI場景落地——文檔翻譯

姚冬在接受媒體采訪時表示,最近幾年,中臺十分火熱,但它并不是適合所有公司的靈丹妙藥。他認(rèn)為,像辦公軟件這樣生命較長且規(guī)模較大的軟件項目,非常適合構(gòu)建一個中臺部門進(jìn)行長期持續(xù)的技術(shù)投入。

金山辦公 AI中臺的構(gòu)建過程是一個自我迭代的過程。在起步階段,AI中臺僅有幾個算法工程師負(fù)責(zé)搭建,隨后幾年間,隨著新場景、新需求、業(yè)界新技術(shù)的探索,一點點自我成長。待自有算法平臺成熟后,再向業(yè)務(wù)部門以及對外做輸出和推廣。

現(xiàn)在,金山辦公的AI中臺能力已逐步對外開放。

智能辦公的未來在哪?

談到AI在辦公領(lǐng)域的應(yīng)用趨勢以及核心競爭力,姚冬認(rèn)為,隨著業(yè)界和學(xué)界不斷地研發(fā)出一些新的算法,以及開源盛行,算力的提升和普及,未來AI技術(shù)的門檻將會降低。這也就意味著,各家在算法能力上的差別將不會很大。

那么,未來的差別來自哪里?姚冬認(rèn)為,主要來自于對用戶場景的挖掘。未來,誰有更多的用戶場景,誰就擁有了“護(hù)城河”。

在CV領(lǐng)域,金山辦公結(jié)合辦公場景做了很多智能化的應(yīng)用,最有代表性的是在版式轉(zhuǎn)流式的應(yīng)用場景上,以前在PC時代,拍照掃描功能算不上Office領(lǐng)域的功能,但在移動時代,已變成了常用功能,金山辦公已在這方面做得比較成熟,且優(yōu)勢突出,例如在識別后的格式復(fù)原就是一項已在業(yè)內(nèi)做到領(lǐng)先的功能。

復(fù)雜場景下的表格還原技術(shù)

與單純的功能開發(fā)不同,NLP技術(shù)需要結(jié)合辦公及文檔的場景深入使用,引導(dǎo)用戶來幫助提升算法,以提升AI的準(zhǔn)確度。在NLP方面,WPS自身積累了很多對辦公用戶有用的數(shù)據(jù),這是其他廠商所不可比擬的。

“WPS為文字處理而生,而文字是辦公活動的核心。我們在未來會繼續(xù)以文字處理為核心研發(fā)新技術(shù),滿足全行業(yè)數(shù)字化轉(zhuǎn)型的巨大需求。”姚冬表示。

免責(zé)聲明:市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

關(guān)鍵詞:

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com