《中國經(jīng)濟周刊》 記者 孫冰 | 北京報道
誰是當(dāng)下中國乃至全球的“科技頂流”?AI大模型幾乎毫無爭議。
5月28日,科技部新一代人工智能發(fā)展研究中心發(fā)布的《中國人工智能大模型地圖研究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國,目前中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。而從大模型區(qū)域分布來看,中國已有14個地區(qū)在開展大模型研發(fā),其中,北京、廣東、浙江、上海處于第一梯隊,數(shù)量最多的北京有38個大模型,第二位的廣東有20個。
(資料圖)
在全球大模型競賽中,中國科學(xué)院院士、中國計算機學(xué)會開源發(fā)展委員會主任王懷民表示,過去5年世界上參數(shù)量超過百億的大模型大約有45個,其中有32個出現(xiàn)在美國,9個出現(xiàn)在中國,4個出現(xiàn)在歐洲。
但是,發(fā)展迅猛、一路“狂飆”的中國AI大模型們,仍然需要一些冷靜的思考。
大模型“智能涌現(xiàn)”令人興奮,
AI能力開始不可預(yù)測
人工智能技術(shù)已經(jīng)發(fā)展了很多年,為什么大模型出現(xiàn)后,學(xué)界、產(chǎn)業(yè)界乃至社會大眾會如此興奮甚至害怕呢?北京智源人工智能研究院院長黃鐵軍教授告訴《中國經(jīng)濟周刊》記者,AI之前更像是人類的助手,根據(jù)人類的指令做著人類能夠確定結(jié)果的工作,比如你設(shè)計AI打開電燈,AI就只會打開電燈。
“但是,大模型之所以現(xiàn)在如此受關(guān)注,是因為當(dāng)人工智能的參數(shù)量達到了百億級別之后,出現(xiàn)了拐點或者說突變,人工智能的能力開始不可預(yù)測了,就是所謂的‘智能涌現(xiàn)’現(xiàn)象,人工智能一些沒有被預(yù)期到的能力開始出現(xiàn),這種不可預(yù)知讓大家都很興奮?!秉S鐵軍說。
黃鐵軍介紹,這一波人工智能浪潮的核心任務(wù)就是訓(xùn)練模型,所謂模型,在人工智能領(lǐng)域的意思很明確,就是一個神經(jīng)網(wǎng)絡(luò),而神經(jīng)網(wǎng)絡(luò)并沒有什么特別的地方,我們?nèi)四X就是個神經(jīng)網(wǎng)絡(luò)。
“但人腦是一個很龐大的神經(jīng)網(wǎng)絡(luò),大約有800多億個神經(jīng)元通過100萬億個神經(jīng)突觸進行連接,所以人腦的能力非常強。對比一下,最接近人類的猩猩,其腦部神經(jīng)元的數(shù)量和連接的數(shù)量差不多是人腦的1/3,猴子是人類的1/10,而一條蟲子大概有300多個神經(jīng)元,但其實也可以有很多生命活動了?!秉S鐵軍解釋說。
當(dāng)然,目前人工智能模型的神經(jīng)網(wǎng)絡(luò)比人腦要簡單很多。但是,隨著數(shù)據(jù)規(guī)模的增長和算力的增加,模型的參數(shù)量也在不斷增加,能力也就不斷隨之提高,于是就有了“大模型”,即參數(shù)量巨大的神經(jīng)網(wǎng)絡(luò),當(dāng)然其智能程度就更高。
大模型是有史以來最大平臺革命,將10倍于移動互聯(lián)網(wǎng)
“AI大模型是絕對不能錯過的歷史機遇。因為這將是有史以來最大的平臺革命,它將比Windows、安卓要大10倍甚至更多,它會讓每個應(yīng)用改寫,會重構(gòu)人類的工作,會讓有創(chuàng)意的那些人的聰明才智被放大10倍或者更多?!眲?chuàng)新工場董事長兼CEO李開復(fù)說。
李開復(fù)還表示,他非常認(rèn)同美國著名VC機構(gòu)投資人安德里森·霍羅維茲(Andreessen Horowitz)的觀點:大模型的市場未來到底多大很難把握,它最小將是所有軟件,最大可能將代表著人類所有的努力。
“人類歷史上可能也就只有三四次這樣的機會。大模型賽道是未來的兵家必爭之地,因此,自主創(chuàng)新將是中國企業(yè)的必經(jīng)之路和重大責(zé)任?!崩铋_復(fù)告訴《中國經(jīng)濟周刊》記者。
李開復(fù)已經(jīng)投身人工智能超過40年,他戲稱自己是“投資人中最懂AI的,AI科學(xué)家中最懂投資的”。他從投資和產(chǎn)業(yè)發(fā)展的角度認(rèn)為,隨著大模型的崛起,人工智能的發(fā)展已經(jīng)從AI 1.0時代進入AI 2.0時代。
李開復(fù)認(rèn)為,在AI 1.0時代,單領(lǐng)域的數(shù)據(jù)集、數(shù)據(jù)集和模型各成孤島,且數(shù)據(jù)標(biāo)記工作量和成本非??捎^;但AI 2.0時代大模型的出現(xiàn)可以解決這些瓶頸障礙,人們用超級巨量數(shù)據(jù)訓(xùn)練具有跨領(lǐng)域知識的單一大模型,微調(diào)后就可以執(zhí)行五花八門的任務(wù)。這是一個全新且巨大的平臺機會,所有的應(yīng)用和界面都要重寫,AI 2.0應(yīng)用會進入爆發(fā)期。
“雖然目前大模型還是非完美的,但它已經(jīng)擁有相當(dāng)大的商業(yè)價值,甚至幾十萬億規(guī)模的商業(yè)價值?!崩铋_復(fù)預(yù)測。他表示,大模型目前還有“一本正經(jīng)地胡說八道”的問題,因為AI的推理能力也來自同一個技術(shù)引擎,如果你把它的胡說八道降到接近零,它的推理能力也幾乎沒有了。也就是說,那些讓它聰明的理由,也是讓它胡說八道的理由。
“我們相信未來這是可以解決的問題。比如可以讓AI與人類協(xié)作,我們不是把AI拿來作為一個終極的應(yīng)用,而是把它當(dāng)作一個人類‘助理’。比如可以先讓AI起草法律文件或者新聞稿件的初稿,最后由人類的律師和記者進行把關(guān)和調(diào)整,這樣就能夠在享受AI強大能力的同時,又避免了AI會犯的錯誤?!崩铋_復(fù)表示。
《中國經(jīng)濟周刊》記者 馬銘悅I攝
大模型競爭沒有絕對壁壘,但平臺席位不會太多,成敗關(guān)鍵在生態(tài)
黃鐵軍表示,大模型最終會成為未來社會的一種新型基礎(chǔ)設(shè)施,其提供“智力”能力,輸送給千行百業(yè)和千家萬戶。因此,人工智能進入大模型時代之后,會形成一個體系化的產(chǎn)業(yè)生態(tài)。
簡單來說,就像電力時代的電網(wǎng)一樣,千行百業(yè)、千家萬戶都在用電,但并不是自己發(fā)電,而是有專門的發(fā)電廠,發(fā)電方式也是多種多樣,如煤電、火電、風(fēng)電、核電……也有企業(yè)去生產(chǎn)各種各樣的電器。
“有了大模型就像人類學(xué)會發(fā)電了,目前可能是一種技術(shù)路徑走通了,但后續(xù)一定還會有各種各樣‘發(fā)電手段’不斷演進迭代、降本增效。這意味著,就像不會有國家或企業(yè)壟斷發(fā)電一樣,大模型也沒有絕對壁壘和門檻,大家比拼的是成本和效率,競爭的是應(yīng)用和生態(tài)?!秉S鐵軍說。
李開復(fù)也表示,未來的AI 2.0時代會有三大生態(tài)層:基礎(chǔ)模型層、中間層和應(yīng)用層?!耙源竽P蜑榇淼腁I 2.0市場規(guī)模巨大,足以容納巨頭、中小企業(yè)和初創(chuàng)公司在里面‘賽馬’?!彼f。
至于創(chuàng)業(yè)者和投資人如何選擇自己在這個龐大生態(tài)中的地位和角色,李開復(fù)認(rèn)為,需要基于不同的判斷。
比如,基礎(chǔ)模型層的大模型平臺公司當(dāng)然機會巨大,天花板會非常高,就像PC互聯(lián)網(wǎng)時代的微軟和移動互聯(lián)網(wǎng)時代的谷歌,但風(fēng)險也是最大的,因為平臺公司一定是少數(shù);如果是做應(yīng)用層,風(fēng)險就沒有那么大,而且每一個生產(chǎn)力領(lǐng)域都可能成長出垂直領(lǐng)域的領(lǐng)先公司,但規(guī)??赡軣o法與平臺公司相比。對于投資人來說,則永遠是在風(fēng)險和回報之間尋求平衡。
人工智能、智能制造業(yè)崗位頗受歡迎
中國大模型在“狂飆”,但“平臺席位”不會太多,安全威脅也要警惕
聚焦到中國,李開復(fù)認(rèn)為,大模型和AI 2.0也是中國不容錯過的歷史機遇,而且中國也有自身的優(yōu)勢。
“中國擁有豐富的中文語料和龐大的市場,通過發(fā)展AI大模型,中國可以推動創(chuàng)新產(chǎn)業(yè)的發(fā)展,實現(xiàn)科技與經(jīng)濟的雙重紅利。而且中國擁有龐大基數(shù)的年輕工程師和最堅韌的企業(yè)家,為發(fā)展AI大模型提供了強大的人才支持,技術(shù)領(lǐng)先、策略靈活、市場反應(yīng)快、能打硬仗、落地執(zhí)行力強,將是中國大模型公司的成功關(guān)鍵?!崩铋_復(fù)表示。
黃鐵軍也對中國在大模型領(lǐng)域的發(fā)展充滿信心。但也有一些現(xiàn)象需要格外關(guān)注。比如,大模型火了之后,還是出現(xiàn)了一哄而上、同質(zhì)化競爭加劇的現(xiàn)象。
“數(shù)據(jù)就是這些數(shù)據(jù),算力也就這么多,如果大家都去訓(xùn)練模型,一定很多工作是重復(fù)的,這其實也消耗了大量社會資源,不利于大模型生態(tài)的發(fā)展。”黃鐵軍說。
“如果類比PC互聯(lián)網(wǎng)時代和移動互聯(lián)網(wǎng)時代,全球范圍內(nèi)的大模型底層平臺很有可能不會超過三個。就像移動互聯(lián)網(wǎng)初期也曾有很多操作系統(tǒng),但最后只剩下iOS和安卓。很多企業(yè)想要成為第三個,投入巨大但最終都鎩羽而歸?!秉S鐵軍說。
黃鐵軍認(rèn)為,中國甚至全世界大模型的運營體系都會是屈指可數(shù)的,雖然還不能預(yù)判是幾個,但肯定不可能是十幾個或幾十個,根本沒有市場可能性?!案嗥髽I(yè)參與進來,不是運營平臺,而是做應(yīng)用。類似于蘋果生態(tài)和安卓生態(tài),會生發(fā)出很多應(yīng)用?!彼f。
因此,黃鐵軍建議,一方面要依靠“市場的手”,讓市場的“大浪淘沙”發(fā)揮主要作用;但同時也需要“政策的手”予以引導(dǎo)和調(diào)節(jié),推動、鼓勵和統(tǒng)籌產(chǎn)學(xué)研進行合作,共建大模型的產(chǎn)業(yè)生態(tài)。
縱觀全球,打造人工智能生態(tài),有開源和閉源兩種路線。王懷民表示,大模型因其不確定性形成開源模式和預(yù)研模式同時推進的基本格局。在美國32個大模型中,有15個開源。中國的9個大模型中,有5個開源。
但一位人工智能領(lǐng)域的資深投資人告訴《中國經(jīng)濟周刊》,現(xiàn)在國內(nèi)確實有一些大模型就是把國外的開源代碼進行“套殼”和微調(diào),“GPT3.5人家可能還會開源給你,但GPT4.0短期內(nèi)人家是不可能會給你用的”。所以,中國要發(fā)展大模型,還是要自主創(chuàng)新。而且因為大模型的發(fā)展涉及數(shù)據(jù)問題,從監(jiān)管的角度,這幾乎意味著中美一定是“平行宇宙”。
大模型越來越強大,擔(dān)心安全風(fēng)險和被AI替代不如學(xué)習(xí)與AI合作
隨著人工智能技術(shù),尤其是大模型的快速發(fā)展,安全問題也被提高到新的維度?!癆I一定會給數(shù)字世界帶來新的安全威脅?!逼姘残偶瘓F董事長齊向東告訴《中國經(jīng)濟周刊》記者。
“這個安全威脅主要來自兩個方面:一是AI可以模仿,甚至以假亂真地實施詐騙;二是AI能夠幫助黑客提高攻擊水平,幫助一些黑客寫程序、寫代碼、制定攻擊方案和提供攻擊策略。這些都給數(shù)字世界帶來新的威脅?!饼R向東說。
齊向東表示,網(wǎng)絡(luò)安全技術(shù)是一個伴生型技術(shù),一定是先有數(shù)字化技術(shù)的創(chuàng)新,再有安全技術(shù)的創(chuàng)新,這是矛和盾的關(guān)系,就像沒有一種特殊材料的矛出現(xiàn),就不會出現(xiàn)特殊材料的盾?,F(xiàn)在大模型等AI新技術(shù)還處在萌芽狀態(tài),應(yīng)用還只是試探性的,發(fā)展還是第一要務(wù)。
但齊向東表示,他相信網(wǎng)絡(luò)安全的技術(shù)和產(chǎn)品的創(chuàng)新,一定能夠解決新時代AI帶來的這些網(wǎng)絡(luò)安全問題和風(fēng)險。“奇安信正在抓緊跟進AI的各種場景,探索解決AI給我們帶來的新的網(wǎng)絡(luò)風(fēng)險所需要的新技術(shù)和新的安全解決方案,我相信,未來安全不會拖AI發(fā)展的后腿?!彼f。
至于大模型何時會影響到普通人的生活,黃鐵軍表示,其實已經(jīng)在發(fā)生了。比如現(xiàn)在人工智能已經(jīng)在替代人類的某些工作,尤其是不具備原創(chuàng)性的部分。
以繪畫為例,黃鐵軍認(rèn)為,像畢加索、齊白石這種開創(chuàng)性的創(chuàng)作,人工智能還無法替代,但如果只是模仿和組合之前的創(chuàng)作,那人工智能肯定是效率更高的。再比如像愛因斯坦、牛頓這種原創(chuàng)性的理論創(chuàng)新,人工智能也無法做到,但如果是常規(guī)編程和做數(shù)學(xué)題,那人工智能確實可以做得更好。
但黃鐵軍強調(diào),AI和人類之間并不是簡單替代,而是需要合作。“比如,一個企業(yè)原來需要1000名程序員,但接入了AI大模型能力之后,可能只需要幾十個就夠了,通過人和AI的合作來獲得更高的效率和產(chǎn)生更好的效果?!?/p>
而且黃鐵軍認(rèn)為,這種影響力會很快傳遞到教育領(lǐng)域。
“現(xiàn)在很多學(xué)生有疑問,不是先問老師,而是先問AI,因為AI掌握的知識和信息可能更全面、更豐富,然后自己根據(jù)AI給出的資料就可以學(xué)習(xí)了。這個會是非常大的沖擊,未來教師在學(xué)生的成長過程中到底發(fā)揮什么作用?扮演什么角色?AI在不停學(xué)習(xí),人自然也是要不停學(xué)習(xí),教育肯定是會長期存在下去的,只不過我們教育的目的是什么?教育的方式是什么?都需要重新思考?!秉S鐵軍說。
更為“可怕”的是,我們常說:讀書破萬卷,下筆如有神?!耙粋€人一生能讀完一萬本書已經(jīng)非常厲害了,但AI一天就能讀100萬本書,而全人類共有書籍約1億部,AI再讀3年左右就全讀完了,那AI的能力提升速度可想而知,和人類完全不在一個尺度上?!秉S鐵軍說。
科大訊飛副總裁章繼東告訴《中國經(jīng)濟周刊》記者,AI技術(shù)尤其是大模型的發(fā)展,會對中國的教育帶來巨大挑戰(zhàn)。
“中國教育的核心在于知識的傳遞和知識的獲取,尤其是考試的考核目標(biāo)主要是以知識為主,那些記憶好、訓(xùn)練多的孩子就能得高分,而這些是最容易被AI替代的能力。未來,我們將更需要具有創(chuàng)造力、有批判思維和創(chuàng)新思維的人才。但我相信,隨著大模型成為各行各業(yè)的好助手,其也會成為教育的好助手?!闭吕^東說。
(本文刊發(fā)于《中國經(jīng)濟周刊》2023年第11期)
2023年第11期《中國經(jīng)濟周刊》封面
關(guān)鍵詞: