如何判斷一個(gè)新事物是不是徹底火了,除了要去CBD的咖啡店聽聽人們?cè)诹氖裁?,有時(shí)候大佬之間的“口水仗”也是很好的證明。至少大模型是這樣。
新晉創(chuàng)業(yè)者王小川與百度的隔空互懟,折射出大模型賽道里熱鬧的景象。據(jù)中新經(jīng)緯不完全統(tǒng)計(jì),截至目前中國(guó)已有超過40家公司、機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。玩家紛紛涌入,這些大模型含金量究竟如何?是否會(huì)上演“一地雞毛”的終局?
資本躁動(dòng)
除了搜狗創(chuàng)始人王小川,選擇在大模型賽道再創(chuàng)業(yè)的還有已退休的美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場(chǎng)董事長(zhǎng)李開復(fù)等名人。面對(duì)大模型這一“燒錢”賽道,他們下場(chǎng)后的第一件事也便有了答案。
近日,王小川和前搜狗COO茹立云創(chuàng)辦的百川智能表示,已獲得5000萬(wàn)美元啟動(dòng)資金,來自王小川與其業(yè)內(nèi)好友的個(gè)人支持,面向機(jī)構(gòu)的融資會(huì)在近期啟動(dòng)。
據(jù)媒體報(bào)道,王小川透露,目前的資金足夠訓(xùn)練出一個(gè)好的千億模型,“至少到今年年底是夠用的”。不過緊接著王小川又說,這還遠(yuǎn)遠(yuǎn)不夠。他認(rèn)為,產(chǎn)品從0到1,5000萬(wàn)美元夠用,但若要持續(xù)做到最好,成本估計(jì)應(yīng)該在3億至20億美元之間。
2月,王慧文在離開美團(tuán)兩年后通過社交平臺(tái)發(fā)布了“英雄帖”,個(gè)人出資5000萬(wàn)美元設(shè)立北京光年之外科技有限公司,稱要打造中國(guó)的OpenAI。王慧文還表示,下輪融資已經(jīng)有頂級(jí)VC(風(fēng)險(xiǎn)投資)認(rèn)購(gòu)2.3億美金。
不過,創(chuàng)業(yè)者和企業(yè)也明白,除了大筆資金,大模型研發(fā)的關(guān)鍵還在于人才。誰(shuí)能在人才方面拔得頭籌,誰(shuí)就能在大模型的洪流中搶占先機(jī)。
王慧文在“英雄帖”中表示要拿出75%的股份邀請(qǐng)頂級(jí)研發(fā)人才;李開復(fù)則親自籌組Project Al 2.0,發(fā)朋友圈招攬全球范圍內(nèi)的人才。
此外,大模型相關(guān)的人才招聘需求也激增。招聘平臺(tái)數(shù)據(jù)顯示,2023年1-2月份發(fā)布的AIGC崗位數(shù)量同比增長(zhǎng)35%。在熱招崗位中,圖像識(shí)別、算法研究員、深度學(xué)習(xí)等崗位的年薪均已達(dá)百萬(wàn)元。
在BOSS直聘上,北京市奇點(diǎn)智源科技有限公司(下稱奇點(diǎn)智源)給AIGC方向的NLP(自然語(yǔ)言處理)算法研究員崗位開出143萬(wàn)元年薪。昆侖萬(wàn)維4月10日的公告顯示,該公司就ChatGPT、圖像視頻生成等AIGC技術(shù)與奇點(diǎn)智源進(jìn)行全面技術(shù)合作,但后續(xù)能否順利實(shí)現(xiàn)商業(yè)化存在較大的不確定性。
一位常年為企業(yè)招聘AI人才的獵頭告訴中新經(jīng)緯,他現(xiàn)在幫多家北京、杭州的公司招聘大模型相關(guān)工程師,年薪多在50萬(wàn)元至80萬(wàn)元之間,優(yōu)秀的可以突破100萬(wàn)元,“算比較高的”。
不少上市公司也因?yàn)樯孀愦竽P投蓛r(jià)大漲。數(shù)據(jù)顯示,截至4月24日收盤,三六零、昆侖萬(wàn)維、云從科技今年以來股價(jià)漲幅達(dá)153.52%、287.23%、155.58%。
昆侖萬(wàn)維宣布聯(lián)合奇點(diǎn)智源共同研發(fā)國(guó)產(chǎn)大語(yǔ)言模型“天工”3.5后,次日股價(jià)最高漲近16%,兩個(gè)交易日累計(jì)最大漲幅超22%。
三六零股價(jià)也終于擺脫了長(zhǎng)期的低迷狀態(tài),今年股價(jià)最高時(shí)達(dá)20.85元/股,現(xiàn)在市值也來到了1185億元。不過截至24日收盤,該公司股價(jià)4月累計(jì)下跌4.99%。
云從科技股價(jià)今年累計(jì)最大漲幅一度達(dá)284.98%,股價(jià)曾達(dá)61.8元/股的歷史高點(diǎn),但近期股價(jià)已回調(diào)超三成。不過,云從科技對(duì)大模型產(chǎn)品依舊寄予厚望。3月31日,云從科技披露了定增募資計(jì)劃,擬募資36.35億元用于“行業(yè)精靈”大模型研發(fā)項(xiàng)目。
不是所有模型都叫大模型
大模型賽道里數(shù)量更多的是公司、機(jī)構(gòu)的身影。這里面既有百度、騰訊、阿里這樣的大型互聯(lián)網(wǎng)公司,也有科大訊飛、商湯科技這樣的AI公司,還有中科院自動(dòng)化研究所、上海人工智能實(shí)驗(yàn)室這樣的科研機(jī)構(gòu)。
不少AI創(chuàng)業(yè)公司,也趁這波浪潮單方面宣布進(jìn)軍大模型賽道。
什么樣的模型才能稱之為“大”?如此多的大模型,含金量究竟如何?
國(guó)家人工智能標(biāo)準(zhǔn)化總體組副組長(zhǎng)、北京航空航天大學(xué)人工智能研究院教授吳文峻對(duì)中新經(jīng)緯表示,一般認(rèn)為參數(shù)規(guī)模在百億以上的是大模型。“有研究表明,百億規(guī)模以上的大模型,就可能會(huì)出現(xiàn)所謂的‘涌現(xiàn)’現(xiàn)象,具備一定的自主學(xué)習(xí)、自我優(yōu)化和自我進(jìn)化能力,相較于百億以下規(guī)模的模型在邏輯推理、做數(shù)學(xué)題等方面有明顯提升?!眳俏木f。
中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院首席經(jīng)濟(jì)學(xué)家、南開大學(xué)經(jīng)濟(jì)研究所所長(zhǎng)劉剛接受中新經(jīng)緯采訪時(shí)表示,大模型的判定標(biāo)準(zhǔn)主要在于它是否能在不同的專業(yè)領(lǐng)域使用,以及參數(shù)規(guī)模的大小?!拔艺J(rèn)為億級(jí)參數(shù)規(guī)模是大模型的入門門檻,現(xiàn)在國(guó)際上一些大模型參數(shù)規(guī)??蛇_(dá)到百億甚至千億?!?/p>
大模型發(fā)展的背后除了百億級(jí)的參數(shù)規(guī)模、海量數(shù)據(jù)外,還需要龐大的智能算力支撐。而智能算力的水平又與算力芯片、算力規(guī)模息息相關(guān)。這些都決定了大模型的研發(fā)不是容易的事,并非通過召開一場(chǎng)發(fā)布會(huì)或展示幾頁(yè)P(yáng)PT就能實(shí)現(xiàn)。
盡管目前大模型的應(yīng)用有很大局限,具備對(duì)文本、圖片理解生成能力的都是少數(shù),但有些公司已將一些此前推出的產(chǎn)品歸為大模型應(yīng)用。
3月,小米集團(tuán)總裁盧偉冰在財(cái)報(bào)電話會(huì)議上就表示,“小愛同學(xué)就是一個(gè)典型的大模型的應(yīng)用產(chǎn)品”。公開資料顯示,小愛同學(xué)發(fā)布于2017年。
在市場(chǎng)研究機(jī)構(gòu)IDC中國(guó)研究總監(jiān)盧言霞看來,之前大部分AI應(yīng)用都不是基于大模型的?!按竽P褪菍?duì)原有算法模型的技術(shù)升級(jí),基于海量數(shù)據(jù)開發(fā)預(yù)訓(xùn)練模型,到最終用戶環(huán)境中使用少量數(shù)據(jù)即可獲得比之前的算法模型更好的結(jié)果,相比上一代的算法模型有更高的預(yù)測(cè)準(zhǔn)確度?!北R言霞說,“主要有三個(gè)要點(diǎn),一是預(yù)訓(xùn)練模型學(xué)習(xí)了多少數(shù)據(jù),遷移學(xué)習(xí)的效果如何以及部署的整體成本如何?!?/p>
不過,劉剛認(rèn)為,只要是應(yīng)用產(chǎn)品基于人工智能,且參數(shù)規(guī)模、訓(xùn)練量在不斷增大,不斷迭代演化,盡管參數(shù)規(guī)模沒有達(dá)到千億級(jí)別,也依然可以叫做大模型應(yīng)用產(chǎn)品。
落地的不確定性
在人們預(yù)想中,大模型落地應(yīng)用以后除了在C端變成人們的智慧助手,還將在B端給千行百業(yè)帶來研發(fā)能力與生產(chǎn)效率的指數(shù)提升。
但現(xiàn)實(shí)是,目前,具備對(duì)文本、圖像、音頻和視頻綜合理解生成能力,且具備學(xué)習(xí)和使用“工具”能力的多模態(tài)大模型仍在路上,這意味著如何將這些能力落地到具體的應(yīng)用場(chǎng)景更加遙遠(yuǎn)。而這個(gè)過程,充滿了諸多不確定性。
劉剛表示,大模型落地的不確定性首先在市場(chǎng),其次是技術(shù)。“市場(chǎng)的選擇對(duì)大模型至關(guān)重要,要看最后誰(shuí)的模型大家用起來更容易、成本更低,讓市場(chǎng)接受并使用。落地的關(guān)鍵在于能否適應(yīng)市場(chǎng),有時(shí)候技術(shù)先進(jìn)未必適應(yīng)市場(chǎng)?!?/p>
吳文峻也提到了使用推廣方面的問題,他認(rèn)為,廣泛部署大模型要占據(jù)一定的計(jì)算資源,很多人同時(shí)使用也會(huì)帶來資源消耗,大模型的訓(xùn)練和運(yùn)維也需要很多云資源。在云上部署后,怎樣在提供大規(guī)模服務(wù)的情況下保持良好的性價(jià)比,是推動(dòng)大模型落地的過程中需要解決的問題。
吳文峻還提到,大模型相關(guān)技術(shù)本身還存在一些缺陷,比如事實(shí)錯(cuò)誤、邏輯推理的前后矛盾,這些問題通常被稱為“幻覺”。要把大模型運(yùn)用在一些對(duì)輸出內(nèi)容的客觀性、準(zhǔn)確性要求比較高的場(chǎng)景還存在一定技術(shù)障礙?!霸诒WC服務(wù)內(nèi)容正確性、客觀性的前提下怎樣節(jié)能增效、降低運(yùn)行成本是大模型在應(yīng)用推廣的時(shí)候需要重點(diǎn)關(guān)注的?!?/p>
吳文峻認(rèn)為,對(duì)于這些問題,要通過一定的技術(shù)手段加上算力的支撐才能解決,還可以通過人的反饋來強(qiáng)化學(xué)習(xí),發(fā)現(xiàn)錯(cuò)誤后進(jìn)行修正。“有些還需要增強(qiáng)專業(yè)領(lǐng)域的知識(shí),對(duì)模型可能存在的問題進(jìn)行檢查,然后定制成為可以在專業(yè)領(lǐng)域內(nèi)用的模型?!?/p>
盧言霞表示,大模型落地的不確定性在于,是否真的能產(chǎn)出比之前的AI更好的效果,需要多久才能落地,“當(dāng)然也在于到底能不能成功落地”。
針對(duì)大模型應(yīng)用場(chǎng)景,吳文峻表示,B端和C端對(duì)大模型的需求不同,B端的技術(shù)要求會(huì)更高?!癈端的應(yīng)用目前主要在聊天對(duì)話、客服、文本生成、圖片生成等。不過我認(rèn)為大模型未來盈利的方向在B端,因?yàn)锽端是面向企業(yè)進(jìn)行定制服務(wù)的,部署的空間會(huì)更大,當(dāng)然技術(shù)要求也會(huì)更高?!?/p>
警惕最終“一地雞毛”
面對(duì)科技公司對(duì)大模型的追逐戰(zhàn)愈演愈烈,業(yè)內(nèi)也有質(zhì)疑聲音:我們需要這么多大模型嗎?瘋狂上線大模型,是否會(huì)導(dǎo)致最終“一地雞毛”?
盧言霞表示,“從大模型的開發(fā)到落地,需要的算力、數(shù)據(jù)、人才,都是持續(xù)且較大規(guī)模的投資,另外當(dāng)前技術(shù)也不成熟,確實(shí)有可能產(chǎn)生泡沫?!?/p>
吳文峻認(rèn)為,在目前宣布進(jìn)軍大模型的約40家企業(yè)、機(jī)構(gòu)中,有一些企業(yè)本身在自然語(yǔ)言處理方面就有比較雄厚的積累,也有人工智能的技術(shù)儲(chǔ)備,他們做大模型沒有問題。
“但也有企業(yè)是為了蹭熱點(diǎn),爭(zhēng)取投資才來做大模型。國(guó)外有一部分模型已經(jīng)開源,如果這些企業(yè)是基于開源的模型,自己再重新訓(xùn)練,這樣做出來的模型可能在技術(shù)能力、指標(biāo)上達(dá)不到真正有用的大模型的要求?!眳俏木嵝?,“在目前宣布了做大模型的企業(yè)中,最后能做成的或許不超過一半。”
劉剛對(duì)此持較為中立的態(tài)度,他表示,大模型在各行各業(yè)都有很大應(yīng)用前景,而且不同的行業(yè)也會(huì)產(chǎn)生不同的大模型,大模型也有語(yǔ)義、語(yǔ)音、文字等各種類型。劉剛說,“大模型即使是同質(zhì)化,我認(rèn)為也并非很嚴(yán)重的問題,就是要允許多個(gè)模型之間的競(jìng)爭(zhēng),最后有一個(gè)勝出了,就是找到了最優(yōu)的道路,也是完成了一個(gè)創(chuàng)新的進(jìn)化篩選過程?!?/p>