大模型掀起的技術(shù)狂熱,終究要落于理性繁榮。
中國(guó)科技圈很久沒(méi)有出現(xiàn)如此大規(guī)模的技術(shù)熱潮了,這在4月11日的阿里云峰會(huì)體現(xiàn)得淋漓盡致,加之阿里巴巴CEO張勇的阿里云首秀,現(xiàn)場(chǎng)人頭攢動(dòng),能容納上千人的報(bào)告廳一度封閉,行業(yè)內(nèi)外都想找到一些答案。
阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇在云峰會(huì)上表示,阿里巴巴所有產(chǎn)品未來(lái)將接入“通義千問(wèn)”大模型,進(jìn)行全面改造。他認(rèn)為,面向AI時(shí)代,所有產(chǎn)品都值得用大模型重新升級(jí)。
未來(lái)每一個(gè)企業(yè)在阿里云上既可以調(diào)用通義千問(wèn)的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識(shí)和應(yīng)用場(chǎng)景,訓(xùn)練自己的企業(yè)大模型。比如,每個(gè)企業(yè)都可以有自己的智能客服、智能導(dǎo)購(gòu)、智能語(yǔ)音助手、文案助手、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。
阿里巴巴不是國(guó)內(nèi)最先發(fā)布大模型的廠商,但關(guān)于怎么做好大模型,阿里云作為國(guó)內(nèi)份額第一,且最早提出MaaS(Model as a Service)理念的云廠商,有一定的發(fā)言權(quán)。
阿里巴巴并沒(méi)有太多著墨在大模型本身,而是將“云+AI”和盤(pán)托出。
張勇的阿里云首秀
這是張勇入主阿里云以來(lái)首次公開(kāi)亮相,同樣也是阿里巴巴分拆為六大業(yè)務(wù)集團(tuán),阿里云智能集團(tuán)的首次亮相。鈦媒體App了解到,阿里云大的組織變動(dòng)基本清晰,涉及到各個(gè)產(chǎn)品團(tuán)隊(duì)之間的分拆、重組,尚在進(jìn)行之中。
“不僅是判斷,并且堅(jiān)持,才讓我們走到了今天”。在本次峰會(huì)上,張勇回顧了阿里云14年來(lái)的發(fā)展,始終把云計(jì)算視作未來(lái)的核心戰(zhàn)略,阿里云抓住了移動(dòng)互聯(lián)網(wǎng)和產(chǎn)業(yè)互聯(lián)網(wǎng)的兩次機(jī)遇,阿里的超前預(yù)判和堅(jiān)持投入,造就了今天的阿里云。
現(xiàn)在,到了張勇為阿里云做未來(lái)判斷的時(shí)候,他篤定人工智能是云計(jì)算的未來(lái)。
“面向未來(lái),因?yàn)槿斯ぶ悄芗夹g(shù)全面的爆發(fā)和新一代技術(shù)的出現(xiàn),可能對(duì)各行各業(yè)產(chǎn)生顛覆性的影響,讓我們看到了數(shù)字化時(shí)代后,一個(gè)全新的智能化時(shí)代的到來(lái)?!彼f(shuō)。
張勇表示,數(shù)字化的時(shí)代還有先后之分,首先出現(xiàn)了一批新型的互聯(lián)網(wǎng)公司,之后各行各業(yè)看到數(shù)字技術(shù)的力量,大家都爭(zhēng)先恐后開(kāi)始進(jìn)行數(shù)字化的變革。
但在今天,在初步具備數(shù)字化普及程度和改造進(jìn)程基礎(chǔ)上,所有企業(yè)從阿里巴巴開(kāi)始到所有的互聯(lián)網(wǎng)公司,從最早的第一代互聯(lián)網(wǎng)公司到最新的互聯(lián)網(wǎng)公司,和所有經(jīng)過(guò)改造以后各行各業(yè)的產(chǎn)業(yè)公司,面對(duì)智能化時(shí)代,大家站在同一個(gè)起跑線上。
“所有行業(yè)、所有應(yīng)用、所有軟件、所有服務(wù),都值得基于新型人工智能技術(shù)、基于AIGC各方面技術(shù)支撐、大模型支撐重做一遍,這一定能帶來(lái)不僅是一種創(chuàng)新性的客戶體驗(yàn)、客戶服務(wù)滿足,同時(shí)也會(huì)讓我們的生產(chǎn)范式、工作范式、生活范式發(fā)生很多變化。”張勇說(shuō)道。
阿里巴巴決定未來(lái)將所有產(chǎn)品接入通義千問(wèn),進(jìn)行全面改造。釘釘、天貓精靈等產(chǎn)品在接入通義千問(wèn)測(cè)試后,變得更加智能化,像天貓精靈,能回答各種刁鉆問(wèn)題,釘釘接入通義千問(wèn)測(cè)試之后,可以自動(dòng)生成工作方案,也可以在會(huì)議紀(jì)要后自動(dòng)生成總結(jié)和待辦事項(xiàng),還能拍一張功能草圖自動(dòng)生成小程序。
大模型是“云+AI”的全方位競(jìng)爭(zhēng)
張勇指出,大模型是一場(chǎng)“AI+云計(jì)算”的全方位競(jìng)爭(zhēng),超萬(wàn)億參數(shù)的大模型研發(fā),并不僅僅是算法問(wèn)題,而是囊括了底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程,需要有超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。
阿里云是阿里大模型的出口,未來(lái)阿里云要做好兩件事情:讓算力更普惠,推動(dòng)自研技術(shù)和規(guī)?;?jīng)營(yíng)的正循環(huán),持續(xù)釋放技術(shù)紅利;讓AI更普及,讓每家企業(yè)的產(chǎn)品都能接入大模型升級(jí)改造,并有能力打造自己的專屬大模型。
具體來(lái)看,從算力普惠方面,阿里云推出新款通用算力型ECS云服務(wù)器Universal實(shí)例(簡(jiǎn)稱U實(shí)例),售價(jià)相比上一代主售實(shí)例降幅最高可達(dá)40%,新發(fā)布的對(duì)象存儲(chǔ)預(yù)留空間產(chǎn)品OSS-RC,費(fèi)用可降低36%-70%。阿里云還推出“飛天免費(fèi)試用計(jì)劃”,開(kāi)放50款云產(chǎn)品的免費(fèi)試用。
從普及AI方面,阿里云從IaaS(Infrastructure as a Service)基礎(chǔ)設(shè)施的服務(wù),到基于大數(shù)據(jù)、機(jī)器學(xué)習(xí)平臺(tái)的建設(shè),大數(shù)據(jù)的平臺(tái)服務(wù)PaaS(Platform as a Services),到(Model as a Service)MaaS模型即服務(wù),形成了較為完善的大模型三重布局,以通用、標(biāo)準(zhǔn)化的服務(wù)輸出給企業(yè)客戶。
在IaaS方面,阿里云CTO周靖人表示,大模型訓(xùn)練離不開(kāi)算力,今天模型的訓(xùn)練往往會(huì)以有多少?gòu)埧▉?lái)表示背后的算力,其實(shí)這是一個(gè)非常簡(jiǎn)單的描述,所有GPU不是簡(jiǎn)簡(jiǎn)單單的堆砌,更需要的是讓所有GPU,讓異構(gòu)算力能夠聯(lián)合起來(lái)為模型訓(xùn)練服務(wù)。
阿里云為AI訓(xùn)練場(chǎng)景打造了靈駿集群,規(guī)模上能夠支持10萬(wàn)張卡GPU規(guī)模,通過(guò)800G全速無(wú)擁塞RDMA網(wǎng)絡(luò)連接,存儲(chǔ)方案能夠做到每秒鐘20TB帶寬,還有多級(jí)緩存。
阿里云的機(jī)器學(xué)習(xí)平臺(tái)PAI可以訓(xùn)練10萬(wàn)億參數(shù)規(guī)模的大模型,同時(shí)也能讓幾千張甚至上萬(wàn)張卡聯(lián)合一起訓(xùn)練超大規(guī)模的模型。
“因?yàn)槲覀円幌盗屑夹g(shù)的創(chuàng)新、突破,能夠支持萬(wàn)卡的單任務(wù)分布式訓(xùn)練規(guī)模,分布式加速比接近線性,能夠有92%線性擴(kuò)展效率,在一些訓(xùn)練場(chǎng)景上能夠帶來(lái)10x訓(xùn)練效率提升。”周靖人表示。
隨著模型越來(lái)越復(fù)雜龐大,模型推理、模型服務(wù)的成本也是大家關(guān)心的焦點(diǎn),為了做到有效模型的推理、服務(wù),阿里云在模型的壓縮方面做了大量工作,包括剪枝、蒸餾等一系列壓縮手段,在不影響模型的情況下,把模型服務(wù)成本降低。一方面可以降低模型服務(wù)的延遲,一方面讓模型服務(wù)的成本降低至八分之一。
“云智能”的兌現(xiàn)
人工智能對(duì)云計(jì)算的影響是巨大的,從業(yè)者可能有印象,2018年,阿里云升級(jí)為阿里云智能,一位時(shí)任阿里云高管對(duì)鈦媒體App表示,當(dāng)時(shí)大家都在思考,如何去驅(qū)動(dòng)更大的云消費(fèi)?
“靜態(tài)的是存儲(chǔ)、計(jì)算和網(wǎng)絡(luò),動(dòng)態(tài)是數(shù)據(jù)庫(kù)、大數(shù)據(jù)。還有就是AI、IoT,其中非常重要的是AI,會(huì)消耗大量的算力”。
云廠商的預(yù)期設(shè)想很好,但是不同于計(jì)算密集型負(fù)載,一個(gè)計(jì)算任務(wù)同時(shí)占用大量計(jì)算節(jié)點(diǎn),很容易帶動(dòng)大量的云資源消耗,彼時(shí)大模型才初露端倪,人工智能和云的結(jié)合并不好,AI本身規(guī)?;瘍r(jià)值的分散,使得“云智能”名不符實(shí)。
大模型改變了這一切,行業(yè)驚喜地發(fā)現(xiàn),大模型幾乎可以融入到一切產(chǎn)品和服務(wù)中,由大模型訓(xùn)練帶來(lái)的算力消耗也許只是“前菜”,當(dāng)大模型、行業(yè)模型足夠普遍,每天無(wú)數(shù)次的推理才是云廠商期待的“主菜”。
就像過(guò)去的“互聯(lián)網(wǎng)+”,現(xiàn)在都是“大模型+”,有多少大模型,背后就有多少云計(jì)算。
周靖人表示,去年阿里云在業(yè)內(nèi)首次提出了“Model-as-a-service (MaaS,模型即服務(wù)),就是以云為基礎(chǔ),以模型為中心的概念,也看到有一些云計(jì)算友商不斷地采用這個(gè)新概念,去設(shè)計(jì)它自身云的產(chǎn)品體系。
“所謂智能云的基礎(chǔ),就來(lái)自于智能的基礎(chǔ)設(shè)施,要能夠把大數(shù)據(jù),把機(jī)器學(xué)習(xí)這方面的能力能夠發(fā)揮到極致,智能云,其實(shí)是云的正常生命延展”。周靖人補(bǔ)充表示。
云廠商希望更多企業(yè)體驗(yàn)大模型,更希望讓每家企業(yè)都能基于通用大模型,擁有具備自己行業(yè)能力的專屬大模型,如此不僅能夠帶動(dòng)大量的云資源消耗,也能產(chǎn)生長(zhǎng)久的客戶粘性,純資源型留不住客戶,一旦涉及到數(shù)據(jù),客戶往往就會(huì)謹(jǐn)慎遷移。
“如何對(duì)專屬模型進(jìn)行進(jìn)一步成本的降低,有效的把解決行業(yè)問(wèn)題所需要的那部分智能保留,這中間有非常多的技術(shù)的創(chuàng)新和技術(shù)的突破,這正是阿里云在這方面比較有優(yōu)勢(shì)的地方”,周靖人說(shuō)。
阿里云不只發(fā)布了大模型,也是在展露出大模型背后的基礎(chǔ)設(shè)施,技術(shù)狂熱可以暫時(shí)忽略成本與收益,但大模型要真正實(shí)現(xiàn)理性繁榮,離不開(kāi)工程化的實(shí)踐,和現(xiàn)實(shí)的商業(yè)變現(xiàn)。
(本文首發(fā)鈦媒體APP 作者|張帥 歡迎添加作者微信mr3right交流)