AI大模型：聲勢喧天，悄悄落地

2023-05-08 18:41:45來源： 果殼網(wǎng)

今天，隨便拉個(gè)人出來都會說兩句AI。我們關(guān)心它的能力，看它的樂子，也擔(dān)心它的提升。沒有人會拒絕從天而降的熱度，早期投資人早已聞風(fēng)而動，二級市場不愿錯(cuò)過這一輪上升的機(jī)會。不論估值還是市值，反映的都是我們對技術(shù)的樂觀預(yù)期。

(相關(guān)資料圖)

在AI的世界里，人類已經(jīng)樂觀了好幾次。

2016年，AlphaGo打敗李世乭，AI概念便開始走紅；2018年，波士頓動力展示了跑酷王Atlas 2的演示視頻，雖然它和AI并無關(guān)系，但也再次讓相關(guān)概念股不斷異動。每當(dāng)AI有最新進(jìn)展，隨之而來的都是大量概念炒作，但AI行業(yè)不僅有很高門檻，還有很高的天花板。

最近一段時(shí)期，ChatGPT概念股，又一次復(fù)現(xiàn)了上述情境，一些企業(yè)有意捧之炒之，2023年2月1日~4月7日，相關(guān)概念累計(jì)上漲達(dá)62.38%，而在此后ChatGPT概念股遭最狠下跌。[1]

我們常用Gartner曲線去描述一項(xiàng)技術(shù)的成熟度，但須知Gartner曲線原名“Hype Cycle”——是伴隨技術(shù)發(fā)展的炒作的周期。

這是再樸素不過的道理：炒作結(jié)束，應(yīng)用才真正起飛。

餅好畫，事難成

事實(shí)上，OpenAI成功并非追隨概念熱點(diǎn)，其核心領(lǐng)導(dǎo)團(tuán)隊(duì)是一群富有使命感的技術(shù)偏執(zhí)狂，堅(jiān)定擁抱通用人工智能（AGI），并持續(xù)推動大模型相關(guān)技術(shù)。[2]

許多人都沒有想到，大模型竟然可以取得如此成效，國內(nèi)企業(yè)也順勢紛紛趕工，但做大模型，談何容易。

中國信通院《人工智能白皮書（2022年）》指出，人工智能正朝更大規(guī)模、更多模態(tài)的方向發(fā)展[3]。未來的大模型，不僅需要算力驚人，更會通曉文字、圖像或視頻。

首先，高質(zhì)量語料正逐漸消耗殆盡，更多信息需要從視覺上獲取，也就是向多模態(tài)發(fā)展。人類一生可以聽到約10億個(gè)單詞，GPT-3就已學(xué)習(xí)約5000億語言數(shù)據(jù)，已知最大語言模型數(shù)據(jù)消耗量在2萬億個(gè)Token（指文本中最小單位）以上，而人類文明產(chǎn)生高質(zhì)量語料共9萬億左右，語料被用完是遲早之事。事實(shí)上，人類是視覺動物，80%信息通過眼睛獲取，且神經(jīng)元處理視覺和語言連接數(shù)比例為10：1，因此讓AI也學(xué)會識圖，就能更快了解世界。

其次，大模型時(shí)代單純使用參數(shù)量的標(biāo)定方式已過時(shí)，現(xiàn)在應(yīng)該綜合考慮算法、數(shù)據(jù)和算力三要素。過去10年，最好的AI算法對于算力需求增長超過了100萬倍，也就是每兩年提高一個(gè)數(shù)量級。隨著多模態(tài)的引入，數(shù)據(jù)量將繼續(xù)指數(shù)級增長，當(dāng)計(jì)算量有限情況下，需要分配更多計(jì)算資源給數(shù)據(jù)，而不是完全給參數(shù)，用公式來說，就是“大模型參數(shù)量×處理的數(shù)據(jù)量=計(jì)算量”，計(jì)算量越大，通用能力越強(qiáng)。

神經(jīng)網(wǎng)絡(luò)參數(shù)量算力需求增長已超過100萬倍

國內(nèi)外成型的類ChatGPT產(chǎn)品，其本質(zhì)均由前期大模型而來，而產(chǎn)品本身能力則主要取決于前期大模型發(fā)展情況[4]。自從AI大模型于2017年被提出，國外就已經(jīng)開始進(jìn)行相關(guān)超大規(guī)模訓(xùn)練，并于2021年正式進(jìn)入軍備競賽階段。[5]

國內(nèi)在早期擁有大模型能力的公司是少數(shù)。且國內(nèi)大模型仍缺乏數(shù)據(jù)量，也做不到高層級的架構(gòu)[6]。更困難的是，大模型是算力巨獸，依賴高端GPU芯片，一個(gè)大模型需數(shù)萬塊GPU，以此推算，是至少幾十億元人民幣的投入。[7]

雖然困難重重，但也有滿足做大模型一切條件的公司，這種公司需要既有算法，又有算力。

讓大模型有用

從“大煉模型”到“煉大模型”，AI產(chǎn)業(yè)前期投入大而后期應(yīng)用難一直被行業(yè)所詬病。而如今，將語言、視覺等信息和能力融為一體的多模態(tài)大模型正悄然引發(fā)AI設(shè)計(jì)范式的轉(zhuǎn)變，即從專用人工智能走向通用人工智能（AGI）。

目前普通用戶和產(chǎn)業(yè)界也在追求多模態(tài)AI工具的聯(lián)合應(yīng)用。一個(gè)模型被用于指揮另外一組模型、被用于生成Prompt。應(yīng)用層面的創(chuàng)新層出不窮，是新一代大模型+場景的結(jié)合。

但“AI+場景”真的很貴，研發(fā)周期也極長，每個(gè)場景均有其專屬模型，如果遇到新任務(wù)，就要重新設(shè)計(jì)AI系統(tǒng)，采集樣本，對模型重新訓(xùn)練。而AGI就像一個(gè)可以適配各行各業(yè)的萬能鑰匙，當(dāng)大模型廠商把推理能力部署到千行百業(yè)，就能讓更多應(yīng)用享受到AI帶來福利。[8]

3月中旬以來，大模型混戰(zhàn)開打，百度、阿里巴巴、華為、360等公司分別展示了其在大模型領(lǐng)域的進(jìn)展。而國內(nèi)也一致指向新概念——模型即服務(wù)（Model-as-a-Service，MaaS），描繪一副全新的商業(yè)前景。

為了擴(kuò)大市場應(yīng)用，大模型應(yīng)瞄準(zhǔn)ToB業(yè)務(wù)。我們也看到，國產(chǎn)大模型也正一點(diǎn)點(diǎn)地撬動B端更多應(yīng)用。

作為從2018年就開始研發(fā)大模型的AI公司商湯科技，就在近日展示了其日日新SenseNova大模型體系，面向行業(yè)提供涵蓋自動化數(shù)據(jù)標(biāo)注、自定義大模型訓(xùn)練、模型增量訓(xùn)練、模型推理部署、開發(fā)效率提升等多種大模型即服務(wù)（MaaS）。

3月以來，越來越多的人機(jī)對話應(yīng)用浮出水面，各家公司都對其擁有自己的思考。日日新大模型體系下的千億級參數(shù)語言大模型“商量SenseChat”作為聊天助手，可以解決復(fù)雜問題、提供定制化建議、輔助創(chuàng)作成本，同時(shí)還能在醫(yī)療領(lǐng)域提供導(dǎo)診、健康咨詢、輔助決策等對話能力，在編程領(lǐng)域提供代碼補(bǔ)全、注釋生成代碼、測試代碼生成、代碼翻譯、代碼修正、代碼重構(gòu)、復(fù)雜度分析等功能。

商湯基于日日新SenseNova大模型體系，自研包括如影SenseAvatar、瓊宇SenseSpace、格物SenseThings以及文生圖大模型秒畫SenseMirage（同時(shí)也支持大量第三方豐富開源模型導(dǎo)入）等一系列生成式AI模型及應(yīng)用，既可以生成高清圖片和視頻，也能生成各種3D內(nèi)容。

多年發(fā)展中，自動駕駛很難向更高級別跨越，而它也很難像人一樣，可以靈活應(yīng)對各種路況，多模態(tài)大模型或許能夠解決這種困境。利用大模型生成大量困難樣本，再用環(huán)視感知數(shù)據(jù)和多模態(tài)數(shù)據(jù)作為輸入，實(shí)現(xiàn)感知和決策一體化，通過環(huán)境解碼器重建3D場景，實(shí)現(xiàn)路徑規(guī)劃，并用自然語言解釋自動駕駛動機(jī)，就能使自動駕駛系統(tǒng)更安全可靠，且具有可解釋性。商湯則開發(fā)了自動駕駛的BEV（Bird Eye View）感知算法，實(shí)現(xiàn)量產(chǎn)，并在今年開發(fā)能夠?qū)崿F(xiàn)端到端自動駕駛的UniAD，比SOTA更準(zhǔn)確，誤差更低。

商湯的自動駕駛大模型概況

傳統(tǒng)AI技術(shù)下，人工標(biāo)注所需時(shí)間長、成本高，需投入大量資源。而利用大模型可以實(shí)現(xiàn)自動標(biāo)注，大大降低了成本。商湯明眸自動化數(shù)據(jù)標(biāo)注平臺則提供自動數(shù)據(jù)標(biāo)注服務(wù)，它擁有12個(gè)行業(yè)級大模型，涵蓋超過1000個(gè)目標(biāo)類別，且能標(biāo)注2D和3D。當(dāng)用戶上傳圖片數(shù)據(jù)，就可以對目標(biāo)進(jìn)行檢測和屬性識別，并自動顯示標(biāo)注。

商湯明眸SenseAnnotation概況

生物醫(yī)藥領(lǐng)域，人類基因組攜帶了超2萬個(gè)蛋白質(zhì)的指令，但人體20種不同氨基酸通過排列組合，再經(jīng)過螺旋和折疊，形成不同的復(fù)雜結(jié)構(gòu)，只有約1/3蛋白質(zhì)的三維結(jié)構(gòu)通過實(shí)驗(yàn)方法得到了解析[9]。因此解析蛋白質(zhì)結(jié)構(gòu)是一項(xiàng)非常重要的基礎(chǔ)工作。

蛋白質(zhì)功能通常由其結(jié)構(gòu)所決定，要預(yù)測其結(jié)構(gòu)，算力資源是基礎(chǔ)。DeepMind的Alpha Fold之所以名震人工智能界與科研界，就在于其學(xué)習(xí)了X射線晶體學(xué)和冷凍電鏡的實(shí)驗(yàn)數(shù)據(jù)，使其預(yù)測蛋白質(zhì)結(jié)構(gòu)能力超群，大大提升科研效率。商湯AI大裝置為蛋白質(zhì)結(jié)構(gòu)大模型提供AI推理算力，并為蛋白質(zhì)相互作用模型，提供研發(fā)平臺及訓(xùn)練算力，在與百英科技合作中，蛋白質(zhì)結(jié)構(gòu)預(yù)測大模型推理時(shí)間可由數(shù)小時(shí)減少到數(shù)分鐘，使得蛋白質(zhì)結(jié)構(gòu)預(yù)測性能達(dá)到工業(yè)應(yīng)用的標(biāo)準(zhǔn)，抗體篩選效率提升60%。

不同于其它廠商大模型技術(shù)路徑，商湯是以視覺大模型為核心技術(shù)突破點(diǎn)衍生而來的多模態(tài)大模型發(fā)展路徑：2019年商湯即研發(fā)了10億參數(shù)視覺大模型，至2022年已推出320億參數(shù)視覺大模型。與此同時(shí)，商湯也提前布局自研NLP模型和多模態(tài)模型，并在2021年就應(yīng)用在商湯數(shù)字人等產(chǎn)品中，在今年 3月，商湯還開源了30億參數(shù)的多模態(tài)大模型書生2.5。

基于AI領(lǐng)域的長期應(yīng)用落地，商湯積累了大量的、有人反饋的、視覺類信息,形成優(yōu)質(zhì)多模態(tài)語料，也使得桎梏大模型發(fā)展的數(shù)據(jù)難題迎刃而解。

此外，商湯AI大裝置SenseCore也奠定了商湯的發(fā)展基底。它目前的算力規(guī)模包含2.7萬塊GPU，可輸出5000PetaFlop的算力，支持20個(gè)千億參數(shù)超大模型同時(shí)訓(xùn)練，支持最大4000卡并行單任務(wù)訓(xùn)練，可持續(xù)7天以上不間斷穩(wěn)定訓(xùn)練。

對于正探索多模態(tài)大模型的公司，到底如何讓大模型更有價(jià)值？商湯構(gòu)建能力的思考，也許有些參考意義：一是優(yōu)化好模型本身，提高多模態(tài)數(shù)據(jù)處理能力，讓文字、圖片、視頻無縫銜接；二是提供更多高質(zhì)量數(shù)據(jù)，給模型更多“好口糧”；三是與生態(tài)伙伴探索商業(yè)應(yīng)用，讓大模型釋放更多生產(chǎn)力，如智能助手、自動駕駛、醫(yī)療診斷；四是讓大模型時(shí)刻安全可靠。

寫在最后

美國斯坦福大學(xué)人類中心人工智能研究所（HAI）發(fā)布的《人工智能指數(shù)報(bào)告 2023》（AI Index Report 2023）顯示，大語言模型論文發(fā)表量方面，美國要遠(yuǎn)超其它國家。[10]

圖源：美國斯坦福大學(xué)[10]，漢化丨公眾號“科研圈”[11]

在投入上，美國也遠(yuǎn)超中國：2022年，美國在AI領(lǐng)域的私人投資為470億美元，約是排名第二的中國（130億美元）的3.5倍。

圖源：美國斯坦福大學(xué)[10]，漢化丨公眾號“科研圈”[11]

大模型作為前期投入極大的技術(shù)，需要的并不是概念，而是在提高投入的前提下，找到更多看得見摸得著的商業(yè)化應(yīng)用。當(dāng)大模型被每個(gè)人觸及之時(shí)，行業(yè)便會被更多人所重視。

References：

[1] 深圳商報(bào)：ChatGPT概念暴跌，機(jī)構(gòu)、游資卻在抄底！最強(qiáng)主線真的熄火了嗎？.2023.4.10.https://mp.weixin.qq.com/s/TkXbhHu5jODPXWPQzEj5ig

[2] 新智元：張宏江：大模型發(fā)展機(jī)會與挑戰(zhàn).2023.3.18.https://mp.weixin.qq.com/s/pjUaRD0YV2qb6MXZ-oVstQ

[3] 中國信通院：http://www.caict.ac.cn/kxyj/qwfb/bps/202204/P020220412613255124271.pdf

[4] 智能相對論：ChatGPT冷觀察：沒有大模型的土壤，開不出ChatBot的花.2023.2.16.https://mp.weixin.qq.com/s/f7HTfM0wlh5D1GFJcJVstw

[5] 祝梅.國產(chǎn)AI大模型，尋找未來競爭力[N].浙江日報(bào),2023-04-12(003)

[6] 新眸：阿里大模型也來了！聊聊我的幾點(diǎn)看法.2023.4.9.https://mp.weixin.qq.com/s/RZ73F7Z231H5GPg6s0p3LA

[7] 許林艷.國產(chǎn)AI大模型“百舸爭流” 夯實(shí)算力底座正在進(jìn)行時(shí)[N].證券日報(bào),2023-04-12(A03)）

[8] 張依依.大模型正在塑造人工智能產(chǎn)業(yè)新格局[N].中國電子報(bào),2023-04-11(007)）

[9] Callaway E. DeepMind’s AI predicts structures for a vast trove of proteins[J]. Nature, 2021, 595(7869): 635-635..https://doi.org/10.1038/d41586-021-02025-4

[10] THE AI INDEX REPORT：Measuring trends in Artificial Intelligence.https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index-Report_2023.pdf

[11] 科研圈：https://mp.weixin.qq.com/s/yfOQkyWoManWRUlnSAWEeA

關(guān)鍵詞：

相關(guān)新聞