深燃(shenrancaijing)原創(chuàng)
(資料圖)
作者 | 李秋涵
編輯 | 魏佳
你還在用ChatGPT嗎?
在全球掀起AI熱潮的ChatGPT,似乎進入了瓶頸期。
首先是關于ChatGPT的使用率,有不利的數據出現。6月初,摩根士丹利發(fā)布的一項調查顯示,只有19%的受訪者表示他們之前使用過ChatGPT,只有4%的人表示依賴ChatGPT。調查表示,比例低的驚人。
這項調查在今年4月進行,涉及人數為2000人。不過,在全球78億人口面前,這樣的樣本量不算大,也一定程度上降低了其參考性。
還有一個基數更廣泛的數據值得關注,ChatGPT的增長已經明顯放緩。
根據網站數據分析工具SimilarWeb數據,前期ChatGPT的訪問量增長率驚人,1月份的環(huán)比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環(huán)比增長率為12.6%,到了5月,這個數字已經變?yōu)榱?.8%。
隨著ChatGPT普及,參考基數變大,增長率放緩是正常現象,不過,根據目前已有的趨勢來看,6月的環(huán)比增長率也有可能為負數。
今年年初,ChatGPT像一聲驚雷,讓全球見識到了生成式AI的威力,也讓背后的GPT(生成式預訓練Transfomer模型)大火,掀起大模型創(chuàng)業(yè)潮。它刷新了很多數字,最讓人印象深刻的,是史上用戶增長速度最快的消費級應用,在推出僅兩個月后,ChatGPT的月活用戶已經突破了1億。
但對它未來的發(fā)展,即便是創(chuàng)造者也很難給出明確答案。此前OpenAI董事會成員海倫·托勒就曾表示,“甚至創(chuàng)造它們的人也不知道它們能做什么,不能做什么。我預計,我們真正了解GPT-4能做和不能做的所有事情,可能還需要幾年時間?!?/p>
ChatGPT現在的天花板,不代表就是GPT的天花板,但作為目前最厲害的大語言模型支撐的產品,ChatGPT的走向,也能成為觀察GPT應用的一個窗口。關于AI的狂想還在繼續(xù),時間已經過去了近半年,我們好奇的是,ChatGPT的使用情況到底如何?它被高估了嗎?
ChatGPT真的很多人用嗎?
對于ChatGPT的使用體驗,不同行業(yè)、不同人答案不同。有人把它當玩具,使用了一兩次后就不再登錄;有人努力把它變?yōu)楣ぞ?,在工作中以提高效率;也有人,在努力將ChatGPT變?yōu)楣ぞ叩倪^程中失敗了,因為覺得它“不夠好用”。
夏楠屬于第三種。她從事外貿行業(yè),會用ChatGPT寫工作郵件,也會讓它解答一些生活中的煩惱,為了能更好的使用ChatGPT,她都是用英文發(fā)指令。
從2月開始使用ChatGPT,她的體驗分為了三個階段,最開始是好奇,很多問題都想拋給ChatGPT,看它怎么回答,探索它。從5月開始,她感覺ChatGPT“變笨了”,之前能做到的,現在做不到了?,F在,她對ChatGPT的評價是,“不好用”。
比如最近,他們公司接了一個炒菜機器人的ODM(原始設備制造)業(yè)務,她想讓ChatGPT提供這個市場的預測數據,在反復推拉后,ChatGPT還是沒有給她答案。而在寫工作郵件上,經過調教,ChatGPT也只給到她一個命令式的跟進郵件,文字官方式的長篇大論,也不是她想要的,她希望“它能寫出有禮貌的,信息表達很明確的郵件”。
她覺得,ChatGPT之所以做不到,短板在于“不懂得人情世故”。得不到想要的結果,她的使用頻次也降低了,從一個星期五六次變?yōu)榱艘恢芤淮巍?/p>
當然,之所以會有這樣的體驗,背后綜合影響因素很多,和使用者是否問到了ChatGPT擅長的領域有關,也要看使用者有沒有找到與ChatGPT合適的交流方式。
正在澳大利亞生活的Lucy,從去年底ChatGPT一推出后就開始用英文使用它。現在,她日常用ChatGPT來整理學術研究上的思路、學習語言,是生活里必不可少的工具。只是,準確性的問題一直讓她煩惱,文獻參考需要自己找,“如果我質疑它的回答,它就會順著我的思路回答”。
除了ChatGPT的使用體驗感受不一,從數據來看,ChatGPT的普及率,暫時也還沒有想象中的廣。
摩根士丹利相關報告截圖
除了摩根士丹利的報告,還有一些數據可以作為佐證。根據SimilarWeb數據,3月-5月,美國、日本是全球為ChatGPT貢獻流量份額最高的國家,分別位列第一、第三。不過,最近,美國的流量已經下滑了10.28%。
ChatGPT的全球流量分布 來源 / SimilarWeb數據
美國方面,在5月底,皮尤研究中心發(fā)布了一份調查,他們在今年3月中旬在1萬多名美國成年人當中展開調查,18%的人聽說過很多關于ChatGPT的事情,39%的人聽說過一點,42%的人根本沒有聽說過。
而在日本,根據日本ICT市場調查咨詢機構MM總研的最新調查報告,5月24日-31日期間,以日本及美國企業(yè)所屬的13814名員工(其中,日本13412人、美國402人)為對象,進行的網絡調查結果是,日本企業(yè)的ChatGPT使用率僅7%,與美國企業(yè)的51%使用率相比,兩者相差高達44個百分點。
日本企業(yè)中,近半數員工(46%)回答“不知道”ChatGPT,而即便知道ChatGPT,但回答“未使用”的比重也達42%。
這些都是最近的報告,樣本量在1萬人左右。不過ChatGPT大熱后,全球關于它的使用報告眾多,觀點不一,甚至有的得出的是相反結論。上述報告有一定參考性,但也因地域和人群的差別,不一定能完全反應真實情況。
還有更明確的值得參考的整體性數據,可以幫助我們認識ChatGPT的應用現狀。
根據SimilarWeb,ChatGPT增長明顯放緩,尤其到6月,截至6月20日,6月已經過去三分之二,訪問量比5月少了38%左右,粗略推算,到6月31日如果沒有特別新的刺激,6月的環(huán)比流量或將下降。
ChatGPT近期流量變化 來源 / SimilarWeb數據
同時,還可以參考的是,根據SimilarWeb,在5月,ChatGPT的跳出率是12.59%,低于谷歌、Youtube等,而在6月24日,跳出率已經上升到37.37%。平均訪問持續(xù)時間也從8分32秒,下降到7分48秒。
另一個數據是,接入GPT大模型后Bing的市場份額變化。
來源 / Statcounter
Bing的市場占有率,在二三月份剛引入GPT時引發(fā)關注,根據網站通訊流量監(jiān)測機構Statcounter,2023年3月Bing的市場份額是2.86%,5月是2.77%,不僅占比沒有提高,甚至還有下降趨勢。
是什么限制了ChatGPT?
關于ChatGPT應用上的問題,已經老生常談,不過這些問題對它應用普及上的影響,或許比想象中廣。
首先是“變笨”這件事。
6月初,“ChatGPT變笨了”的聲音引發(fā)過討論。不過OpenAI開發(fā)者推廣大使Logan Kilpatrick曾出面回應,表示自3月14日發(fā)布GPT-4以來,大模型的本體一直處于靜態(tài),不存在大量外部數據污染模型的情況。同時他也承認,大模型本身存在不穩(wěn)定性,因此對相通的提示詞,存在回答前后不一致的情況。
一位AI從業(yè)者告訴深燃,5月就有國外從業(yè)者在OpenAI論壇里分享論證GPT變笨的文章。最近,他用GPT-4的API做了測試,讓它做簡單的計算題。從結果準確度來看,GPT-4-0314取得了滿分,GPT-4取得了80分,GPT-4-0613,勉強可以拿50分。其中,0314、0613即指3月14號、6月13號的快照(指整個系統在某個時間點上的狀態(tài))。這個結果,給他一種GPT-4在被削弱的感受。
來源 / unsplash
根據監(jiān)管機構NewsGuard的專家分析,OpenAI最新版本的GPT-4,在輸出信息方面,比GPT-3.5要糟糕。在今年3月份發(fā)布的報告中,NewsGuard提到,GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敘述,而且比GPT-3.5回答的內容更差。
在上述AI行業(yè)從業(yè)者看來,這樣變化的結果是,用戶需要變得更為具體和主動地引導GPT-4,才能獲得與過去相當的回答質量。
這也再度影響ChatGPT的使用門檻,而這與ChatGPT的初衷有所背離。
最開始ChatGPT爆火,就有業(yè)內人士對深燃分析,它帶來的影響是將通用人工智能放在了每個用戶面前,也把人機交互的門檻,打到了最低點。
但目前來看,門檻還是存在。從ChatGPT的用戶畫像,也能看出這個產品的普及情況。根據SimilarWeb數據,使用者主要分布在計算機電子與技術行業(yè),其中,編程和軟件開發(fā)占比最大。其他行業(yè)里,只有游戲行業(yè)中的視頻游戲機和配件的從業(yè)者占比較多。
在使用ChatGPT的體驗上,一位工程師給深燃的反饋最為積極,表示一直在用,“能幫我解決小的程序上的問題”。
盡管都說,“淘汰你的不是AI,是會用AI的人”,如果普通人使用起來門檻越來越高,那也一定程度上脫離了ChatGPT的初衷。
還有兩個問題,是ChatGPT從最開始就面臨的質疑,即準確率和隱私保護。
根據上述日本相關機構的報告,在被問到今后若要繼續(xù)/擴大使用ChatGPT,需要解決什么問題時,日本企業(yè)、美國企業(yè)分別有高達49%、45%的回答是“案件的精度”,其次為“個人資料等隱私(日企34%、美企35%)”,和“對問題的理解程度(日企33%、美企34%)”。
準確度方面,OpenAI的CEO山姆·奧特曼,也做出過解釋,這個程序會自信地宣稱一些東西是事實,但其實它是編造出來的,就像謊話連篇的政客一樣。他給這種現象起了個名字——“幻覺難題”。
總之,準確率要實現起來非常不容易。原因就是因為它不是靠記憶,而是憑借演繹推理能力來工作?!按笳Z言模型靠的是推理的拼字游戲,不可能像數據庫一樣完全準確,人也不能完全保證準確”,關注AI行業(yè)的工程師楊陽告訴深燃。
隱私方面,OpenAI至今還沒有給出明確的解決方案。在加拿大工作的小虹就告訴深燃,公司特地發(fā)郵件通知,讓大家謹慎使用ChatGPT。
基于這些限制,ChatGPT的應用場景也受限制。
關注產業(yè)的投資人陳默默告訴深燃,它其實適合“生產力驅動”的內容生產,而不是“創(chuàng)意驅動”的內容生產,在前者上,能替代不少有重復經驗累積的人力。
用戶洛洛從4月開始使用ChatGPT,她開了會員,主要用于寫腳本和文案,“只要能給它正確的公式,基本可以反饋給我任意思維的腳本,只是拿到手要改”。她表示,產出的腳本比較基礎,沒法做成爆款,但它邏輯沒有問題,“像公司日常的一些大量的視頻輸出,是可以支持的”,她現在的ChatGPT使用頻率,基本上一周3次以上。
現在夏楠調整了策略,只問它一些流程式的問題,比如開ebay網店的流程。盡管這類問題也可以問谷歌、百度,但“ChatGPT的回答更好”,她舉例,最近她去德國旅行,讓ChatGPT給她安排旅游計劃,給出的答案有參考性,交通安排的也很清楚。
這些長期使用ChatGPT的用戶,不論對ChatGPT的使用體驗滿意與否,他們都提到,ChatGPT更像是一個升級了的谷歌、百度,帶來了一定助力。
ChatGPT,象征意義高過實質意義?
最近,OpenAI推出了類似于LLM版的App Store,加速生態(tài)的建設,還被曝光了一些功能上的優(yōu)化。這背后也隱藏著一個信號,GPT4暫時已經到天花板,要加速生態(tài)建設,在GPT5出不來之前,先做一些體驗上的優(yōu)化。
早在4月,山姆·奧特曼就表示,還沒有開始研究GPT-5,也沒有立即開始的打算,還曾表示,“大型模型時代已經到頭了?!?/p>
據OpenAI官網,GPT模型參數數量(可以理解為喂養(yǎng)模型的語言材料)在不斷提升。GPT-1是1.17億,GPT-2有15億,到了GPT-3,飆升至1750億,GPT-4,根據國外媒體機構Semafor的一份報告,比GPT-3大六倍左右,具有1萬億個參數。
此前楊陽也對深燃表示,或許GPT-4就成長到頭了,語料是一個原因,“人類歷史上創(chuàng)造出的優(yōu)秀資源就這些了”,模型本身的限制也是一個原因。在他看來,現在GPT-4被限制了,應該有能力沒有被完全開發(fā)出來。
近日,Facebook母公司Meta首席人工智能科學家Yann LeCun就指出,ChatGPT背后的生成式人工智能技術已進入了死胡同,擁有太多的局限性。
出于巨頭間的競爭關系,或許很難將這話作為客觀參考。但可以肯定的是,ChatGPT的確遇到了瓶頸。
要讓大語言模型有更好的應用,不少人把視線投向垂直領域的應用上。
AI行業(yè)從業(yè)者秦凱對深燃做了一個比喻,ChatGPT這類泛化型的人工智能,應用寬泛時,能力就像是高中生、大學生,和垂直場景結合時,fine-tuning(在自然語言處理中使用的技術,也叫微調)的數據足夠精確和貼合場景,能力就能變?yōu)榇T士、博士,能解決更具體的需求。
楊陽也認同這一看法。他提到,目前的模型最多只能進行一倍左右的優(yōu)化,“大家有一個基礎共識,GPT-5來了,也不會帶來顛覆性的進化”,短期內不可能達到AGI(通用人工智能)水平。
來源 / unsplash
不過,他表示,現在做具體垂類應用,首先是費用高,訓練模型對公司來說依舊是不小的成本;其次是數據安全、數據隔離的問題,目前采用的辦法是,“在大模型基礎上套小模型”,但帶來的問題是,現在的底層技術還在變化,“沒有人知道下一個模型,更優(yōu)秀的模型什么時候出現”,這個中間階段讓大家很迷茫,“如果三五年后才出現,那現在基于大模型做垂類的產品是不虧的,場景落地后有機會回收資金。但如果很快就出現了,那大家現在做的外掛型垂類產品,是沒有多少意義的。”
投資人陳默默表示,這是一個“先有雞還是先有蛋”的問題,他們還是愿意去看相關項目,在細分領域里切一個特定場景的應用,因為“哪怕未來的底層有變化,只要行業(yè)沒有變動,在應用層的行業(yè)理解上還是會有沉淀”。
但他們在看項目時遇到的問題是,很難有人可以明確告訴他們,產品能節(jié)省多少人力成本?!翱聪聛恚€是得給機器配個人”,她舉例,關注賦能研發(fā)端論文篩選歸納相關的垂類產品,實際使用也還是需要一個人順著機器的結果,再做進一步驗真、開發(fā)和研究,實際上很難說效率有特別好的優(yōu)化”,所以現在,一些投資人都會傾向于再觀望觀望。
在關注垂類領域的AI創(chuàng)業(yè)公司的產品時,她的感受是,“我們對技術帶來的產業(yè)升級機會保持謹慎樂觀,目前可能它的市場意義,高過實質意義”。
秦凱總結,人們對ChatGPT的期望過高,但有兩個瓶頸。首先,下一代大語言模型通過更大的參數規(guī)模和更強算力的收益邊際遞減,人們的期望可能無法很快滿足。其次,當前的大語言模型是泛化的,需要很長時間來解決特定、真實的問題。目前垂直領域的生成式AI,已經變成了針對具體企業(yè)做定制化需求和私有部署的體力活,“底層模型依靠transformer方式缺乏解決非常復雜問題的能力,現在的應用情況與預期的水平相距甚遠”。
應用還在繼續(xù),技術還在發(fā)展,關于ChatGPT的應用及潛力還需要再觀望。即便是這樣,ChatGPT已經讓一些人的生產效率,有了一個數量級的提高,即便當下有瓶頸,“ChatGPT已經是很偉大的產品,這就夠了?!睏铌柋硎?。
*題圖來源于unsplash。應受訪者要求,文中夏楠、Lucy、楊陽、小虹、洛洛為化名、
關鍵詞:
新聞發(fā)布平臺 |科極網 |環(huán)球周刊網 |中國創(chuàng)投網 |教體產業(yè)網 |中國商界網 |萬能百科 |薄荷網 |資訊_時尚網 |連州財經網 |劇情啦 |5元服裝包郵 |中華網河南 |網購省錢平臺 |海淘返利 |太平洋裝修網 |勵普網校 |九十三度白茶網 |商標注冊 |專利申請 |啟哈號 |速挖投訴平臺 |深度財經網 |深圳熱線 |財報網 |財報網 |財報網 |咕嚕財經 |太原熱線 |電路維修 |防水補漏 |水管維修 |墻面翻修 |舊房維修 |參考經濟網 |中原網視臺 |財經產業(yè)網 |全球經濟網 |消費導報網 |外貿網 |重播網 |國際財經網 |星島中文網 |手機測評 |品牌推廣 |名律網 |項目大全 |整形資訊 |整形新聞 |美麗網 |佳人網 |稅法網 |法務網 |法律服務 |法律咨詢 |成報網 |媒體采購網 |聚焦網 |參考網 |熱點網
亞洲資本網 版權所有
Copyright © 2011-2020 亞洲資本網 All Rights Reserved. 聯系網站:55 16 53 8 @qq.com