文心一言,一言難盡
趕鴨子上架的“百度”
ChatGPT以火箭般的速度爆紅,沉靜許久的中國科技圈和創投界的終于再次引發熱潮;ヂ摼W大佬王慧文自掏腰包、帶資建組,科技大廠摩拳擦掌、爭先恐后,創業公司也不遑多讓,甚至跟AI不搭邊的個別企業也借勢營銷,并因此而收獲一波股價的大漲。
但真正下場目前要發布產品就只有百度了。以AI技術見長,號稱過去10年在AI領域投入超過1100億元研發費用的百度,自然成為被關注的對象。是騾子是馬總要拉出來溜溜才行。
但巧合的是,OpenAI于3月15日發布GPT-4瞬間火爆全網,但已經定下3月16日發布的百度總不能推遲日子,說好的對標ChatGPT呢?
但想象中的百度版ChatGPT沒來,“ChatPPT”倒是來了。發布會的演示最重點的就是實際使用的演示,從喬布斯的年代開始都是如此。老羅的李姐萬歲言猶在耳。百度這次選擇了全錄制,很難不讓人聯想到是擔心出現老羅一樣的事故,也就代表著有很強烈的不自信;當然也可能是被 Google 演示的小錯誤事故嚇怕了。
發布會現場,李彥宏用提前錄制好的視頻展示了文心一言的文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等五方面功能。在錄制好的視頻里,文心一言幫劉慈欣續寫了《三體》,介紹了洛陽紙貴背后的經濟學原理,算了雞兔同籠數學題,根據指令生成了海報和一段宣傳視頻。
但是明顯進步的GPT-4在昨天已經拉高了群眾期待,你百度遮遮掩掩拿一個半成品算怎么回事呢?資本市場可不管你什么網絡原因,先跑為敬所以百度發布會當天一度跌停。
百度這次發布會,有著很明顯是背著很重的銷售 KPI 包袱的,在聊后面的部分,都是 toB 銷售的話術,講技術的抽象概念和商業合作的價值。這就跟OpenAI大篇幅講產品形成了鮮明對比,觀感不好還是其次,沒講好產品那就是加負分了。
錄播的文心一言就一定不行嗎
根據多家媒體對文心一言的試用綜合來看,與預期相比,百度文心一言還是能夠及格的。雖然與搭載 Chat GPT 的 Bing 稍微有一些差距,但差距不是特別大,在中文常識上,文心一言是強于 Bing 的,但在英文內容和邏輯推理上是弱于Bing。
對于“文心一言”的產品表現,百度創始人李彥宏略顯底氣不足,在發布會剛出場不久,就開始主動降低用戶預期。他說道,“要對標 ChatGPT、甚至 GPT-4,門檻還是很高的”、“自己測試還是感覺有很多不完美的地方”。
文心一言確實還不如ChatGPT,但總要客觀認識到我們今天所說的 ChatGPT,或者其背后的 GPT-4 語言模型,是一個花了 5 年時間、經歷了 4 次迭代,完成了從量變到質變過程。想讓文心一言在幾個月這么短的時間內實現趕超,幾乎是不可能的事情。
不過就目前而言有大語言模型可用比好不好用更重要,只要基本框架打好后面就只需要堆疊豐富的語料和模型校正,好用起來那只是時間問題。在筆者看來雖然目前已經聲稱要做中國版Chat GPT的很多,比如騰訊的混元AI大模型、京東的Chat JD等等,但真正在AI在內容上有長期大投入還是百度,如果百度都做不出來其他家希望就不大了。
目前來看文心一言不至于讓用戶很失望,更何況谷歌聲勢浩大的Bard不一樣不盡人意。拿這點批評中美科技差距過大是有點過了。
做大模型,前提是有資金的投入。OpenAI 在 2019 年獲得微軟 10 億美金的投入后,又于今年獲得了微軟 100 億美金的投資,這讓其有了燒錢的資本。業界測算, GPT-3 涉及 1750 億參數,訓練費用約花費 1200 萬美元。據國盛證券報告估算, GPT-3 訓練一次成本約為 140 萬美元,每一次訓練任務都耗資巨大。
此外,大模型訓練的三要素包括大算力、大數據和大模型。有從業者指出,影響最后訓練結果的因素有很多,包括清洗、標注、模型結構設計、訓練推理的技術積累等。每一個因素的變化都影響著最后的結果。
過去十幾年里百度一直在 AI 方面投入,包括 2019 年推出文心大語言模型。2022 年百度核心研發費用達到 214.16 億元,占百度核心收入比例達 22.4%。但是,百度和 OpenAI 還有不小差距。李彥宏也直言,無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。因為深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。
百度想要做什么
在國內一級市場上,投資機構為了投大模型公司,焦慮難安,行業幾乎每天都會有大量認知的迭代。與之相應的是創業熱潮,前美團聯合創始人王慧文、出門問問 CEO 李志飛、前搜狗 CEO 王小川、前京東高級副總裁周伯文等一批大佬,都在殺向大模型賽道。國內大廠們更是如此。除了百度之外,阿里、騰訊、華為、字節、科大訊飛、商湯都沒有放棄大模型之戰。大模型耗資巨大不是模型問題,“這是我的問題”,一些從業者這樣回答,也彰顯了他們急切想要在大模型領域做出一番成績。
對于百度來說這更是生死之戰,百度的營收結構中廣告是大頭,而廣告又是極其依賴搜索的,如果搜索未來被GPT顛覆,那么百度就死無葬身之地了。
2022年全年,百度的營收和凈利潤均下滑。2022年,百度實現營收1236.75億元,同比下滑0.66%;歸母凈利潤75.59億元,同比下滑23.46%。
百度搜索引擎的市場份額已經在加速下滑。市場調研機構StatCounter數據顯示,從2022年1月至2023年1月,百度搜索引擎市場份額已經從84.36%下降至65.21%。2022年全年,百度的廣告收入在每一個季度均出現同比下滑。數據顯示,百度2022年第一季度廣告收入同比下滑3.6%、第二季度為10%、第三季度為4%、第四季度為5.2%。如果All in AI不能成為新的增長曲線,百度恐怕連二線大廠的地位都難以守住。
目前來看,百度做大模型并不是毫無優勢,技術面上,百度在中文NLP領域,無疑擁有先天優勢。首先是對國內技術政策的熟悉,令它比ChatGPT 更能滿足國內市場需求。其次,作為最大的中文搜索引擎,百度擁有的高質量數據集及中文數據收集能力,其他家難以比擬。
如果文心一言能夠成功,國內流量是可以重新洗牌的。在國內,百度搜索入口的流量長時間被移動互聯網其他流量怪獸一點點分流,而如今除了百度的移動生態,大的流量入口基本都掐在騰訊系(微信、QQ)、阿里系(支付寶、淘系)、字節系(抖音)手上;文心一言給了百度一個機會,但凡能有ChatGPT級別的表演,就有可能重新奪回流量。而生成式內容也會豐富內容生態與供給,讓百度的搜索業務,重新有其他可能性。
文心一言是百度搜索引擎實現“模糊搜索”到“精準推送”跨越的關鍵。生成式AI問世之前,搜索引擎以“模糊搜索”為主,用戶需要根據在搜索引擎中打入關鍵字找到需要的內容或鏈接,而通過文心一言,用戶可以通過自然語言交互的方式輕松獲得需要的內容或鏈接,且內容較為精準,即“精準推送”。與此同時,生成式內容也會極大豐富內容生態和內容供給,讓成熟的搜索業務和搜索體驗煥發生機。相比抖音短視頻長時間大量試錯來做精準營銷,Chat GPT類的精準搜索無疑將會降低大量成本,這對廣告商來說非常具有吸引力。當然,百度還要想清楚如何讓用戶接收到真正有價值的信息,而不僅僅是廣告信息,避免再次出現目前搜索引擎廣告業務的尷尬。
還有更重要的一點,文心一言的出現會加速百度通過人工智能技術賦能其他產業,從技術本身,基于百度文心大模型已經產生了多款面向 C 端的單點產品,例如產業級搜索系統“文心百中”。
寫在最后
有投資人講中國要做Chat GPT要邁過三座大山,第一是資金山,微軟近些年共投入100億美元,國內要做至少也要10億美元起步,這點對國內大廠并不是特別困難。第二是工具限制芯片禁售難題,運行AI大模型需要大量GPU芯片——芯片上受的鉗制,又影響了做AI大模型。要想跑通一次100億以上參數量的模型,至少要做到“千卡/月”這個級別,即:用1000張GPU卡,然后訓練一個月。
即使不用最先進的英偉達A100,按照一張GPU五萬元的均價計算,1000張GPU意味著單月5000萬的算力成本,這還沒算上算法工程師的工資。百度目前來看并沒有受到這個問題困擾,不知道是通過什么替代方案解決的。
第三是AI人才尤其是NLP領域的人才,國內目前還是非常匱乏的,如今世界局勢、國內財務自由前景都截然不同,如何讓人才“系統性回國”成為非常大的挑戰。這點國內大廠要多動點腦筋不要遇事不決一直加薪。
所以想要做大模型做Chat GPT一定要想清楚,不要像元宇宙一樣風口過后一地炮灰。
相比大多數企業都在關注GPT在語言上應用,任正非則更關注對工業社會和農業社會的促進,認為未來98%的機會在這兩方面。ChatGPT對我們的機會是什么?它會把計算撐大,把管道流量撐大,這樣我們的產品就有市場需求。
任正非的話還是有一定道理的,工業對于AI的需求還是容易實現的強需求,對于眼下提升效率是實實在在可見的。變革的時代已經來臨,創新已經不是可選項而是必選項。
參考資料:
究竟是ChatGPT還是ChatPPT? 來源:全天候科技
百度“文心一言”就這?來源:深燃
李彥宏,有一點急 來源:商業人物
百度趕鴨子上架 來源:鹽財經
百度步谷歌后塵 來源:甲子光年
文心一言發布我們拿到內測賬號試了試 來源:知危
為什么會對文心一言發布會失望 來源:劉言飛語
ChatGPT真的是全村人的希望嗎 來源:美股研究社
原文標題 : 文心一言,一言難盡

最新活動更多
-
12月19日立即預約>> 【在線研討會】AI服務器中被動器件的應用介紹
-
12月22日立即下載>> 【精選白皮書】大功率機殼開關電源
-
12月28日火熱報名>> OFweek2023中國智造CIO在線峰會
-
12月31日立即試用>> 【企業專題】福祿克-全新專家級紅外熱像儀
-
4日18-19日立即報名 >> OFweek 2024(第十三屆)中國機器人產業大會
-
8月27-29日立刻報名>>> 2024年云計算展覽會
推薦專題
發表評論
請輸入評論內容...
請輸入評論/評論長度6~500個字
暫無評論
暫無評論