文心一言,開幕?
ChatGPT API上線,
文心一言希望滿滿。
文|王凡 & 秦怡
編輯 | 小白
出品|極新
01
大模型帶來的商業機會天花板在哪里
就像李彥宏在大屏上展示的內容里,大模型帶來的商業機會天花板吸引了諸多目光。在文心一言的帶動下,“三把尖刀”的發展值得期待。首先是新型云計算公司的未來將不會遙遠。文心一言將根本性地改變云計算行業的游戲規則,MaaS(Model as a service模型即服務)可以稱得上是為專用模型給垂直客戶提供服務的新窗口。如果把云計算公司視為一輛汽車,那么Maas的發展可以被視為其核心動力,客戶也將會注重這輛汽車的實踐表現。在未來文心一言企圖通過百度智能云構建企業模型,對外提供服務,讓AI與云計算的模式助力多元行業迭代升級,突出對于產業空間的可操作性。
其余兩把尖刀就是行業模型精調的公司以及基于大模型底座進行應用開發的公司。前者處于模型層與應用層的中間位置,其行業服務能力影響著客戶的實際需求能否真正得到滿足,后者主要是針對在AIGC背景下應運而生的“破殼企業”提供應用服務,其發展能力自然不必多言。
02
真刀實槍,還是空穴來風
目前,AIGC 產業生態體系雛形初現,基礎層、中間層、應用層三層架構層層相扣。以高門檻的預訓練模型為基礎搭建的 AIGC,技術基礎層正是核心所在。在基礎層足夠堅實之后,大模型的垂直場景化模型開發將更加順暢,ChatGPT-4展現出來的超然能力讓它在大模型發展方面傲視群雄,尤其是在編程方面的“獨家竅門”更是創造了新燃點。
對比ChatGPT-4,李彥宏在文心一言的“編程方面”似乎顯得不那么自信,這一點并沒有在現場展示,這似乎也意味著文心一言的能力局限。在中文世界里,大量強大的互聯網公司并沒有滋生出Github這種高質量的全門類代碼倉庫,這也成了百度的痛點。與前輩們相比,文心一言的創作能力、RLHF訓練的強度、RL模型選擇、多模態的工程細節方面還需要打磨。參數和數據訓練的頻次是否到位,基于人類反饋的強化學習算法是否能夠精準,將 NLP 技術和機器學習結合的能力是否足夠科學化,大語言模型商業化對于C端是否足夠友好,這都是李彥宏需要考慮的問題。
OpenAI發展多年,ChatGPT-4發布的迅速和準備的成熟度證實了其很顯然不是工程縫合的產物,對比之下,百度的倉促有些令人感慨。
03
文心一言,是橫空出世還是醞釀已久
雖然如同李彥宏描述的那樣,文心一言要走的路還很長。但是我們不能否認百度在模型訓練方面得天獨厚的優勢。作為百度基于其文心大模型技術推出的大語言模型,文心一言可謂是在關愛下長成的“溫室花朵”——如百度知道、百度文庫、百度知識圖譜、百度搜索等百度旗下多款應用均能有效支撐大模型的訓練與迭代,為助力文心大模型快速成長為全球領先的大模型提供著充足的養料。
百度打出的這一槍,說突然也突然, 現場采用錄制而非直接嘗試,甚至有小道消息“用人工推進人工智能,在文心一言運行出錯的時候員工要頂住”,引起一片嘩然;但是,說正常也正常,一方面是因為十年磨一劍,霜刃未曾試,百度已經在這里傾注了大量的心血;另一方面是虎視眈眈的競爭對手:微軟已經宣布在 Bing 搜索、Azure 云服務、Teams 等產品中加入 ChatGPT 技術,并期待在 Office 套件中也集成 ChatGPT;谷歌基于 LaMDA 模型推出 ChatGPT 的競品Bard,Meta官宣將開源新的范圍從 70 億到 650 億參數的大預言模型 LLaMA……面對重重壓力,百度希望“橫空出世”也情有可原。
04
文心一言還有多少時間?
百度的發布會觀眾買賬程度并不高,議論紛紛,這與文心一言所處的環境有關,目前中文 NLP 數據集稀缺、質量參差不齊,中文互聯網的發展并不等價于高質量的語言積累,在展示上也顯示出中文大語言模型發展緩慢的缺陷,這正是百度的本質缺陷。
但是,這樣的環境也給了文心一言新的發展空間,在發布會上對于古詩創造的能力,各類評測上對于中文語言的理解都不遜色于ChatGPT-4。當然,文心一言的發布會上,最動人心弦的一幕應該是視頻的生成,盡管時間很短,也不會直接向用戶開放,但是也跨出了新的一步——未來的大模型的輸入輸出將是多元多樣的,文字對話,圖像、音頻、視頻等多種形式或許都會成為可能。相較于DALL-E 2 從文字生成圖片,以及Make-A-Video 從文字生成視頻,文心一言似乎邁出了更遠的一小步,這也意味著用戶的期待,就是潛力的所在。
“文心一言”目前包含以下五類落地場景:文學創作、商業文案創作、數理邏輯推送、中文理解、多模態生成。對于百度而言,技術從未止步,2010年百度CTO王海峰成立自然語言處理部,2019年就推出了文心大語言模型,2012年百度的飛槳深度學習平臺研發了4D混合并行技術,2022 年百度核心研發費用超200 億元,百度在爬蟲技術、搜索技術以及占有搜索數據量上面的優勢依然為其爭取了喘息時間,在高時效性高準確性的團隊運營理念下,深耕AI領域多年的百度應該不會造出一款“胡編亂造”的新產品,李彥宏其實從未放松對于超大規模模型的訓練處理的追逐。
05
C端唱衰,但是B端還有余地
表現平平的發布會甚至影響了百度股價;但是B端熱情不減,企業對調用文心一言接口抱有期待,認為其還是大有可為。目前,醫療、教育、互聯網、銀行等各領域為文心一言的投資已經成為現實,例如郵儲銀行通過“郵儲大腦”接入并應用“文心一言”的能力,吉利汽車應用在其銀河的全新智能座艙系統的人工智能交流對話領域;能鏈智電將智能對話接入能源供應鏈、資產管理、零售等場景。辦公軟件、OA、ERP 等企業日常管理經營必備系統也同樣期待著文心一言的發展帶給他們新的紅利。
對待文心一言的發展,有幾個問題至關重要,也是B端投資者極為關注的問題:首先,對于信息特別是數據自身的關聯,其能否建立背后的邏輯;其次,文心一言能不能在可預見的未來提供獨特的洞見,而不僅僅只是一個更高級的傳聲筒;最后,更低門檻,面向場景研發更好的 AI 模型會不會生長成為一個普惠性的工具而不是象牙塔里的寶物。
唱紅或者是唱衰,百度和文心一言一直在路上,多年的積累與沉淀給了百度底氣,ChatGPT-4的發展也幫助文心一言做對照。讓我們一起拭目以待。
頭圖來源:unsplash
本文原創:極新(jixintech)
原文標題 : 文心一言,開幕?

最新活動更多
-
12月19日立即預約>> 【在線研討會】AI服務器中被動器件的應用介紹
-
12月22日立即下載>> 【精選白皮書】大功率機殼開關電源
-
12月28日火熱報名>> OFweek2023中國智造CIO在線峰會
-
12月31日立即試用>> 【企業專題】福祿克-全新專家級紅外熱像儀
-
4日18-19日立即報名 >> OFweek 2024(第十三屆)中國機器人產業大會
-
8月27-29日立刻報名>>> 2024年云計算展覽會
推薦專題
發表評論
請輸入評論內容...
請輸入評論/評論長度6~500個字
暫無評論
暫無評論