什么是中國AI趕超的正確姿勢?
導語:
ChatGPT像一面鏡子,照出了中國AI發展的成就與不足。
在AI前沿領域,必須承認,我們目前還不具備碾壓式的實力,但我們有足夠的決心、投資能力和互聯網產業基礎。
盡管如此,AI產業的核心突破,需要的人才、資源、資金的門檻之高,也決定了,其如果需要在中國做出世界級的創新,一則還是要靠舉國體制,另外也要協同一批龍頭企業的共同努力。
AI的競爭不止有技術流打法,也有產品流、產業流的打法。
唯獨重要的是,我們不能放棄,我們必須雖千萬人吾往矣。
從一個研究者的視角,騰訊值得關注。它的用戶基數、豐富場景、基礎技術投資,以及過去十年可能是最好的中文語料資源積累、多模態應用的廣度等,決定了它是一個有機會在AI領域做出核心突破的潛力企業。因此,筆者也進行了一番深度調研,其中的若干感悟和結論,或許能給大家了解中國AI行業現在和未來,帶來一些啟發和觸動。
1、場景優先
ChatGPT4的發布,以及國內廠商的跟進,讓這個概念更火了。
其實讀者關心的問題不僅僅是中國能不能做出類ChatGPT的項目(因為假以時日,肯定能),大家關心的可能是,什么時候輪到我們領先和主導下一輪?
在原理透明的前提下,問題的底層邏輯是,誰擁有優質的訓練數據集,誰就是趕超的關鍵先生。
那些擁有自己閉環生態的企業明顯具有先天優勢,海外科學家指出,ChatGPT訓練所需要的高質量數據集,通常有這樣幾類——50%的用戶生成內容、20%的書籍、10%的科學論文、近10%的代碼和近10%的新聞。
無論在哪個數據集里,用戶生成內容(UGC)的數量占比都是最大的,放到國內來看,可以看出騰訊優勢相對明顯。舉個例子,騰訊的微信公眾號是國內優質長內容的關鍵載體,富集了過去10年最有創造力的創作者提供的內容。
同時,大量的音視頻內容和技術,也是騰訊發展多模態的優勢。
但騰訊的優勢是否能轉為勝勢呢?這是我們此文重點要討論的,就是騰訊的AI底蘊究竟如何。
也許我們可以試圖回溯一下,騰訊的AI發展從何而來。
2012年,QQ用戶突破1.6億,在騰訊上下為之歡騰的時候,微信又以閃電般的速度,在這一年的9月實現了用戶規模突破2億。一年之內,騰訊就有了兩個億萬級用戶規模的強場景,這既是AI發展的土壤,也是對年輕研究人員的壓力。
也是這一年,騰訊優圖實驗室成立,這是騰訊內部最早開始專注AI研究的實驗室之一。
優圖實驗室創始團隊,在PC互聯網時代,曾經做出過過一款看圖軟件產品——QQ影像。但沒過幾年,伴隨移動互聯網到來,產品和技術團隊進入了瓶頸期。
據騰訊云副總裁、騰訊云智能研發負責人、優圖實驗室研發負責人吳永堅回憶,團隊最初是帶著一種頗為沮喪的心情,主動“求變”的。他們的計劃是,圍繞原來在PC端積累的圖像能力,去移動端做些技術新嘗試。當時,他們關注到一種無損圖像處理的算法。在沒有外部支持的情況下,五人團隊僅用三個月就做出了新算法,他們把這種能力應用在騰訊旗下的業務,使商品詳情頁圖片加載速度提升50%以上。
對優圖實驗室來說,這是一個重要轉折點,吳永堅意識到:”我們之前都是純做應用的,后來發現產品的應用發展可能會起起伏伏,但支撐應用的底層技術永遠是越先進越好,我們就把關注重心轉移到技術能力建設上。讓我們的研發離應用只有一代的差距,最后我們選擇了一個詞叫‘預研’。”
任何時候,技術只有落在實際場景中才能驗證效果。
當時,吳運聲(優圖實驗室負責人)提出,如果優圖要做圖像(技術),就要和騰訊內部圖像需求最多、最復雜的團隊去接觸,因為需求越大,技術可挖掘的價值就越大。
思路一通,靈感就來;赒Q空間的圖像場景,優圖實驗室做出了一系列創新,包括圖像顯著性內容檢測,也就是自動找出圖片中最能代表圖像的區域。
在同一個階段,深度學習的浪潮起來了。圖像技術與深度學習匯合,促使優圖實驗室正式進入圖像理解的領域,也就是基礎的視覺AI的算法研發。
這時候,又一個新的需求產生了。
微眾銀行,一個完全沒有線下實體的互聯網銀行,帶來了一個世界級難題——活體檢測。
現在,基本上所有對安全性要求高的APP,都有一個視頻驗證身份的過程。但在2013年的時候,這方面的技術還很不成熟,一些常規的檢驗如搖頭、眨眼等,都有被作假的幾率。
“后來我們想了一個方法,就是給出一串數字,讓用戶讀出來。這樣,我們就有了視頻+音頻+圖像三種模式交叉驗證”,吳永堅說:“后來想想,優圖實驗室的AI進入多模態的研究方向,也就是這一個瞬間啟發的。后來,我們還研發了背景變色閃光的驗證方法,這個技術在當時可以說是世界級的,現在還是業界主流的驗證方法。”
這個案例證明了,騰訊從C端業務中積累的AI能力,同樣可以解決B端的需求,局面打開了。
風也起來了,2016年,隨著AlphaGo戰勝人類棋手,一股AI熱席卷全球,與今天ChatGPT帶來的沖擊頗為類似。
而騰訊也開始加速規;、矩陣式布局AI研發。2016年4月,AI Lab成立,專注于AI基礎研究和應用探索的結合。
一個標志性的事件是——2017年8月,騰訊發布首款將人工智能技術運用在醫學領域的AI產品騰訊覓影 。這個項目徹底擊穿了部門墻,聚合了騰訊公司內部包括AI Lab、優圖實驗室、架構平臺部等多個頂尖人工智能團隊的能力。
這不僅促使騰訊成為影像領域的國家新一代人工智能開放創新平臺,也成為騰訊AI崛起的標志性事件。
寫到這里,筆者突然想起了英國物理學會會士、深圳兩化融合首席科學家馬兆遠說過的一番話,他說——
“推動世界的絕大多數進步,首先是解決了工程問題。好的科學家應該是工程師,好的工程師也應該是科學家。而在實踐中,科學是第二性的,工程才是第一性的”。
2、算法產品化
2019世界人工智能大會上,騰訊公司董事會主席兼CEO馬化騰表示:騰訊已建立四大AI實驗室,涵蓋AI從全面基礎研究到多種應用開發,將打造面向未來的“科技引擎”。
而應用開發的產業化、商業化落地,是其中關鍵一環,也是當前整個AI領域尚未較好破解的一道難關。
另一方面,追求高質量發展、促進產業升級轉型,是中國產業互聯網技術領域歷來的關注焦點。這其中,AI如何參與?
騰訊給出的答案是,發布云智能,更強調云與人工智能的融合深度,以AI作為產業互聯網時代的數據“中央處理器”,釋放數字化能力。
從場景出發,是這條路得以跑通的底層邏輯。
例如,中國是世界上工業門類最齊全的國家,用AI解決工業質檢需求正是其中一個典型場景。
手機攝像頭支架,聽起來似乎沒啥科技感;但如果我告訴你,富馳高科是一家金屬粉末注射成型(MIM)產品專業制造商,是不是就高大上很多?
手機攝像頭支架看似簡單,但形狀不規則且只有手指頭大小,需要檢測的點位高達七八十個。
算筆賬你可能覺得更直觀,由于富馳高科每年生產的零部件數億個,僅質檢人員就需要超1500人。質檢人員需要聚精會神,才能完成這種精細質檢,且因為疲勞往往容易導致漏檢錯檢。
2021年,騰訊云開始用AI能力給富馳高科解決手機零部件質檢難題。
當時,騰訊云采用TNN深度學習推理框架,借助算法模型加速和智能調度等多種技術能力,從工程化上實現了性能優化;算法方面,則創造性的設計了光度立體成像解決方案,克服了MIM產品因高反光特性而導致的產品缺陷與正常反光混淆的行業難題。最終的結果是,基于這套解決方案,富馳高科單臺質檢儀的工作效率是原來人工的10倍。
解決一個從未被破解的行業難題,自然需要投入大量算法工程師。但每個方案都采用重人力的模式,不可持續。
由此,在過去的兩年里,騰訊一直探索“算法產品化”的方式,即拆解算法里的每一個流程,精細到每一步明確要做什么,然后將其沉淀到騰訊云TI平臺上,最終形成了一個面向工業質檢場景的產品化平臺——工業質檢訓練平臺TI-AOI。 現在,面對同樣的工業質檢場景,騰訊只需在項目前期派少量算法人員過去,其余大部分工作都可以在TI平臺上完成,效率提高,加速了AI技術在工業場景的落地。而未來的進階方向是——騰訊甚至都不用派工程師到場,這項工作就可以由企業自己的運營人員完成,并且他們不需要有很強的算法背景。
這樣做更大的價值還在于,拉低應用門檻,進一步推動AI普惠。
傳統制造業是產業智能化升級的主體,但一般的制造業企業沒有研發AI算法,甚至沒有應用AI算法的能力。
騰訊的工業質檢訓練平臺為企業找到了一個限制更少,門檻更低的方案。即便不懂AI算法,工廠技術人員依然可以用平臺進行缺陷標注,讓算法根據零件質檢需求自動跑起來。對騰訊而言,一路積累下來的能力可以復用于其它類似場景,下一個項目也不會再用6個月時間了,這為騰訊AI在這一領域加速布局打開局面。
為富馳高科服務的騰訊云TI平臺是騰訊云智能的體系的核心產品之一,還有我們熟悉的數字人,或稱數智人。
數字人和我們前文敘及的ChatGPT有密切的聯系,某種程度上,數字人也是生成式AI的一種載體,是AIGC的一部分。
例如,短視頻制作已經是一個龐大的行業,但其上限是內容生產成品太高、效率較低。
騰訊云智能有一款2D數智人,可以實現依靠3分鐘真人錄制視頻,就生成一個數字人形象,后期則通過文字輸入就能生成視頻內容,大大降低了視頻錄制成本、修改成本,最終是降低了短視頻內容制作的準入門檻,為豐富內容生態貢獻很大。
技術含量更高的3D虛擬主播,也因為AI,而有了更多展現形式。例如經常在電視上看到的手語主播,需要通過細微的手部動作來展示內容,現在通過AI已經可以實現文字、語音直接轉手語。
2022年初,騰訊AI手語數智人”聆語“誕生,成為首位服務于國際賽事直播解說的數字人,支持實時生成手語,可懂度 90% 以上,而一般比較熟練的真人解說員的手語可懂率不過是60%-70%。但在加入AI以前,用數字人來完成這類操作是很難想象的。
從數字人到數智人,騰訊云智能數智人的背后是新一代的多模態人機交互系統,可以讓虛擬人物擁有超細微面部情感表情以及數百種肢體動作,并且通過自動化的播報平臺、交互平臺,打通形象生產到內容生產的全鏈路
背后的背后,是騰訊積累多年的語音交互、自然語言理解、圖像識別等AI能力的充分整合。
騰訊云副總裁、騰訊云智能負責人、優圖實驗室負責人吳運聲總結說:騰訊云智能要做的就是整合騰訊的技術優勢和行業經驗,從而打磨出更多優秀的產品和服務模式,助力產業數字化轉型。
在對諸多案例的探尋中,筆者一直在思考的是,為什么騰訊AI的產業化、商業化落地效率更高,也更受到實際用戶的青睞?
現在看來,騰訊的AI研發一直帶有產品化的思維,對目標用戶需求和痛點考慮的更為周全、具體,這是騰訊原生的DNA在賦能;另一方面,在云計算、大數據方面的領先性,讓騰訊AI有很好的底層支撐和綜合競爭力。
3、飛輪效應
騰訊AI的產業實踐,讓我們看到了一種中國本土AI的趕超模式,我姑且稱為”閉環效應“疊加”飛輪效應“的”雙環組合“。
首先是閉環,研發-賦能-落地-反饋-人才,可謂缺一不可,但把這五個要素形成一個閉環,難度更大。
但如前所述,騰訊云智能的打造,已經促進了這一閉環的形成,通過聚合騰訊優圖實驗室、騰訊AI Lab等騰訊頂級實驗室的技術能力、產品能力以及多年的實踐經驗,輸出從底層算力支撐到 AI 開發平臺、到 AI 產品解決方案、再到頂層數智化轉型方法的四級全鏈條服務,就是其具體體現。
現在更急切的任務是,如何讓這個飛輪轉起來,形成Flywheel Effect(飛輪效應)。這其中,四個“關鍵引擎”缺一不可。
第一個引擎,是強大的云計算、大數據底蘊。
大家都知道,OpenAI能夠取得成功的一點,是微軟基于云計算能力,為其打造了一臺超級計算機,將數以萬計的 Nvidia A100 GPU 和 Azure 云計算平臺串聯在一起,能以高吞吐量、低延遲網絡來使用這些算力。
在這個層面,騰訊云針對類似的訓練、推理、測試及優化場景,能夠點對點提供最佳的匹配方案和產品。特別是在大模型訓練場景,結合了騰訊自研的軟硬件技術,為騰訊云AI計算、高性能計算需求提供算力底座;A層將裸金屬云服務器作為節點,滿配最新代次的GPU,節點之間通過RDMA網絡互聯,提供高性能、高帶寬和低延遲的算力。
第二個引擎,是大模型的能力。
行業里一直圍繞大模型或小模型,大數據或小數據有爭論,但ChatGPT的問世,決定了至少是在今后3年,大模型是更主流的方向。
打造大模型是極其艱難的,但為其后的泛化提供了保證。就好像如果你編了一本《漢語大字典》,那么再編一本《中學生字典》就很簡單;相反你想編一本《小學生詞典》,但手頭沒有《漢語大字典》做母本,一切也得從0到1來過。
騰訊很低調,但不意味著其在大模型領域落后,相反,騰訊打造的混元AI大模型,其完整覆蓋NLP(自然語言處理)、CV(計算機視覺)、多模態等基礎模型和眾多行業/領域模型,已先后在中文語言理解權威評測集合CLUE 與 VCR、MSR-VTT,MSVD等多個權威多模態數據集榜單中登頂,實現跨模態領域的大滿貫。
值得一提的是,近期混元AI大模型團隊推出了業界最大的萬億中文NLP預訓練模型HunYuan-NLP-1T,再次打破CLUE三大榜單記錄,實現在中文語理解能力上的新突破。
第三個引擎,叫長期的基礎技術積累。
基礎技術積累對于產品導向型的公司,是一個發展悖論。但以產品為名的騰訊,從2015年后,開始傾力于基礎技術的研發突破。
微軟對OpenAI的投入超過百億美金,所以,最簡單的一個評價標準是——你愿意為基礎研發花多少錢?
筆者看到的數據是,自2015年至2021年,騰訊的研發投入從90億增加到519億,增量達4.8倍,是國內增速最快的科技企業。 其中,2021年騰訊研發投入達到518.8億元,較2018年實現翻番,研發人員數量同比增長41%,新增研發項目超6000個。2019-2021年,騰訊三年累計研發投入已經超過1200億元,年均增速超過30%。
早在2019年,騰訊在全球主要國家的專利申請數量已超過30000件,授權專利數量超過10000件。專利申請數量在國內互聯網公司中排名第一,在全球互聯網公司中排名第二,僅次于谷歌。
第四個引擎,叫基于反饋的人才培養。
任何一個產業都需要在無數次反饋中獲取進步。 人們對科學家的要求可能是千分之一的成功率,但對產品的要求是千分之一的失敗率。 兩個千分之一中間,有著漫長的過程。 但正是因為騰訊AI憑借各種形式進入千行百業,就為繼續創造、探索和不斷改進,提供了可能性。 雖然,每一步改進都意味著大量的選擇和優化,但這是有助于打造在實踐中大量開發經驗和工程訓練積累而成的能力。如果說科學精神是從無到有的探索,那工程精神就是“日拱一卒”的堅持。 在筆者看來,除了以上敘及的方方面面,騰訊AI體系的一大成就,是培養了一批了解科學、懂得技術,并能把構想和創意造出來的新型工作者。
他們在某種程度上,已經不符合對工程師的傳統定義,而是一批能夠掌握把握企業需求,然后落地成產品、把科學轉化為生產力的高技能人才。他們中的一部分將繼續成為更高級的工程技術人才,也有一小部分會在研發中總結規律,向科學家、基礎研發者的角色發展。 但毫無疑問,擁有來自實踐的豐富反饋,以及由此培養出的大批人才,最終幫我們畫完了騰訊AI體系的閉環。
而順便值得一提的是,騰訊還擁有豐富的多模態內容、復雜的場景與大量的需求,這些也都是催發創新、打磨技術的最佳實踐環境。
但問題的關鍵是,不是所有條件的具足,就自動能夠把“能力”變成“成績”,世上最難的事,就是通過無數次與不確定性的博弈,把現實變成最大的確定性。
雖然騰訊AI已經在數十、數百個行業中落地,但有待去探索的產業和領域卻是成千上萬,它們的需求、場景和痛點,是中國AI技術發展的豐厚土壤。以如此宏闊的未來圖景,我們相信包括騰訊在內的科技企業將有更大的作為,當他們進入全球的AI領導者行業之一,我們再為其加冕,似乎是一個更好的選擇。
原文標題 : 什么是中國AI趕超的正確姿勢?

最新活動更多
-
12月19日立即預約>> 【在線研討會】AI服務器中被動器件的應用介紹
-
12月22日立即下載>> 【精選白皮書】大功率機殼開關電源
-
12月28日火熱報名>> OFweek2023中國智造CIO在線峰會
-
12月31日立即試用>> 【企業專題】福祿克-全新專家級紅外熱像儀
-
4日18-19日立即報名 >> OFweek 2024(第十三屆)中國機器人產業大會
-
8月27-29日立刻報名>>> 2024年云計算展覽會
推薦專題
發表評論
請輸入評論內容...
請輸入評論/評論長度6~500個字
暫無評論
暫無評論