• <menu id="8s4wy"><tt id="8s4wy"></tt></menu>
    <tt id="8s4wy"><menu id="8s4wy"></menu></tt>
  • <table id="8s4wy"><table id="8s4wy"></table></table><table id="8s4wy"></table>
  • <table id="8s4wy"><td id="8s4wy"></td></table>
  • <table id="8s4wy"><xmp id="8s4wy">
  • <xmp id="8s4wy">
    <xmp id="8s4wy"><xmp id="8s4wy"><xmp id="8s4wy">
  • <tt id="8s4wy"><xmp id="8s4wy"><table id="8s4wy"></table><menu id="8s4wy"></menu>
  • <xmp id="8s4wy">
    訂閱
    糾錯
    加入自媒體

    GPT-4、百度文心一言擺擂,AI大模型將掀起新一輪AIGC軍備競賽?

    2023-03-21 15:13
    科技云報道
    關注

    一覺醒來,萬眾期待的GPT-4來了。OpenAI老板SamAltman直接開門見山地介紹說:“這是我們迄今為止功能最強大的模型!”僅隔一天,“中國版ChatGPT”百度文心一言正式發布,雙方大有擺擂之勢。

    當深度學習推動AI技術又一次復興,人類對它的最高期待,就是讓AI成為第四次產業革命中的“蒸汽機”。而近幾年身處智能革命前沿的,就是預訓練大模型。

    ChatGPT的橫空出世,不僅在科技圈引起嘩然,更是點燃了創投圈的創業激情。國內企業的大規模預訓練模型(以下簡稱“大模型”)賽道也已經開始進入白熱化的競爭階段。在過去的兩周內,諸多以AI大模型為技術底層的廠商,開始獲得資本的青睞。

    那么,AI大模型目前的主要技術路徑是怎樣的?在產業側的成長如何?

    “通用大模型+產業模型”的技術路徑

    必須正視的是,全球大模型競賽中,我們看到大模型的參數越來越大,數據集記錄不斷被刷新。

    “在各種專業和學術基準上和人類相當。”對于剛剛發布的GPT-4,OpenAI對于其表現相當滿意。OpenAI在官網表示,GPT-4是一個能接受圖像和文本輸入,并輸出文本的多模態模型,是OpenAI在擴展深度學習方面的最新里程碑。

    從性能表現看,GPT-4的語言理解和生成能力均超過了ChatGPT,可以解答ChatGPT無法完成的問題,同時GPT-4可以描述并理解圖片,并且可接受的文字輸入長度也增加到約2.4萬個單詞。

    升級之后,GPT-4在各種職業和學術考試上表現和人類水平相當。比如模擬律師考試,GPT-4取得了前10%的好成績,相比之下GPT-3.5是倒數10%。做美國高考SAT試題,GPT-4也在閱讀寫作中拿下710分高分、數學700分(滿分800)。

    但真正的產業空間里,卻很難看到大模型規;、標準化應用。這可能是因為大模型與行業知識不相匹配,行業算力基礎難以負載大模型部署等等問題。

    過去多年的一個市場共識是,如果要實現AI規;a業落地,底層AI大模型就必須是一個通用的大模型平臺,廠商根據用戶需求在平臺之上,進行多場景、多領域的模型生產,從而實現具體行業模型的落地。

    對于廠商而言,這也是一個新的方向。即AI廠商以“通用模型+產業模型”不斷賦能企業、產業,從而加速中國的產業數字化進程。

    更為重要的是,這種模式一旦落地成功或將快速實現規;,或將為頭部AI廠商帶來高回報,擺脫當下AI技術落地難,盈利難的現狀。

    底層AI大模型的研發具有數據規模大、質量參差不齊、模型體積大、訓練難度高、算力規模大、性能要求高等挑戰。這樣的高研發門檻,不利于人工智能技術在千行百業的推廣。

    而具有數據、算力、算法綜合優勢的企業可以將模型的復雜生產過程封裝起來,通過低門檻、高效率的生產平臺,向千行百業提供大模型服務。

    各個行業的企業只需要通過生產平臺提出在實際AI應用中的具體需求,生產大模型的少數企業就能夠根據應用場景進一步對大模型開發訓練,幫助應用方實現大模型的精調,以達到各行業對于AI模型的直接應用。彼時,AI大模型就會真正意義上實現產業化,成為產業模型。

    目前,國內布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業,正在不斷夯實通用大模型,打造產業模型,助力AI大模型產業化。其中,百度以文心大模型+飛槳PaddlePaddle深度學習平臺;騰訊以HunYuan大模型+太極機器學習平臺;阿里以通義大模型+M6-OFA;華為以盤古大模型+ModelArts,都打造了自然語言處理大模型、計算機視覺大模型以及多模態大模型方面。

    值得注意的是,各個廠商AI大模型的布局,有所差異。

    百度由于多年在AI領域的深耕,其文心大模型涵蓋基礎大模型、任務大模型、行業大模型的三級體系,打造大模型總量約40個,產業應用也較為廣泛,例如電力、燃氣、金融、航天等,構建了國內業界較大的產業大模型。目前來看,屬于國內大模型廠商的第一梯隊中的佼佼者。

    騰訊產業化應用方向則主要是騰訊自身生態的降本增效,其中廣告類應用表現出色。阿里更重技術,例如M6大模型基于阿里云、達摩院打造的硬件優勢,可將大模型所需算力壓縮到極致;另外其底層技術優勢還有利于構建AI的統一底層。目前,主要應用方向是為下游任務提質增效,例如在淘寶服飾類搜索場景中實現了以文搜圖的跨模態搜索。

    華為的優勢則在于其訓練出業界首個2000億參數以中文為核心的預訓練生成語言模型。目前發布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項較為重磅的行業大模型。

    可以發現,在商業模式上各個廠商都是通用大模型路徑,在通用大模型架構之上,搭建具體行業模型。映射到產業層面,即“通用大模型+產業模型”的路徑。

    然而,手握入場券,并不代表能跑到終點。對于廠商而言,其可以搭建通用大模型,并不意味著其能把通用大模型搭建的好;其有能力打通大模型到產業模型到具體場景的應用,并不意味著其可以打造出有真正價值的智能決策。AI大模型產業化落地的瓶頸需要被正視。

    首先,國內大模型缺少數據訓練場景。類似ChatGPT的訓練場景尤為缺乏。ChatGPT之所以短時間之內進步神速,因大量用戶為其充當了免費的數據標注員。不過,已目前情況來看,可與ChatGPT相較的數據訓練場景在國內還鮮有見到。

    其次,產業界對大模型有著濃烈的觀望情緒。業界普遍存在這樣的憂慮:目前大模型應用不成熟,驟而上馬將會對原有業務造成沖擊。以電商售后和銀行電話客服場景為例,目前行業內仍采用主流智能客服公司推出的QA問答庫技術?蛻羝髽I希冀大模型產品能夠解決QA庫無法承擔的長尾問題,覆蓋到檢索式問答路徑無法涉足的領域,但金融行業的語料庫等數據又不對外開放,讓大模型企業不得不重頭開始。這都延遲了大模型進軍具體行業的時間表。

    總結而言,通用智能企業需要客單價高、數據訓練場景豐富的派單需求,但這個問題又與企業的現實考量和預算投入相互矛盾。沒得數據用來訓練、沒有大錢養活產品,是擺在現實的兩大難題。

    一場屬于巨頭的游戲

    如今,在大模型賽道中,擠滿了巨頭派、海歸派、創業公司轉型派、學院派等各路選手。搶占大模型賽道頭牌的戰爭已經徹底打響,但花落誰家還尚未可知。目前,谷歌、微軟、亞馬遜、百度、阿里、騰訊等科技巨頭公司在大模型發展方面具有顯著的優勢,均有相關雄厚的技術資源和能力,且都在通用大模型上進行了布局與投資。

    總體而言,大模型的分水嶺主要集中在技術研發、數據和算法資源、商業化能力、人才儲備和管理能力四個方面。

    首先,在技術研發能力方面。就目前來看,巨頭擁有更強的技術研發能力和更豐富的資源,可以投入更多的人力、物力和財力來開展大模型的研究和開發。他們擁有更完善的數據、算法和硬件等技術支持,能夠更快速地推進大模型的研究和應用。

    對比巨頭和創業公司,技術上的差距在一定程度上取決于人工智能領域內的領先者和后來者。巨頭公司如Google、Facebook、Microsoft等在人工智能領域擁有大量的數據、計算資源和技術經驗,因此有更多的能力來訓練和優化大模型,推動人工智能技術的發展。

    其次,在數據和算法資源方面,巨頭擁有更豐富和更完善的數據和算法資源,能夠更好地支持大模型的訓練和推理。他們能夠利用自身的平臺和業務優勢來積累海量的數據,并在此基礎上進行算法研發和優化。而創業公司通常無法獲得這樣的數據和算法資源,需要通過自己的努力來積累數據和優化算法,這需要更多的時間和精力。

    以OpenAI發布于2020年的GPT-3來看,其具有1750億個參數的大模型。在算力方面,人工智能模型的訓練和使用需要強大的算力,這就需要大量高性能的GPU來支撐。在數據方面,據了解,ChatGPT的訓練使用了大約45TB數據,其中包含多達近1萬億個單詞的文本內容。

    但是,由于大型模型需要大量的計算和存儲資源,對于初創公司來說,資金和技術限制可能成為了限制因素。

    另外,在商業化能力方面,巨頭擁有更強的商業化能力和更完善的商業化渠道,能夠更好地將大模型應用于商業領域,實現商業價值。他們可以借助自身的品牌和用戶基礎,將大模型應用于搜索、推薦、廣告等領域,并實現商業化變現。由于創業公司大多缺乏這樣的商業化能力和渠道,需要花費更多的時間和精力來探索商業化路徑和拓展商業合作。

    最后,在人才儲備和管理能力方面,巨頭擁有更強的人才儲備和更完善的管理能力,能夠更好地吸引和管理高端人才,構建更具競爭力的團隊。他們可以通過自身的品牌和聲譽,吸引到更多的高端人才,并通過自身的管理經驗和制度建設,提升團隊的協作效率和創新能力。而創業公司通常需要付出更多的努力來構建高端團隊和提升管理能力。

    雖然,隨著技術的不斷成熟,越來越多的創業公司也開始利用云計算、分布式計算等技術來加速大模型的訓練和優化,不斷挑戰巨頭公司的技術壟斷。創業公司在人工智能領域也有很多機會,但需要更多的創新和勇氣來打破技術壁壘和市場壟斷。

    總之,大模型作為人工智能領域內的重要技術,已經成為了熱門的創業領域。巨頭公司擁有更多的資源和技術經驗,而創業公司面對這個“燒錢”的領域,不宜盲目跟風,可以通過創新和勇氣來不斷挑戰技術壟斷,找到適合自己的業務發展之路。

    【科技云報道原創】

    轉載請注明“科技云報道”并附本文鏈接

           原文標題 : GPT-4、百度文心一言擺擂,AI大模型將掀起新一輪AIGC軍備競賽?

    聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

    發表評論

    0條評論,0人參與

    請輸入評論內容...

    請輸入評論/評論長度6~500個字

    您提交的評論過于頻繁,請輸入驗證碼繼續

    暫無評論

    暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號

    玩肥熟老妇bbw视频
  • <menu id="8s4wy"><tt id="8s4wy"></tt></menu>
    <tt id="8s4wy"><menu id="8s4wy"></menu></tt>
  • <table id="8s4wy"><table id="8s4wy"></table></table><table id="8s4wy"></table>
  • <table id="8s4wy"><td id="8s4wy"></td></table>
  • <table id="8s4wy"><xmp id="8s4wy">
  • <xmp id="8s4wy">
    <xmp id="8s4wy"><xmp id="8s4wy"><xmp id="8s4wy">
  • <tt id="8s4wy"><xmp id="8s4wy"><table id="8s4wy"></table><menu id="8s4wy"></menu>
  • <xmp id="8s4wy">