沒繃住,vivo提前「洩密」大模型能力
明敏蕭簫發自凹非寺
量子位元| 公眾號QbitAI
還是發售即可用那種──新版手機系統直接搭載,不整虛的。
要知道,雖然國產大模型百花齊放,但手機端"百模大戰",可以說是才剛進入熱身階段。
自研大模型的手機廠商已有不少,但真正裝進手機系統中的,還幾乎沒有。
搞出這個大新聞的,正是已連續兩年國內份額第一的藍廠vivo。
前段時間,vivo悄悄自研手機AI大模型的消息傳得沸沸揚揚,如今靴子落地,官員宣定檔11月1日vivo開發者大會,上機新版系統OriginOS 4 。
從vivo負責人劇透的訊息中,可以窺見三個要點:
- 一口氣發布5個大模型
- 大模型嵌入手機,當助理還會畫畫
- 70億版本大模型,對產業開放可用
vivo副總裁、全球AI研究院院長周圍,也提前兩週在微博上「洩漏」了一番大模型的能力:
一套連貫操作下來,網友先激動了。
還有網友已經在幻想工作量驟減的場景了。
所以,這番vivo官宣大模型,究竟放了哪些訊號?具體到手機端上,又會帶來哪些功能的改變?
vivo大模型,哪些訊號已劇透?
先來看看vivo大模型的曝光資訊。
vivo新版自研大模型,取名為vivoLM 。
這次發布的vivoLM一共有5個版本,參數量分成十億(1B/7B) 、百億(66B)和千億(130B/175B)三個等級。
無論是70億大模型版本,還是參數量更大的版本,vivoLM都已經提前在兩大中文大模型評測榜單C-Eval和CMMLU上「刷榜」了一波。
在C-Eval榜單上,vivoLM取得了平均82.3分的榜一成績,尤其在STEM、人文學科上表現突出;
而在CMMLU榜單上,無論是Five-shot(僅給5個樣本示例)還是Zero-shot(0樣本示例),vivoLM-7B版本都佔據了TOP 1,並同樣在人文學科上"一騎絕塵」。
值得一提的是,登頂CMMLU榜單的vivoLM-7B即70億版本大模型,正是vivoLM將對外開放的版本。
當然,無論是哪個版本,vivoLM這次發布的目的都非常明確——
放進vivo最新版本的手機系統OriginOS 4中,作為手機助理感知使用者需求、辨識意圖並輔助決策。
但眾所周知,相較於其他應用領域,手機端其實是大模型最難落地的場景之一。
一方面,受體積、耗電量所限,手機端側算力相比雲端算力「少得可憐」。
以「大」著稱的大模型,如果直接部署在端側,往往難以取得較好的使用效果,即使能運行起來,推理速度也不及預期,按周圍的話來說就是:
如果做輸入法的出詞推薦, 2秒才能出一個字。
但縮小模型體積,效果一定會打折扣。
另一方面,如果將大模式直接上傳到雲端連網使用,又會失去端側部署的優勢。
例如,大模型原本可以根據用戶信息,在手機上個性化定製手機助理,並確保信息不上傳到雲端;但如果大模型在雲端加載,勢必要將個人信息通過網絡上傳,隱私安全無法保障。
除此之外,雲端運行大模型的成本非常高。周圍介紹稱:
vivo有3億中國大陸用戶,如果每天用10次,一天的運算成本大概是3000萬元,一年需要花費約900-100億元。
vivo究竟是怎麼將大模型部署到手機端的?
從vivoLM已劇透的大模型參數設定、以及目前已有的一些大模型運行研究來看,或許能推測出其中用到的一些「技巧」。
技巧之一,在於大模型的參數設計,不同的參數量級,分別用來處理不同的任務。
其中,最小的大模型,包括10億和70億參數的模型,可以直接部署在端側,確保耗電量不高。
當涉及使用者資訊等個人化任務需求時,可以用這類大模型來完成,例如一鍵將備忘錄內容加入行事曆、並設定鬧鐘提醒。
較大的大模型,如660億、1300億和1750億參數的大模型,則根據任務難度來決定呼叫情況。
畢竟從目前學界公認的說法來看,大模型「智力湧現」所需的參數量級,幾百億足矣。
像是用超大模型如GPT-4來總結電子郵件的行為,就一直被調侃為「開蘭博基尼送披薩」。 (手動狗頭)
所以,遇上「難度係數較低」的任務時,可以切換更小的模型來進行,更複雜的如對上下文長度和輸出效果要求更高的任務,再調用千億參數大模型來完成。
技巧之二,在於大模型的運作方式,不依賴單一算力,而是雲端協同的方式兼顧運行速度與體驗。
目前,數千億的大模型尚難以部署到手機端,即使能部署,運行速度和耗電量也無法接受。
至少從目前業界已有研究來看,靠端雲協同的方式來運行大模型並非不可能之事。
以Google和DeepMind同時推出的投機採樣(speculative sampling/decoding)為例,這項技術就能在提升大模型推理速度的同時,確保產生效果。
具體而言,它將一個大模型和一個較小的大模型(draft模型)進行組合,來解決大模型推理時的「記憶體限制」問題。
然而,這個較小的模型並非"隨便就能找到",它必須和大模型"配套",例如接口要統一、概率分佈也要接近等。
vivoLM這5個大模型如果相互"配套",就能運用類似技術來實現端雲協同的效果:大模型在雲端進行計算,更小的模型則放在端側運行,能節省相當的推理成本。
這套大小組合拳頭下來,搭載大模型的vivo手機新系統會擁有什麼新功能,似乎也能管中窺豹一番。
使用方法上,vivoLM目測會以語音助理的形式作為入口,作為全機的「智慧助理」隨叫隨到;
具體功能上,又主要可能分為三大類:
生成類別任務,如郵件智能撰寫、AI頭像生成等;
複雜任務調度,如一鍵總結通話內容、設定特定使用場景等;
意圖理解,如依模糊需求客製差旅等。
隨著大模型的不斷"進化",更豐富的功能還會出現。周圍認為:
大模型在手機上的應用,有輔助智慧和主動智慧兩個應用階段。在主動智能階段,還有相對高階的呈現。
所以,vivo搭載大模型的新系統,究竟是否值得期待一波?
為什麼值得期待?
最直接的原因當然是玩手機可以更爽了。
而這也順勢把更多人推入最新一波科技浪潮中,擁抱大模型,實際感受AI影響下人機互動的變革。
更深層的原因則在於,vivo作為頭部手機廠商自研大模型,本身就令人期待。
其一,vivo自研AI大模型一定是使用者導向的。
它有明確的應用程式落地場景-手機;清晰的目標-用AI重塑作業系統。
這使得vivo自研大模型將會天生和手機作業系統更加適配,從而能激發出大模型在端側應用的更多潛力。
其二,vivo本身有著紮實自研功底,在AI領域更是深耕多年。
如今一朝推出自研大模型,不僅是研發實力的再一次自證,更能從這項成果中窺探出vivo對於最新技術趨勢的理解。
vivo的AI策略最快起始於2017年,vivo創辦人兼總裁沈煒當時提出:
人工智慧是所有技術創新的最底層技術,在未來很長一段時間,我們都應該去「過度飽和」的投入。
vivo人工智慧全球研究院也在這一年開始籌備,2018年正式成立。
由此vivo也成為首批設立專攻人工智慧方向研究院的中國手機公司之一。
數據顯示,自成立起至今,vivo AI研究院就維持著千人規模的研發團隊。到2021年,vivo已有超過600人專注研發大模型。
自2018年以來,vivo累計在頂級期刊發表高水準論文70餘篇,並持續將頂尖學術成果轉化為演算法和工程應用。
同時也成立了圖譜研究院,透過專業團隊建立知識圖譜,目前已累積2800TB資料。
△vivo副總裁、全球AI研究院院長周圍
而在AI之外,vivo在晶片、系統軟體、影像演算法等方面的自研實力同樣不俗。
從2021年至今,vivo自研影像晶片已推出三代。
最新一代V3採用6nm流程,在安卓手機上實現了首次4K電影人像影片和4K級拍後編輯。
而且還能實現大量自研影像演算法同時開啟的效果。
如AI降噪、MEMC插幀演算法、HDR技術以及影像變焦演算法等,V3都能同時處理,並將延遲保持在使用者可接受範圍內。
系統軟體方面,vivo在安卓系統上提出了自己的理解:OriginOS,讓系統互動和設計更人性化。
例如按讚頗多的原子通知和原子組件,就很好體現了OriginOS更直覺的互動邏輯,透過點、觸、滑動能直接使用組件功能。
OriginOS 3中的側邊欄,具備場景辨識能力,能根據使用者正在瀏覽的介面,在側邊欄中配對所需的應用程式。
此外,vivo也將許多創新技術注入OriginOS,從系統更底層帶來更絲滑、更流暢的操作體驗。
OriginOS的智算中樞基於上中下三層框架創新,底層實現基礎能力突破、中層對資源調度優化、上層升級視覺與操控感知。
還自研了"不公平調度",可實現系統資源優先調度至前台,暫緩後台需求,提升運行流暢度。
在更尖端的技術探索上,vivo的佈局也相當超前。
例如vivo從2019年開始就已經啟動了6G項目,2020年10月發布6G系列白皮書,2022年對外展示一系列6G核心技術原型機。包括通信感知一體化的無線呼吸監測與目標測距測速,基於反向散射的極低功耗通信,以及AI通信四台原型機。
而且這些在6G上的研發投入還號稱"不設預算上限,該投多少就投多少。"
△通訊感知一體化-目標測距測速原型樣機
綜上,vivo自研大模型,確實值得期待。
不僅因為它是另一個快速跟進大模型趨勢的頭部手機廠商,更在於vivo有著對手機場景的深刻理解,同時還具備可觀的技術儲備和自研能力。
它的大模型答案卷能直接影響到一般用戶,也為業界帶來了一份新的理解和參考,甚至也為推動大模型趨勢向端側發展做出貢獻。
vivo自研AI大模型意味著什麼?
首先對一般人來說,一個有大模型打底的手機作業系統,幾乎是最方便擁抱大模型的入口。
最新一輪科技趨勢席捲而來,試問誰不想快速嚐鮮、跟上潮流、甚至用科技改變生活?
但大模型的使用確實還存在著一定門檻。而且對很多人來說,最新技術該怎麼用、用在哪,都還是個問題。
而手機剛好能成為一個連接大模型和普通人的平台,並且直接提供了使用場景,操作門檻也不高。
由此,新一代人機互動的底層邏輯,不知不覺滲透到了大眾群體之中。
其次對產業而言,vivo入局大模型不是意料之外,而是必然使命。
ChatGPT帶起產業趨勢後,人們對於超級AI助理的想像更加具體了,鋼鐵人的賈維斯也在過去一段時間內被反覆討論。
回到現實來看,離這角色最近的,不正是手機裡的語音助理嗎?所以對於手機產業來說,給語音助理注入大模型能力,幾乎是水到渠成的事。
但並不代表這件事很簡單。
如何讓一般使用者能深切感受到大模型的能力?如何與上一代語音助理明顯區分?如何實現真正意義上的更便利、更有效率?這些模糊要求背後,需要一個明確的行動目標和具體技術作為支撐。
誰有能力搞定這些問題?
當然是既懂AI、又懂手機,還要能一線觸及廣大普通消費者的那個廠商,vivo是會被想到的名字之一。
Canalys報告顯示,今年第二季度,vivo以18%市佔率位列國內智慧型手機市場榜首。
作為頭部廠商,vivo更徹底、更全面連接大型模型能力,不僅是對自家產品的重大升級,也是對產業發展的正向推動。
大模型趨勢為當下發展成熟的手機產業帶來了新成長點,如何抓住趨勢、快速跟進,也要看各廠商具體的行動。
從vivo的最新動向裡不難看出:
- 第一,vivo肯定大模型趨勢,決定躬身入局;
- 第二,vivo認為這會是一場全行業的行動,由此它們在發布大模型的同時,還要將70億參數版本模型的能力貢獻出來,把訓練的能力、調優的能力、各個行業數據熱拔插的能力,全部整合起來、貢獻出來。
更進一步,vivo也為業界帶來了自己的理解。
周圍先前在採訪中透露:
vivo從3-5年的角度去看行業可能出現的衝突和難題:大模型應用如果要解決成本的問題就要上端,如果要上端的話就要解決系統最小權限和算力以及最重要的內存資源的問題。
另外,要解決大家私有化、核心競爭力自我保護的問題,未來vivo將拿出解決方案,貢獻給產業。
而透過這樣的理解和規劃,也不難下一個結論:
vivo入局大模型趨勢,更是為自己創造新的成長點。
結合產業近況不難發現,大模型的端側應用競爭已露出苗頭。各大手機廠商紛紛押注大模型,自研也好、合作也罷,總之是要先在賽道中搶佔優勢身位。
但入局只是完成了起跑。
畢竟大模型的應用落地,如何持續迭代、不斷優化、提升體驗更為關鍵,稍有不慎可能就會被彎道反超。這無疑對團隊的技術研發能力、產品理解能力和趨勢洞察能力都提出了更高要求。
所以,大模型端側應用趨勢的到來,不僅為手機產業帶來新的成長週期,更帶來了一個涵蓋全產業的技術升級週期。
也怪不得有人提出,今年大模型重塑搜尋引擎,明年或許就要重塑端側了。這也讓人更加期待由手機廠商自研的大模型,會帶來哪些新改變?
11月1日,vivo自研大模型將正式與大家會面。
你期待看到哪些升級和改變?歡迎評論區討論~
— 完—
量子位QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態
留言
發佈留言