圖片來源 @視覺中國
文|腦極體
大家是不是對 GPT、對話式 AI、生成式 AI 之類的話題,已經有點審美疲勞了?
寫這篇文章之前,我有點猶豫,究竟還要不要接着讨論 GPT 了。最終決定寫,是覺得個人用戶、開發者,以及正在緊鑼密鼓訓大模型的 AI 公司和雲廠商,還是有必要提前琢磨一下這個事情——大模型能力要從雲入端,究竟什麽時候做、怎麽做?
AIGC 熱潮帶來 Web 複興,但大衆更愛移動端
我們看到,大多數基于大模型的 AIGC 應用,都選擇了 Web 端接入。
微軟第一時間推出了帶有對話(Chat)功能的必應(Bing),更新了 Edge 浏覽器,嵌入到 Microsoft 365 應用中。國内,高校機構推出的 MOSS(複旦大學)、SegGPT(智源),企業推出的文心一言(yiyan.baidu.com)、通義千問(tongyi.aliyun.com),都要從官網入口訪問。
圖像和視頻類的生成式 AI,比如 Midjourney、Stable Diffusion、DALLE2,以及視頻平台 Make-A-Video(Meta)、Imagen Video(谷歌)等,也是如此。
有業内人士認爲,生成式 AI 帶來了 Web 的複興。
當然 , 市面上也有通過小程序、App 等訪問的 AIGC 産品,大多通過調用基礎模型的 API 來提供服務。
但受限于網絡傳輸、算力等,領先的技術能力都不得不打折扣,比如隻能生成很短的一句話文本,手機 app 的作圖效果一般,加載速度很慢經常排隊掉線卡頓……
這是因爲大模型的大量計算,還是要通過雲服務來完成,Web 頁面的承載能力比較大,加載速度快,還不用考慮流量損耗。
所以,想體驗大模型強大的能力,目前還是以 PC Web 端 + 雲服務更佳。
但是,大模型的商業化潛力,還是在移動端。
大家可能都記得,去年底 AI 作圖就火爆過,意間 AI 繪畫、YUAN 初等多款具有 AI 作圖功能的移動端小程序,用戶量和付費激增。意間 AI 繪畫的官方數據顯示,上線不到兩個月,用戶量增長了 117 萬人。
大部分人也都更希望,便捷、低門檻地體驗 AIGC。要使用 GPT-4、New bing、DALLE 等應用,注冊、登錄、付費的一系列操作,都非常麻煩,勸退了不少人。
國内的大模型應用,移動端也明顯很受期待。比如就有人抓住了 " 官方沒有 app" 這個 " 時間差 ",造出了 " 文心一言 " 盜版 App,吓得百度趕緊出來聲明:凡是在 App Store 和各種應用商店看到的 " 文心一言 "App 都是假的,凡是 " 文心一言 " 收費下載、付費會員都是騙子!
顯而易見,場景化、輕量化的移動端應用,用戶又喜歡,又能付費賺到錢,如果官方不搞,投機客 / 騙子都要來搞。
無論是從用戶體驗的角度,還是大模型服務普及化的需要,以及回收訓練成本的商業化考量,移動端應用都是一塊不能輕言放棄的陣地。
既然如此,爲什麽各大基礎模型服務商,就是不早點抓住這個機會呢?我們什麽時候才能用上和 Web 版一樣強大的移動 AI 應用呢?
千呼萬喚不出來,基礎模型服務商在想啥?
基礎大模型的服務商,比如 OpenAI、谷歌、百度、阿裏以及各類研究院所,就是不去吃移動端應用這塊蛋糕。
除了大家都知道的移動端側計算能力限制之外,還有其他考量:
1. 産品。基礎模型往往技術和能力比較超前,産品化不是最優先考慮的,尤其移動端應用要适配各種系統、機型、配置,更不可能投入太大的人力、物力。
OpenAI 的聯合創始人 Sam Altman 就說過,ChatGPT 是一個糟糕的産品,隻是這個産品蘊含着很大價值,所以人們願意忍受。覺得 Web 不好用?那你先忍忍吧。
2. 用戶。别看全民熱議生成式 AI,但真正堅持使用并願意付費的,還是一小撮早期客戶,包括技術狂熱者和專業人士,比如程序員、插畫師。
他們大多會将生成式 AI 當作生産力工具,用于研究、編程、辦公、設計、遊戲制作、軟件開發等,還要跟其他專業軟件相結合來使用,比如生成圖片之後再通過 Photoshop 增強,還是要用到 PC、一體機等設備,PC Web 端比移動 App 有更強的可編輯性,更能滿足這部分群體的需求。
3. 商業化。目前基礎大模型的商業模式,以 API 爲主,需要一定的開發經驗,更适合極客和開發者,深度開發集成部署等工作,很少會通過移動端來完成,所以模型服務商自然也就沒有緊鑼密鼓去适配移動端的動力。
大模型千帆競渡,移動端是商業化必争之地
既然如此,爲什麽還要做移動端呢?一個很表層的答案是:大衆需要。
能夠真正引發全民體驗熱潮的,還是那些能夠通過社交軟件分享、小程序、App 等形式,低成本快速觸達的能力,不需要什麽 " 智能湧現 ",更在乎有趣、好玩。
往深了說,大模型技術被視爲 " 新工業革命 " 的引擎,要發揮效應,必須将技術能力更好地集成到産品和服務中去。此時,移動端能夠提供至少三重價值:
第一,規模落地。
中國互聯網絡信息中心發布第 51 次《中國互聯網絡發展狀況統計報告》中,我國 10.67 億網民,使用手機上網的比例爲 99.8%,移動端用戶已經遠遠超過了 PC 端的用戶,要提升生成式 AI 的應用範圍,移動端應用必不可少。
第二,商業潛力。
高科技行業的主流市場,是由 " 實用主義者 " 組成的,相比技術的前沿性、炫酷感,他們更看重技術解決方案的可靠、穩定、性價比、配套服務等。移動端的廣泛普及度、即時訪問、便捷低成本的優勢,可以讓 AI 以更短的路徑觸達用戶,在移動端應用 AI 技術是大勢所趨。
開發者眼中的 AIGC 應用是這樣的:
(OpenAI 發布會演示的編程能力)
大衆眼中的 AIGC 應用是這樣的:
(某 GPT 類應用平台截圖)
第三,市場壁壘。
大模型的商業化路徑之一,是走向産業,走向 ToB,将大模型能力封裝爲 AI 解決方案,參與到千行百業的數字化、智能化進程中。
如今頭部科技公司、雲廠商都在煉大模型,很多直接對标 GPT-3.5,沒有顯著的差異化價值,很難與業界領先水平拉開差距。
雲廠商要打開 ToB 市場,移動端應用工具與能力是非常有吸引力的。近年來,不僅消費類、服務型企業,在不斷加強移動端側的布局和産品能力,一些傳統的企業和機構,比如工業制造、政務銀行等,無論是在内部生産管理中移動化,也推出了更多移動應用來更好地服務終端用戶。如果直接在雲上端到端用好大模型,比如訓練開發環節直接調用雲端的大模型和 AI 算力資源,完成後,一鍵分發到智能手機等終端上,可以大大減少工作量。
互聯網的演進之路,已經說明,無論 To B 還是 To C 行業,都在追求越來越集約精簡的終端硬件、越來越低門檻的交互入口、越來越輕盈的軟件應用。
所以說,大模型從雲入端,是模型服務商實現商業化的必争之地。
從雲入端,一條天路
高瞻遠矚如 OpenAI 和 DeepMind,照樣有商業化的要求。賺錢嘛,不寒摻。可是,大模型由雲入端,這個錢還真沒那麽好賺。非不爲也,實不能也。
雲計算、AI 能力要進入移動終端設備,所面對的是一條天路:
首先,一些大型的生成式 AI 應用,運行環境在雲上,要經過網絡傳輸,而移動端的設備能力、網絡環境,是很多樣且不穩定的,比如從 5G 蜂窩網絡轉移到室内寬帶,或者在高架橋、地鐵等特殊環境,都有可能讓生成過程中斷或失敗,影響到端側體驗。
其次,生成式 AI 應用的計算量比較大,在端側加載渲染運行時,比如智能手機 CPU 會有比較高的負載,出現卡頓、發熱、電量損耗等情況,如果讓 AI 改一篇文檔畫一張圖就咔咔掉電,當然不能接受。
此外,把 AI 深度集成到業務中,必須通過雲計算,而雲端開發環境和端側是不同的操作系統。這意味着,開發者要進行二次開發或叠代開發,完成之後才能進行不同終端下的觸達,同事要考慮不同終端的兼容性,這就提升了 AI 雲應用的風險成本、人力成本、時間成本。要保證集成之後的應用效果,需要雲平台有一整套完整的産品服務和工具來支撐快速搭建、驗證、部署分發。
另外,雲側和端側的架構不同,也導緻算力割裂,雲端一體的 AI 應用開發要充分結合端側算力和雲上算力,一部分應用場景搭建在端,一部分搭建在雲,這就給雲廠商帶來了比較大的技術難題:如何提供穩定一緻的底層環境?
天路難行亦需行。大家都知道,雲計算靠基礎設施 IaaS 層是很難賺到錢的,雲廠商煉大模型,本質上是希望提升軟件的先進性,進而調動 SaaS 服務的商業價值。
要讓個人用戶和企業,都得到簡單、易用、低門檻的大模型能力,雲廠商不僅要訓練基礎模型,還需要在産業鏈上遊,就解決 AI 應用從雲到端的一系列技術難題,爲開發者和産業用戶提供移動 AI 開發能力,才能讓大模型在端側爆發。
各種形态的大模型應用百花齊放,這個新技術才能真正迎來商業化的奇點。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App