自從 ChatGPT 發布之後,大語言模型一時成爲新的風口,不論國内國外,大家都在部署自己的 LLM 模型。本質上 LLM 是一個可以在衆多領域使用的模型,但大家都這麽玩,容易成爲垂直領域的産品。還是說有更好的發展方向呢?這篇文章,作者爲我們解讀,希望對你有所幫助。
本篇圍繞大模型在生态中的形态預測、大模型帶來的交互變化、應用層産品可能性、投身 AI 産品的建議聊了聊~歡迎閱讀交流~
一、大模型未來會成爲?
關于 LLM 的猜想衆多,有說大模型可能成爲下一代操作系統的,有說可以成爲新一代底層技術設施、有說可以成爲萬物終端的。這裏的出發點主要在于對大模型未來形态的思考。
我的判斷是首先 LLM 帶來的能力會作爲底層通用技術對上層軟硬件産生影響,同時會出現一群圍繞大模型基礎能力構建的生态,也就是很多文章中說的「中間件」和「Apps」。
這裏順帶解釋下很多文章中出現的「中間件」和「AI Infra」的含義。
AI 中間件,是指在 AI 應用程序和底層基礎設施之間提供中介服務的軟件,包括模型訓練框架、推理引擎、數據處理工具等,它們可以提供人工智能應用程序所需的功能和服務,同時簡化了開發和部署過程。
Infra(Infrastructure),是指基礎設施或基礎架構,在大模型的生态系統中,Infra 通常指的是爲支持大模型訓練和部署而構建的各種底層技術設施,包括處理器、操作系統、存儲系統、網絡基礎設施、雲計算平台等等。
AI Infra 是提供 AI 中間件所需要的底層基礎設施的一部分。
一些公司的大模型會作爲終端能力接入各種軟硬件設備,這裏最容易實現的有 Google、微軟、蘋果(雖然還沒有自己的大模型)、華爲、百度這樣的公司。
大模型的競争也将帶來操作系統、軟件市場、終端市場(特别是極度依賴多模态交互輸入、輸出的設備,如音箱、手表、車載 HMI、MR)的競争格局變化,
但 LLM 本身很難獨立成爲 OS 級别的系統,這受限于幾點:
純 CUI/VUI 的交互輸入局限性、人們還是需要鼠标、(軟、硬)鍵盤這樣的設備輔助輸入;
輸入産生精力消耗,娛樂性質的刷推薦 feeds、訂閱流仍會是大部分人的主要訴求;
來自當前 OS 系統的防禦,也就是上面提到的巨頭公司們;
開放的平台和生态建立難:成爲 OS 級别的系統需要有足夠的開放性和可擴展性,以支持不同類型的應用和場景。需要有完善的生态系統和開發者社區的支持,才能吸引開發者輕松地創建和集成;
短時間内難以形成一家獨大的局勢:不論國内還是國外,投身 LLM 戰場厮殺的巨頭有很多,未來幾年内很難如 PC、手機操作系統形成部分頭部穩定主導的場面,開發者也就不會專注在一個模型上做能力補充,而是更傾向于做獨立的,不完全依附單個 LLM 能力的産品(也就是傾向于做 API 可換甚至接入多個 API 的應用而非爲單個 LLM 建立 Plugin)
Perfect Prompt — 能夠給出不同模型在同一場景下的回複。
也許會有人做這個方向,純 LLM 的 OS 系統 受衆和應用場景都比較受限。
以上判斷基于當前的 AI 能力,也僅代表個人見解,如有不同看法歡迎讨論~
二、大模型帶來的交互變化
判斷的基本邏輯在于:
交互的本質是輸入和輸出,大模型并沒有帶來信息格式的變化,而是加速了信息的生産和交流。
大模型帶來的能力強化主要有文本(這裏如果不局限于 LLM,就還有圖像、視頻)理解能力、文本生成能力、總結和歸納能力、翻譯能力等。
1. 交互鏈條變短
這也是自然語言交互被增強帶來的最顯著優勢,這點能夠直接打破現有産品交互的局限性。或者輔助用戶決策、完成機械的流程化任務。
表現 1 – 輸出結果:不用通過搜索在衆多的反饋中找目标,而是直達結果。
對應場景:任何使用搜索的任務,機票、酒店、某個解決問題的答案等。
表現 2 – 輸入内容:多個意圖能夠被一次性處理,縮短中間流程。
對應場景:總結所有參會人的空閑時間,尋找合适的會議室,生成一場新的會議邀請。
也就是說,傳統設計領域緻力于在有限的條件下幫助用戶梳理到達目的地的最佳路徑,爲用戶清除流程上的障礙。而現在可以通過 AI 技術去大幅優化現有産品的交互流程,同時縮短輸入和輸出過程,對傳統的交互方案帶來颠覆性的改善。
不過我對「産品 CUI 化」也保持謹慎,CUI 隻是降低了一定的門檻," 持續對話 " 其實非常耗費腦力和精力,如果能點個按鈕就完成的事情,要 CUI 反而會将問題複雜化。
2. 改變輸入方式
更多場景可以轉變爲 CUI、甚至 VUI 。
案例 1:在一些政務服務場景,如果能夠通過對話的方式一步步引導填寫,對老年群體會更友好,同時填寫方式可以簡化成語言輸入;
複雜表單填寫中的一些錯誤提示也許可以通過對話的方式引導補充。
案例 2:Prompt 命令生成圖像 / 視頻 / 音樂
Adobe firefly beta
但是目前看來,受限于大模型應用的理解能力,用戶輕松駕馭 Prompt 還存在門檻(即弄清楚自己的需求 并懂得如何用 prompt 表達需求),輸入方式還沒有得到極緻的簡化和易用。不過已經有一些應用開始補齊這方面的體驗。
Hayo —— 米哈遊旗下 AI 社區
3. 信息反饋更多維
Chat GPT 已經可以将信息組成新的格式,如表格、代碼等;GPT 4 能夠直接理解并處理圖像上的文本信息。
而 Meta 最新開源的 ImageBind,綁定了文字、聲音、圖像、深度、溫度、IMU 六種數據。可實現音頻生成圖像、圖像生成音頻等,未來應用的想象空間應該會更大。(不過官網并沒有看到溫度、IMU 相關的案例… )
Meta ImageBind
4. 終端能力得到加持
這點也是基于前兩點即信息輸入方式和信息反饋的。未來大模型在音箱、手表、車載 HMI、MR 這些設備上的使用價值巨大。
最直接的價值則是強化語音助手的能力。
另外就是和具體的應用結合,比如結合 Camera :通過檢測畫面信息,給出照片拍攝改進建議(角度、構圖、參數設置等),不會拍照的男朋友們再也不用擔心被罵了…
大模型能力和傳感器能力的整合也更值得期待,比如根據實時運動信息、心率給出接下來的運動規劃。
5. 對工具類産品的沖擊大于内容消費型産品
這點是從用戶信息獲取訴求上來判斷的,畢竟娛樂内容消費場景更多的考慮不是效率而是多巴胺,而對于生産、工作場景,提升效率是核心指标。
從 Notion、釘釘等應用中,大模型已經開始對人們的工作流程産生正向影響,逐步減輕知識記憶、寫作、摘要、信息查找等流程化的工作。
6. 豐富 C 端場景
場景 1:私人助理也許會成爲可能,大模型通過調用所有應用接口(日曆、郵件、行程等)獲取個人信息,成爲私人顧問。
場景 2:CUI 生成圖像 / 視頻 / 音樂的能力可以在各種活動玩法中發揮作用。
也許以後的網易雲年度總結就會根據聽歌習慣生成一首符合你個人品味的音樂。加入一些簡單的用戶操作,人人都是「網易雲音樂人」。
7. 廣告推薦形态産生變化
搜索、信息流爲主的場景,變爲融入問答,做到更精準、高效的廣告分發。
就拿比較好商業化的美妝行業來說,假設淘寶對李佳琪做直播内容分析和訓練,做出了個 AI 版李佳琪,支持用戶通過問答的形式獲得商品推薦。專業背景 + 人設背書,一定不缺用戶,品牌商也會更願意砸錢。
三、 這波大爆發中看到産品的哪些可能性?
判斷邏輯是,應用前景、用戶需求程度、成本和商業化能力。可預見的是大模型研發成本太高,中小企業或團隊會專注在 AI 中間件、AI 應用上發力。
這裏我們聚焦應用層看看。
1. 和現有産品的結合,快速且可預見的收益大
近期所有工具類産品都在發力,比較實用的有 Notion、釘釘。
2. 部分方向值得基于 LLM 的能力重構
如搜索、語音助手(近期出現最多的 C 端應用就是不同 character 的 Chatbot )、翻譯工具(可以舉例插件)、教育産品(語言、課程的私教方向很快就能出現頭部應用)。
3. 助力超級個體,提升知識生産效率
如果說面向大衆的 AI 産品難商業化,那麽考慮爲第一批使用 AIGC 産品的人群提供服務也是個不錯的想法,受衆群體更聚焦,服務更剛需,也更容易産生付費轉化。這個方向近期已經湧現了一批此類産品,比如協助開發、快速接入大模型 API、快捷創作 AI 産品、爲自己的網站接入客服等。
此外,做輔助文字、圖像、視頻、音樂生産,提高文字、設計、創作者的生産效率也是不錯的方向。遊戲領域已經有很多産品輔助 AI 生成角色、視頻、音樂、腳本提升遊戲開發效率。
4. To C 個性化定制變得更重要
旅行、學習、購物、讀書等領域可以根據用戶訴求量身定做。
應用層的詳細案例将在下一篇《番外篇》中展示。
四、投身 AI 産品的建議
1. 大量産品服務會持續湧現,原因是個人開發者能力得到了第一批 AIGC 産品的加持,未來同賽道将湧現多個相似解決方案,做産品會逐漸從拼創意到拼速度、産品服務質量和拼持久力。
2. 加深産品壁壘:
場景和訴求的準确洞察仍應被擺在首要位置,這将決定産品起跑線。
考慮規模效應帶來的價值,比如一些 Prompt 文案、AI 圖片分享平台未來有成爲 AI 社區的潛質。
考慮該場景用戶規模、使用頻次、消費時長,大模型能力出現前是否已經有較成熟的解決方案。
提前考慮商業化問題(瞄準剛需人群和場景解決問題)。
避免功能受到大模型能力升級帶來的沖擊。
3. 當精力和資源不足時,先深入某個場景解決小問題也是不錯的選擇,熟悉的領域紮根深挖反而能發現與衆不同的視角(如 Figma 插件 Magician ,隻解決 UX 設計場景,提供文字描述生成圖标、UX 文案優化能力)
相關參考文章推薦:
這篇寫的很好,我深度看了兩遍:
https://mp.weixin.qq.com/s/PDHWfclMVQrS-2MLCbDm0g?from_wecom=1
「超級應用出現和平台的新特性息息相關」的一些結論可以引發思考:
https://mp.weixin.qq.com/s/RXgiIb7oqWmTysffMYim9Q?from_wecom=1
https://mp.weixin.qq.com/s/kjWScZshPAS61053GopJhg
關于 AI 産品商業化:
https://mp.weixin.qq.com/s/k16ZtaA-b0fPh-25ftDddg
https://mp.weixin.qq.com/s/wWWG
作者:Bay,騰訊體驗設計師,公衆号:Bay 的設計奧德賽
本文由 @Bay 原創發布于人人都是産品經理,未經作者許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。