百模大戰之後,大夥兒或許有個共識:
現在不缺大模型,缺的是怎麽更好地把大模型用起來的方法。
有個現成的例子是,印象筆記一直被很多知識工作者當成自己的 " 第二大腦 " 來用,在 AIGC 時代,用戶看到了它更智能的改變。
其實早在 2018 年,印象筆記就在 AIGC 的領域裏開啓了自己的摸爬滾打,幾年下來,積累了不少經驗和思考。
在本次中國 AIGC 産業峰會上,印象筆記董事長兼 CEO 唐毅從知識管理的角度,分享了印象筆記在 AIGC 領域,從技術到應用和産品的所見所聞、所思所感。
爲了完整體現唐毅的思考,在不改變原意的基礎上,量子位對演講内容進行了編輯整理,希望能給你帶來更多啓發。
中國 AIGC 産業峰會是由量子位主辦的行業峰會,20 位産業代表與會讨論。線下參會觀衆近千人,線上直播觀衆 300 萬,獲得了主流媒體的廣泛關注與報道。
話題要點
模型算法進展緩慢,算力投入與收益不成比例;
公域數據窮盡,合成數據使用導緻模型輸出效果下降;
小型化、垂直化的模型可以更高效地處理問題;
強調了 AI 交付和模型之間的中間層——複合 AI 系統的重要性;
AIGC 産品的交互不是絕對的 LUI(語言用戶界面)或者 CUI(對話式用戶界面);
……
以下爲唐毅演講全文:
大量使用合成數據導緻模型輸出效果下降
大家下午好,我是印象筆記唐毅,我今天演講的題目是《用 AI 驅動的第二大腦實現增強人生》。
針對 AIGC 技術,我認爲從技術到模型、算法、實踐和應用的一系列垂直和落地的思考是非常重要的。所以,今天我從知識管理的角度,分享一下印象筆記從技術到應用和産品的一些想法。
首先簡單介紹一下印象筆記,它源于矽谷的一款叫Evernote的産品。
一直以來,印象筆記的願景就是成爲知識人群的第二大腦。這使得我們的思考一直圍繞着 " 知識場景 " 和 " 大腦的關鍵功能 "。
今天我會從 AI 驅動印象筆記系列産品,在内容理解、智慧提煉、個人知識積累和公域知識獲取等知識管理的場景中的實踐經驗,來做分享。
印象筆記對 AIGC 的研發和實踐早在 2018 年完成國内公司獨立重組時就開始了。正式獨立之後,我們首先更多地用了 supervise learning 的方式來做 NLP,同時也開始啓動了自己的小規模模型訓練。
早在 2023 年 3 月,我們就已經開始利用自己的垂直專有模型驅動自己的 AI 産品,并将功能落地在旗下的軟件和智能硬件産品。
由于印象筆記在國内市場較早地啓動了 AIGC 的全面實踐,我們也積累了更多的經驗和更深入的思考。
在我們看來,AIGC 的發現還處在比較早期的階段,對人類社會的影響也才剛剛開始,但現階段,關于大趨勢和方向性的思考更是必不可少的。
首先,相比算力的發展和模型規模的擴大發展,模型算法的進展卻是相對緩慢的。
同時,到現在爲止,算力的投入和收益是不成比例的,我相信真正對産業經濟産生深遠影響的技術,最終總的回報 ROI 要達到正向才可以。
另一個對于基座模型的挑戰是,在基座模型訓練中,或許不一定每位在座的朋友都同意。
我們看到一個現象,在模型訓練中,随着公域數據的逐漸窮盡,合成數據被大量加入使用,這也會直接導緻模型輸出效果下降。
有挑戰也有機遇,我們看到,特定數據的優化在模型能力提升中的作用、模型的小型化趨勢、小規模模型能力的持續提升在 AI 産品交付效果的提升中都起着越來越關鍵的作用。
強調 " 複合 AI 系統 " 概念
談到 AI 交付,印象筆記是既做工具又做模型的廠商,在垂直整合的過程中,我們發現,由于我們采用印象專有大模型直接服務用戶,用戶可以對模型的效果和性能有着迅速和直觀的感受,從而對背後的訓練和調優過程給予直接有效的反饋。
而另一方面,AI 産品的交付又遠遠不是僅僅将模型能力簡單直接地交付到用戶面前。
另一個顯著的趨勢是,小型化、垂直化的模型可以更高效地處理問題。在行業日益追求模型效率化的過程中,數據對模型質量和交付質量的影響在提升,對算力的需求反而在下降。
基于這些趨勢和我們的實踐經驗,我想強調 " 複合 AI 系統 " 的概念,這是在 AI 産品交付和大模型本身之間的一個非常關鍵的應用思考點和架構設計點。
從不同的論文中我們也可以看到相似觀點——系統性思維下的模型訓練、調優,以及與整個 AI 系統其它組成部分的有機組合,是現在 AIGC 應用的一個重要思考角度。
不同 AI 系統需要不同角度的思考,印象筆記關于 " 複合 AI 系統 " 的思考主要有以下幾點:
第一,我們的模型采用混合部署策略,以專有模型驅動主要用戶服務和交互場景,模型本身具有路由和任務判斷能力,同時也具備質量判斷和雲端一體的路由判斷能力。
第二,我們對公域和私域數據的區分處理和保護管理有獨特的系統和嚴密的規則。
第三,智能代理本身的功能是陣列式的,在關鍵節點分析用戶的意圖、做任務的拆解,最後還要系統化地接收用戶反饋的過程。
模型:印象大模型是高效率、輕量化的專有模型,在知識場景中有着獨特的和優異的性能表現。印象大模型端、雲部署一體化,并具備一個重要的性能——能夠根據意圖判斷和選擇哪一個混合部署中的模型會有更好的處理的效果,也能判斷和分析任務本身并在雲或端模型中進行選擇。
數據:嚴格區分管理公、私域數據,确保模型訓練和 AI 産品交付中的用戶數據隐私保護。
Agent:在混合部署策略下,模塊化的 Agent 陣列能夠真正有效地判斷用戶意圖并根據拆解的任務步驟分步執行任務。
" 複合 AI 系統 " 超越 AIGC 應用單一模型驅動的思考方式,而在此系統下設計一款成功的 AI 應用也需要考慮不同的因素,這也是印象筆記在 AI 産品的打造中比較獨特的體會。
首先,我們需要非常明确地分析和判斷出這款應用的準确使用場景。
同時,你的 AI 複合系統如何驅動這個産品給用戶進行交付也十分關鍵。
對此,也有兩個重要思考點。
一個是最合适的 AI 應用載體在哪——是在雲端?在移動端?在某一個第三方平台?還是 GPTs 或插件?不用的載體在不同的場景和工作流中有着不同的作用。
另一個是何爲最适合的交互——自然語言交互還是傳統 GUI 交互?
提倡用直覺性的方式進行交互設計
我們提倡用符合用戶直覺性的方式進行交互設計,使用戶用到 AI 功能和 AI 産品的時候是一種最自然的選擇和體驗。
因此産品的交互不是絕對的 LUI 或者 CUI ——例如在純粹 LUI 或 CUI 的交互中,它雖然更自由、更開放,但完全開放的對話窗口也會增加用戶的焦慮感 ——用戶會停在那裏不知道該做什麽。
所以産品中既應該有完全開放的交互窗口,也應該有開放交互和傳統的 GUI 相輔相成的 Copilot 性質的交互設計,同時也應該有降低用戶焦慮感的傳統限制性菜單處理交互式設計。
因此,在一個 " 複合 AI 系統 " 下打造 AI 超級應用時,我們認爲除了 AI 系統思維之外,數據、用戶、場景、載體、交互等關鍵的要素是需要非常慎重考慮的關鍵點。
回到印象筆記的實踐,我們通過自有模型的混合部署,比較早地進行了全面的布局和落地,推出了多種方向的功能:
内容生成與搜索、語義性搜索、大文件理解、多文件理解、與上萬篇筆記的私人對話等等。
通過逐步實踐,我們總結出了一些令我們感到興奮的方法和獲得了一些較爲滿意的結果。
" 印象 AI" 的推出,對新用戶的增長、用戶留存和商業化轉化的驅動效果都非常顯著。
呼應我在今天演講開始提到的觀點——作爲 AI 從業者,對于核心技術、産品策略、市場投入等方面的實踐的檢驗,最終總要能夠回到對 ROI 的結果的衡量上來。
目前,印象筆記旗下全系列的軟件和智能硬件産品都已經在印象大模型的驅動下,完成了 AI 功能和産品的落地交付。
最後,我想說的是,在 AI 能力的加持下,印象筆記希望能夠幫助用戶智能彙聚信息、高效閱讀内容并吸收知識、輔助靈感記錄與創作、自動完成知識整理與提煉,讓印象筆記和印象 AI 爲您增強人生,成爲您真正的 " 第二大腦 "。
謝謝大家!
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~