文 | 李智勇
原點上的失敗
幹事都會失敗,但根因不同,求解的方式也就不同。
AI 裏面的很多失敗是原點上的失敗。
原點上的失敗是說,除非天下掉奇迹,否則打開始那天就不可能成功,和努力沒關系。
前兩天琢磨事發起了一個AI 碰撞局,當時我提了個問題:
如果執行力提高 10 倍,那改變智能音箱所需要面對的局面麽?
大家想了想基本都認爲,完全不影響,還是現在這樣。
确實,執行力提高 10 被,天氣這類技能的數目可能膨脹 10 倍,但根本不可能改變産品自身的用戶價值和市場空間。也就不可能改善使用深度。
這很像一條無限接近限定值(比如 6 分)的曲線,可以無限提升,但永遠不可能及格。
爲什麽會這樣呢?
因爲約束了語音交互新價值空間的關鍵因素早早就在那裏了。
反倒是當事人沒那麽願意看、懶得看或者就上頭了。
這些要素在原點上确實是可以列出來并且做判斷的。
比如使用情景、物理空間、智能程度、市場空間、後端變現可能性、投入回報周期等确實預先定義了一個可能邊界。
除非 AI 突變,否則在一個限定周期,投入越多,執行力越強,死的越快。
池子就那麽大,投喂,然後缺氧,魚就死很大一批。
不是智能音箱沒用,而是過渡的預期後就會變成原點上的失敗,比如期望它迅速成爲普遍入口。(池子小,少幾條魚一樣活挺好)
産品要基于成熟技術,畢竟蘋果都基于成熟技術。
當年做智能音箱拔高預期相當于預期 AI 會迅速無限提高,這種用未來的預期做産品規劃的方式,就會導緻産品總是快一步。
這一步往往就是生死界限。
如果單是智能音箱,這事已經過去了,再提起來意義不大,但問題是不單過去,現在我們很多時候仍然可能在重複這種原點上的失敗,比如具身機器人、垂域大模型等。
爲什麽在 AI 領域原點上的失敗變得普遍?
一個可能的原因是互聯網對我們影響過深,而 AI 與互聯網迥異,要求我們重塑認知價值的思維模式。
過去 30 年的是互聯網的 30 年。
企業家、KOL、媒體共同構建了一套互聯網的價值認知體系,這深刻的影響了每一個人。
現在主導的驅動力及其特征變了(從互聯網到 AI),但思維慣性之下就很容易沿用過去的判斷方法。
比如米國和日本就是很不一樣兩種環境,用同一種行爲模式可能就危險。
最近和中關村智用人工智能研究院一起做了一場公開課,課上我把這種差異概括爲:
這是跑馬探地和打呆仗的區别。
試錯成本不同衍生的方法論就不同。
一種需要快速試錯,另一種就必須深掘場景才能見水。
單點、極緻、口碑、快、一針捅破天等在 AI 這兒似乎完全颠倒了,看起來要調過來。
而如果追究爲什麽這樣的底層邏輯,那需要回到新技術的基本特征。
互聯網關鍵的是鏈接,是網絡效應,所以就容易迅速鋪開,每個點上并不帶來特别大的改變。這就催生對快的追求。
人工智能關鍵的是智能,是理解概念和自主判斷的能力。這種能力顯然對場景的改變越多價值越大。
新技術領域必然是技術自身的特征決定了匹配它的方法論,而非相反。
從這個視角再回看智能音箱大戰就會更理解這爲什麽是原點上的失敗。
在你本來應該創造價值的點上,沒有深挖(深挖也有其它問題,但是兩回事),而是迅速謀求不存在的網絡效應或者後端價值,那錢可不就打了水漂。
一個地兒 2 米沒出水,你挖八百口井該沒有水還是沒有水。
再延伸一點就是和互聯網匹配的幹就完了的情緒非常值得警惕。
試錯成本低的時候确實謀定後動的重要度會被淡化,勇猛點快跑沒準就碰上了。
但打井這事,有水沒水是不可能碰出來的。
如果說互聯網可以隻用 20% 的精神頭思考,然後一路狂奔即可,沒準也能幹成社交網絡。
那人工智能則至少需要百分之五十,否則大概率十死無生,大概率沙漠打井。
混沌狀态下的底層邏輯
混沌狀态下沒有手冊性的方法論的。
挖銅礦手冊很關鍵,因爲大緻被研究明白了。按手冊幹好就是專業。
AI 應用的魅力就在于沒人明白,這時候宣稱有手冊性方法論的大概率是騙子。
正因爲沒人明白,所以才有機會。
很多人現在可能比 2000 年的馬雲還懂互聯網,但你絕不可能再做出大的互聯網産品了。
這時候必須探求底層邏輯,它們可能不嚴密但自洽,能勾畫出一個輪廓,輔助避免原點上的錯誤。
很巧的是琢磨事的 AI 碰撞局上正好有這麽個例子(周偉明同學提供的)。
假如你想做一個法律的大模型,那爲了看看這地兒能不能挖出水,預先的判斷是什麽呢?
1. 場景上是你預想完整覆蓋什麽樣的場景,這個場景本身的價值是什麽樣?
a. 是能完整取代一個初級律師,還是初級律師的輔助工具
b. 如果變成信息提供的輔助工具,那和現有産品有多大差分,是不是就提高個 10%~20%
2. 技術上是模型到底能幹到什麽程度?什麽樣的人能幹到什麽程度?你的人能幹到什麽程度?你有多少資源(數據資金等)做這事?(圖靈測試 2.0)
3. 出錯的概率是多少?出錯的效果是否能承擔?
4. ... ...
不列全了,核心是 AI 用在這個場景下會弄死你的并且短期不可能改變的點有麽?這是要預先列的,也是可以預先列出來的。
這種分解是産品定義之前要琢磨的,每個都比較生死攸關。
列出來後反倒是尋找答案不難。很多時候一手體驗和公開信息也能有個大緻的答案。
尤其是現在的智能在你設定場景的新體驗的程度是很容易測試出來的。
這時候需要注意的是:AI 使用成本極低,不能被某些新詞繞進去比如 RAG 這類,要整一手的體驗。
大家可以仔細想想,RAG 其實更大可能是提高的你效率,而不是具體某個場景的體驗。
形象講是如果你自己一次構建足夠全的 prompt,然後大模型的智能程度不夠,加了 RAG 一樣不夠。
從外往裏看,和模型與參數保持距離
做産品其實很忌諱把技術的希望當成可以構建産品特征的現實。
寫售前方案倒是可以,至少可以看着比較高大上。
産品方要關注技術(大模型等)的智能高度,但要關注的不是細節。
在智用研究院的公開課上,我打了一個比方:
英國人發明了坦克,實際上則是德國人在閃電戰裏把坦克威力發揮到極緻,用的最好。(陳春花老師聊天的時候提到的,特别适合這個情景)
構想閃電戰的人是要了解坦克的,但肯定不能和坦克的工程師學習怎麽設計閃電戰。
坦克的工程師是看不見閃電戰的。
這是兩個完全不同的維度。
媒體可以把新技術名詞、新模型誰大誰參數多作爲一種噱頭來制造熱點。
做産品的時候就是回到一手體驗,回到場景,整清楚它現在可以幹什麽,不可以幹什麽。
概念性技術不适合用來構建産品,除非你特别特别有錢。
但考慮智能的拔高還是會有個過程,所以機會敞口會有個次序。
大緻是先從純粹數字、幻覺破壞作用小的領域擴展到具身的、幻覺作用大的領域。
這裏尺度的判斷非常關鍵,不要忘了 Google Glass、自動駕駛幹多少年了!
打深井的模式下,原點已經是決勝點。
小結
一個完整可供參考的也還算自洽的底層邏輯框架在:AI 的脈絡:非共識時刻的認知價值,這裏不重複了。最後想說的是這類框架對于混沌狀态下做應用是有幫助的,但作用也有限的。可以幫助避免原點上的錯誤,也可以在挖井的時候,對最初十米有點幫助。但既然是挖井,後面 90 米必然需要在現場的泥土裏摸爬滾打,和現場的持續反複。給個手冊照着做,産品就成功了,人就發财了,在這個時間點這麽宣稱的真的是騙子。