前 Google 科學家、出門問問創始人兼 CEO 李志飛(來源:出門問問)
随着人工智能(AI)競賽加劇,最近兩年極少公開露面的李志飛,這次也要加入到國内 AI 大模型浪潮中。
钛媒體 App 獲悉,4 月 20 日出門問問舉行的 2023 AIGC(生成式人工智能)戰略發布會上,前 Google(谷歌)科學家、出門問問創始人兼 CEO 李志飛宣布推出出門問問版 GPT、AI 大模型 " 序列猴子 ",并開啓内測探索。
同時,出門問問還介紹多款面向創作者的 CoPilot(創作助理)産品—— AI 寫作平台 " 奇妙文 "、AI 繪畫平台 " 言之畫 "、AI 配音平台 " 魔音工坊 "、數字人視頻與直播平台 " 奇妙元 "、升級版語音助手魔法小問,以及企業(To B)端專屬大模型,不僅提供通用能力支持服務和數字人形象定制服務,還将開放自身角色能力,持續叠代數據接口。
李志飛對钛媒體 App 表示,相比 OpenAI 研發的 GPT-3 大約 1750 億個參數," 序列猴子 " 模型參數量約爲幾百億個。盡管 GPT-4 的 100 分滿分相比," 序列猴子 " 分數是 50 分,但李志飛認爲目前該模型效果确實超出了他的預期,他十分滿意。
李志飛強調,中國 OpenAI 不是出門問問的目标。同時,出門問問近期不考慮融資,不需要外部融資也能支撐研發投入。
" 目前公司商業化做得不錯,除大模型外,公司其他業務并不太燒錢。此外,出門問問之前的融資也較充足,我們過去還是融了不少錢,所以賬上還有不少錢。"李志飛對钛媒體 App 表示," 可能就是我最後一次 All in 幹的一件事情 "。
據悉,成立于 2012 年的出門問問,是一家以語音交互和軟硬結合爲核心的 AI 公司,爲全球 40 多個國家和地區的消費者、企業提供 AI 産品和服務。其中包括智能手表 TicWatch 系列、AI 真無線智能耳機 TicPods 系列等,以及物聯網、金融、車載等場景提供服務,推出的 " 魔音工坊配音助手 " 用戶近 200 萬。創立出門問問之前,李志飛博士畢業于美國約翰霍普金斯大學計算機系,曾任谷歌總部科學家。
截至 2017 年 4 月,出門問問共完成六輪融資,總額超 2.55 億美元,投資方包括紅杉資本、真格基金、谷歌、大衆汽車等。
2021 年 6 月,出門問問推出大模型 UCLAI,效果不佳。2022 年 10 月,出門問問重拾大模型的研發。李志飛坦陳,研發過程壓力很大,因爲研發很燒錢,而且不知道最終結果如何,直到兩三周前的一天才發現 " 序列猴子 " 的表現不錯。
據李志飛介紹," 序列猴子 " 這個名字的靈感,來源于數學家埃米爾 · 波雷爾在 20 世紀初提出了 " 無限猴子 " 定理,即隻要給予無限時間,一隻猴子幾乎必然能夠打出任何文字,比如莎士比亞的《哈姆雷特》,而如果喂給機器猴子海量的文本序列,通過大規模算力去訓練它,就能練就有智能的 " 序列猴子 ",而大模型是一個序列模型。目前," 序列猴子 " 大模型主要是文本形式,未來則會向多模态的方向發展。
C 端方面,在發布會現場,出門問問團隊進行了多輪 Demo 演示,比如,回答 " 湖南和湖北哪一個省會的人口更多?廣東和新疆呢?" 等問題,也從一衆菜品中爲不吃辣、喜歡吃蝦的客人推薦了合理的菜品;而回答 " 天貓背後的公司的創始人本科畢業于嘟個學校?" 問題時,也能輕松輸出馬雲本科畢業于浙江師範學院(現浙江師範大學)。
出門問問大模型現場 Demo 演示(圖片來源:钛媒體 App 編輯拍攝)
不過,有些問題依然會出現和其他 GPT 大模型一樣的反複胡謅、文生圖對不上等情況,比如現場讓 " 畫一隻賽博朋克風格的貓 ",結果生成的是一位打扮好的二次元人物。李志飛提到," 序列猴子 " 大模型的語料也來自于互聯網中," 我們需要不斷調整它(大模型)的一些對話策略,各種各樣的能力輸出。"
李志飛指出,在中國做大模型的公司,不論是 33 分,還是 50 分以上,都不要焦慮,應該意識到現在的大模型不再像上一代的 AI 能力有限,它已具備基本的邏輯推理能力,每次都能給人驚喜, " 序列猴子 " 大模型已經具備了一定的自然語言理解、知識、邏輯以及推理等能力。他強調,大模型的訓練要循序漸進,不要一上來就搞 " 應試教育 ",大模型的能力可能很快能提升到 80 分,但是要從 80 分做到 90 分以上,仍然會是非常難的事情。
而在 B 端,李志飛現場透露," 序列猴子 " 企業專屬大模型已在首批汽車、教育、律所、金融、運營商、旅行、傳媒、設計、智能硬件、醫療十大行業内測探索夥伴,企業方包括中國移動、中國工商銀行、中國一汽紅旗、春秋航空、VIPKID 等。
李志飛強調,大模型商業化落地首先是創作者,然後是 B 端,然後才是 C 端。他透露,在創作者方面,出門問問提供付費服務,B 端主要提供定制大模型服務,提供個性化答案,例如把功能嵌入至企業微信裏面等。
當被問及中國大模型和美國距離多遠時,李志飛認爲是 16 個月。他解釋稱,2022 年 1 月谷歌發布指令學習大模型 FLAN,之後的 2022 年 10 月 ChatGPT 發布,2023 年 3 月 GPT-4 發布。中國企業目前發布的一批大模型與 FLAN 水平相近,如此推算,中美大模型的差距爲 16 個月——這與百度 CEO 李彥宏和搜狗創始人王小川說法都不一緻,此前李彥宏認爲文心一言和 ChatGPT 差距隻有兩個月,王小川認爲國内和 GPT-4 有兩、三年的差距。
李志飛稱,目前大模型燒錢很厲害,算力是當前重要挑戰之一。他提到,現在 " 序列猴子 " 模型比較大,沒有做太多優化,所以顯卡要求比較高,因此算力對于出門問問來說是一個現實的問題,他認爲後面應該會慢慢的解決算力需求挑戰。
李志飛向钛媒體 App 透露,現階段出門問問不需要融資。據悉,自 2017 年至今的過去七年,出門問問沒有公開過最新融資消息。
" 我們 2012 年創業,其實我覺得出門問問已經到了一個階段,我不需要靠去融資,然後又去燒錢,燒完錢以後又開始虧損,然後虧損了又進入了一個裁員優化,這是過去我們看到确實是無數個行業、無數公司經曆的這麽一個循環。現在對我來說,肯定不願意去參與融資這種競賽,我還是想理解模型本身變成一個可用的産品。目前這個階段,我們是不融資的,我不需要外面的資本也能支撐這方面的投入。"
" 錢從哪裏來?我覺得是能用 1/10 的錢,幹出比别人 10 倍好的事情,這個對我來說最有成就感。我早期認識 OpenAI 内部的人,人家根本就不優化成本了,因爲現在他們要探索天花闆了。所以對我來說,我更加 care 是我能不能夠發揮我的才智,能跟别人做的不一樣,真的就用 1/10 的錢能做出别人 10 倍、或者差不多 10 倍好的東西。"
李志飛強調,中國不會有下一個 OpenAI,主要原因是中美創業環境不太一樣,不太可能是去重複 OpenAI 這樣的發展道路,國内大部分人還是在思考中國競争太激烈、商業化如何競争。
" 中國版 OpenAI 不是我們的目标。我的初心就是要‘造大模型’,理解大模型,再把大模型用起來。" 李志飛告訴钛媒體 App。(本文首發钛媒體 App,作者|林志佳)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App