3 月最後一天,王長虎在龍湖集團的 last day。
這位字節跳動前視覺技術負責人、AI Lab 總監辭職挂印,火速啓程下一站:AIGC 創業,成立新公司愛詩科技。
他拉團隊自起爐竈,要打造一個聚焦 AIGC 的視覺多模态算法平台 ,覆蓋視覺相關的各種垂直應用場景。
當此大熱的 AIGC 風口,王長虎已經是近期第 N 位勇闖創業潮的 AI 牛人。
聊起這事,王長虎說話間不自覺就提高了聲音,語速也更快。他提到,創業是受時代和内心的雙重感召,而且在風口和經曆背書的雙重加持下,目前看來,早期的融資推進頗爲順暢。
關于創業要幹的事,他信心飽滿:
技術難點?一定有,但也是好事,它就是我們不斷形成競争壁壘的機會,就是這時候需要我們去做的。
而且我們真的是打過硬仗的,之前在字節,那麽難的事情都被我們扛過去了。所以在新的應用場景裏邊看到難點,蠻興奮,看到了,就去解決它。
(" 那麽難的事情 ",指對字節系短視頻産品從 0-1 進行建設)
支持 AIGC 全生命周期的視覺多模态算法平台
在 ChatGPT 引爆的 AIGC 創業風潮後,王長虎的切入點不是底層大模型或 To C 應用層。
而是基于過去近 20 年的學術研究和技術應用能力,殺入中間層,打造視覺多模态算法平台,将焦點聚集在 AIGC 相關視覺領域的各個垂直應用場景。
并且在初始階段,To B先落地踐行。
所包含的多模态具體樣式,根據視覺垂類領域應用的需求,初步設定爲文字、圖片、語音、視頻,以及用戶的個性化特征等,也是 AIGC 領域不斷湧現新能力和産品的載體。
根據王長虎的解釋,利用 AI,可以完成從 UGC 到 AIGC 的内容新升級。
" 很多人關注 AIGC,更多關注在内容生成方面。" 從王長虎視角看過去,内容生成隻是 AIGC 全生命周期的一個階段," 其餘階段也有很多問題等待去解決。"
" 很多問題 " 是哪些問題?
他結合此前經曆,舉例了兩個 UGC 時代代表性場景來佐證他所說的内容生成之外,AIGC 時代生産鏈的其他環節很大可能會遇到相同難題。
一個是在日活 6 億,正負樣本極不均衡的抖音或 TikTok 平台上,根據不同文化背景、具體要求等,必須要篩選出不合規的視頻進行攔截,且需精準快速。
AIGC 時代,這樣确保安全的審核同樣重要,且審核需求量更大。視覺多模态算法平台提供的算法,就包含了能夠幫助使用方提高篩選和攔截效率的那種,并且很有可能如當初的字節一般,在王長虎提供的技術支持下代替成本高昂的人工審核,同時提升效率。
另一個場景是抄襲頻發。AIGC 時代,創作門檻降低,作品數量爆發,抄襲現象和版權糾紛大概率顯著上升。
UGC 時代已經驗證過,長此以往,不僅打擊原創者的創作意願,對平台生态不利;而内容雷同或完全相同的視頻持續推薦,用戶體驗也會大打折扣。
針對這個場景,王長虎要做的平台,就能爲用戶側提供減少類似或雷同視頻分發的 AI 算法。
他還表示,這個聚焦 AIGC 的算法平台搭建過程中,很大可能會利用 AIGC 技術提升效率。
上述所有都是王長虎的現階段思考,他才正式離職,剛剛開始籌備新公司事宜,新公司名爲愛詩科技。
糧草先行,目前組建了 10 餘人的初始團隊,也在招募核心技術和産品人才,爲真正踩下出發的油門蓄力。
梳理他言語間透露出的規劃,能嗅到關于創業項目的信息點:
搭建這樣一個視覺多模态算法平台,能夠支持 AIGC 新内容,幫用戶解決内容生成、安全、版權、分發、商業化等幾乎全生命周期的各項問題。
新的 AI 浪潮到來,王長虎身處其間,感知到變化,并打算在新事業從善如流地用上舊經驗,包括但不限于 GPU 集群能力、服務調度能力、自動化模型訓練能力,推斷能力等。
經驗不會憑空出現,既有功力的來源,主要可以定位回他在字節跳動任職期間。
此次 To B 和 To C 層面可能遭遇的各種問題,如降本增效、版權厘清、用戶體驗等,王長虎都在那時以技術或實現或改善或解決。
再一次 " 從 0 到 1 建設技術平台和産品 ",王長虎表示,上述經驗都可以一以貫之應用在此次 AIGC 創業。
與 AIGC 緣起 20 年前的本科研究
新公司還在襁褓,王長虎不願過多詳談,他更願意談論的是此前的技術經驗,當然也包括 " 技術底色上滋養出的AI 情結"。
這要從王長虎還是中國科學技術大學 6 系(電子工程與信息科學系)大四學生時聊起。
那是 2004 年,他做了人生首個研究,即根據一張或多張人臉圖片,生成該人臉的 3D 模型。此研究後來發表到國際會議上。
他不無興奮地說:
回看 20 年前,我此生做的第一個研究,就和 AIGC 有關。
同年,王長虎進入 MSRA 實習,中科大博士畢業後轉爲正式員工,直到 2017 年離開。
13 年間的工作内容也與 AIGC 有千絲萬縷的聯系,他所在團隊研究的" 神筆馬良 " 草圖搜索技術,可以基于海量圖像數據建立搜索引擎。
當然,那時候生成式技術沒有成熟,業界對大規模數據的訓練和處理經驗也遠不如今日豐富,所以整個過程是在海量數據庫中尋找和草圖最匹配的那一張。
回憶此處,王長虎的語氣中多少帶了些感慨,因爲現在的範式也是基于海量數據去訓練一個模型,然後根據用戶輸入的文字或圖像信息,生成一張最匹配 prompt 的圖片。
△草圖搜索技術示例
都說十年磨一劍,但在微軟實習和工作 13 年後,王長虎毅然奔赴字節跳動,選擇的還是當時并非招牌的視頻類産品。
爲什麽去字節?畢竟王長虎自己也承認,在微軟可以做世界上最頂尖前沿的科學研究。
但在微軟,科研項目應用到公司産品需要的周期特别長。
他舉例分享,自己二零零幾年做的工作,若幹年後才真正應用在必應搜索引擎,新技術很難在第一時間影響用戶。
但這一點在字節可以實現,再加上加入字節時,恰巧是短視頻類産品筚路藍縷打根基的時候——這也是字節 AI Lab 與其他大廠 AI Lab 的區别所在,即并非在産品成熟後才建立 AI 部門,也因此,王長虎有機會在産品 0 到 1 發展曆程中扮演核心角色。
公開資料顯示,字節跳動人工智能實驗室(AI Lab)的成立使命,就是推動機器智能的極限,緻力于将 AI 理論研究快速應用于産品部署。
現在翻看王長虎公開簡曆,字節任職期間,留下的足迹如下:
完整參與了抖音和 TikTok 等短視頻類産品從 0 到 1 的建設和發展;
建設了視覺技術和業務中台,帶領團隊将相關技術廣泛應用到字節跳動全線産品中;
爲集團各産品提供AI 技術支撐和業務解決方案,覆蓋了視覺相關産品内容生産與消費的全流程。
期間,他搭建的數百人團隊,不僅有技術人員,還包含了産品同學。如果把微軟看成王長虎的技術練兵地,王長虎就把字節和龍湖的經曆,看成是對他技術和産品兩方面認知的鍛煉。
△王長虎
和從字節去龍湖的原因一樣,選擇加入 AI 2.0 創業大潮,他的理由是" 跳出舒适區 "。
當然,這一次的催動因素更複雜,譬如 ChatGPT 和 Stable Diffusion 的驚豔表現,以及自己從 DL 熱潮走來,對又一次 " 翻天覆地變化 " 的不容錯過。
他說,這個機會更大,不像元宇宙、區塊鏈是被一部分人看到,AIGC 是多數普通人能看到和感受到的。言語間,王長虎又傳遞出自己對 " 新技術快速影響用戶 " 的看重。
如今離職創業,他又有機會身體力行地這樣做了。
參考鏈接:
[ 1 ] 《草圖搜索的魅力與挑戰》https://blog.sina.com.cn/s/blog_4caedc7a0102en29.html
— 聯系作者 —