最新消息,字節跳動在大模型上已有所布局,分别在語言和圖像兩種模态上發力。
// 字節緊急布局 //
據報道,語言大模型團隊由字節搜索部門牽頭,團隊規模在十數人左右。圖片大模型團隊則由産品研發與工程架構部下屬的智能創作團隊牽頭。字節跳動語言大模型團隊在今年組建,探索方向主要爲與搜索、廣告等下遊業務的結合," 搜索業務部門、AI Lab 和 AML(應用機器學習)團隊都調了一部分人支援語言大模型,團隊目前的預期是在今年年中推出大模型 "。據悉,語言大模型團隊負責人與圖像大模型團隊負責人的間接和直接彙報對象,均爲 Tik Tok 産品技術負責人朱文佳。
對 AI 領域的布局,字節的反應速度一直較快。據了解,目前 AIGC(AI 生成内容)技術也已結合到頭條的内容創作以及抖音的圖文内容生成中。比如 2021 年,抖音上線的可以把人臉卡通畫的 " 漫畫臉 " 就小範圍出圈。
ChatGPT 模式證明,大模型的訓練是入場費高昂的長跑。在算力保障方面,字節旗下的企業技術服務平台火山引擎,在 2021 年正式進軍基礎雲市場(IaaS 層),爲大模型所需的算力奠定了基礎。
// 大廠跑步進場 //
所謂 " 大模型 ",通常是在無标注的大數據集上,采用自監督學習的方法進行訓練。之後在其他場景的應用中,開發者隻需要對模型進行微調,或采用少量數據進行二次訓練,就可以滿足新應用場景的需要。
在大模型的框架下,ChatGPT 所使用的 GPT 模型,每一代參數量均高速擴張,預訓練的數據量需求和成本亦快速提升。據資料,僅 GPT-3 訓練一次的成本約爲 140 萬美元,對于一些更大的 LLM 模型,訓練成本介于 200 萬美元至 1200 萬美元之間。因此說進入大模型首先得肯燒錢。另外從參數數量上,國内并不缺數據,百度、字節跳動這樣的公司都有海量的數據積累,不過後續包括數據清洗、标注以及模型的結構設計,訓練、推理等都需要時間積累。此外想做大模型,不僅是資金,還有人力和基礎模型,對于互聯網大廠而言,難度也是不小。
ChatGPT 帶動了國内互聯網大廠大模型熱潮。據悉,目前已經有多家互聯網大廠宣布正開展 ChatGPT 相關研發。此前,百度高調宣布,已站上 ChatGPT 競賽的跑道。按照百度的規劃,其将于今年 3 月推出類 ChatGPT 産品文心一言,外界猜測,文心一言要麽與百度搜索引擎入口打通,要麽推出類似 AI 畫作平台文心一格的獨立入口。
阿裏方面也确認,阿裏達摩院正在研發類 ChatGPT 的對話機器人,目前處于内測階段。三六零在互動平台表示,360 公司也計劃盡快推出類 ChatGPT 技術的 demo 版産品。
騰訊方面還沒有确切的消息傳來,不過,2 月 3 日,騰訊申請的 " 人機對話方法、裝置、設備及計算機可讀存儲介質 " 專利獲授權,該項專利與 ChatGPT 的原理十分相似。
// 将獲得政策大力支持 //
2 月 24 日,國新辦舉行 " 權威部門話開局 " 系列主題新聞發布會。科技部高新技術司司長陳家昌在談到近期引起廣泛關注的 ChatGPT 時表示,科技部将把人工智能作爲戰略性新興産業,作爲新增長引擎,繼續給予大力支持。将推動人工智能與經濟社會深度融合,在重大應用場景中錘煉技術,升級叠代,培育市場。