11 月 6 日,李開複 AI 公司零一萬物宣布首款開源中英雙語大模型 "Yi" 正式發布。同時,零一萬物完成了新一輪融資,由阿裏雲領投。零一萬物目前估值已超 10 億美元,成爲新晉獨角獸。
李開複親自籌組的大模型新公司零一萬物于今年 7 月正式官宣亮相,由原百度副總裁馬傑擔任法人,創新工場創新工場首席市場官及運營合夥人黃蕙雯擔任 002 号員工,聯創團隊成員包含前阿裏巴巴副總裁、前滴滴 / 百度首席算法負責人、前谷歌中國高管、前微軟 /SAP/Cisco/ 副總裁,算法和産品團隊背景均來自國内外大廠。
11 月 2 日,Yi 在 Hugging Face 低調上傳了兩個參數規模分别爲 6B 和 34B 的基礎模型。截至 11 月 5 日,Yi-34B 在 Hugging Face LLM Leaderboard(pretrained)(預訓練大語言模型)和中文大模型榜單 C-Eval 排行榜 2 個榜單中均快速上升至首位。目前,Yi 擁有 200K 上下文窗口,可處理約 40 萬字的文本(目前全球大模型中最長的上下文窗口)。
Yi 的訓練數據主要來源于公開語料的爬取和數據庫。測試結果顯示,Yi-6B 在常識推理能力和閱讀理解能力上達到了國内外開源模型的平均水平,但在數學與代碼能力上還較弱。Yi-34B 在常識推理能力和閱讀理解能力上均大幅領先國内外開源模型,在數學與代碼能力上處于領先水平。
據了解,零一萬物現已啓動 100B 以上參數規模的模型訓練,同時多模态大模型團隊已經召集了十多個人。李開複透露 "Yi" 的定位是通用底座,同時,Yi 系列量化版本、對話模型、數學模型、代碼模型、多模态模型将以快節奏推出,具體進展在幾周之内就會有新的發布。