據文心一言發布已過去 50 餘天,5 月 9 日,百度工程師首次現場演示了 " 文心千帆 " 如何可視化微調大模型。
百度智能雲方面表示,正在内測的 " 文心千帆大模型平台 ",是全球首個一站式的企業級大模型生産平台,不但提供包括文心一言在内的大模型服務及第三方大模型服務,還提供大模型開發和應用的整套工具鏈。
3 月 16 日,文心一言在萬衆矚目中面世,而由于其演示的 Demo 爲錄屏,不少網友大呼 " 失望 ",就連李彥宏也多次提及,這類大語言模型還遠未到發展完善的階段,進步空間很大。
近兩個月的時間過去了,經過多次叠代升級和首批企業内測後,百度的底氣似乎足了一些。
300 餘家生态夥伴參與内測,大模型推理成本降爲十分之一
3 月 16 日開始,百度智能雲大模型平台便啓動了首批企業内測,面向企業客戶開放了文心一言 API 接口調用服務。并于 3 月 27 日,推出面向客戶的 " 文心千帆 " 大模型平台。
據了解,文心千帆大模型平台具有生成合同、邀請函、數字人文案、直播文案、訂機票、改行程等多種能力。例如在用戶輸入五一想從北京出發去雲南玩五天等關鍵信息後,文心千帆除了提供行程攻略信息外,還會自動關聯相關的門票和機票信息,對行程細節不滿意時,也可以提出更改。
在收費模式上,文心千帆的推理服務調用以 0.012 元 /1000 tokens 收費,按調用輸入輸出總字數付費。百度集團副總裁袁佛玉透露:" 截止目前,已有超過 300 家生态夥伴參與文心一言内測,在 400 多個企業内部場景取得測試成效。"
目前,文心千帆大模型平台提供公有雲服務、私有化部署兩大交付模式。
在公有雲服務方面,将提供推理(直接調用大模型的推理能力)、微調(通過高質量精标業務數據,高效訓練出特定行業的大模型)、托管(将模型發布在百度智能雲,以實現更加穩定高效的運行)三種服務,大幅降低企業部署大模型的門檻。
在私有化部署方面,文心千帆大模型平台支持軟件授權(提供在企業環境中運行的大模型服務)、軟硬一體(提供整套大模型服務及對應的硬件基礎設施),租賃服務(提供機器和平台的租賃滿足客戶低頻需求)三種方式。私有化部屬能夠滿足對數據監管有嚴格要求的企業客戶需求。
4 月 25 日,在文心一言開啓内測一個月之際,百度智能雲曾表示,其已完成 4 次技術版本升級,相較最初版本推理效率提升了 10 倍,模型算力利用率提升了 1 倍,大模型推理成本随之降爲原來的十分之一。
互聯網産業時評人張書樂向記者指出,文心一言依托百度的龐大搜索數據和算法優勢,其學習資料極爲豐富,關鍵在于其學習方法(算法)上的叠代完善,能否支撐其從一個尋章摘句的 " 書蟲 " 變爲有獨立思考能力的 " 優等生 "。目前,文心一言的完善程度應該在國産大模型中是比較高的,而且依托 " 中文 " 這個護城河,較之國外大模型有更多地緣優勢。
被質疑、被回怼,文心一言需要 " 螃蟹 " 的覺悟
雖然過去近兩個月時間,但關于文心一言的讨論一直不斷。
3 月底,文心一言推出不到兩周,便迎來了質疑聲。有微博博主發文質疑其文生圖功能抄襲 "StableDiffusion",同時在中文語義理解方面存在局限。彼時,百度方面回應稱,文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模态大模型 ERNIE-ViLG。
随後,在接受 36 氪采訪中,李彥宏表示," 早在文心一言發布之前,大家用文心一格(指代百度基于文心大模型的文生圖系統)就能體驗文生圖這個能力。"
此外,李彥宏指出," 百度的文心一言和 OpenAI 差距可能在兩個月左右 "。這番言論卻讓王小川不以爲然。
他直言,這肯定是平行宇宙裏的李彥宏說的,不是我們這個世界裏的。并指出,文心一言不可能和 OpenAI 差距隻有兩個月,如果真是如此,那肯定是另一個宇宙。他認爲國内目前的大模型和 GPT 的差距不可能是 2 個月是三年。但這是很動态的,大家很努力就有可能快一些。
5 月 4 日,李彥宏在内部活動中回應了此番争議,他表示," 說實話這有點斷章取義,我後面緊接着還說,這不是重點,重點是這兩個月的差距我們要用多長時間才能趕上,也許很快,也許永遠也趕不上。"
同時,他認爲,算力不能保證我們能夠在通用人工智能技術上領先,算力是可以買來的,創新的能力是買不來的,是需要自建的。據悉,目前全球算力規模美國占 34%,中國占 33%,算力差不多。
在今天的演示會上,百度智能雲雲計算産品解決方案和運營部總經理宋飛表示," 大家可能會覺得堆積算力、寫好代碼、然後進行模型訓練,把它跑起來就行了。實際上在訓練過程中會遇到各種各樣的挑戰,很少有人能夠使得一個大模型訓練過程能夠在連續一兩天内不出問題。百度 AI 大底座可以爲大模型提供高效、穩定的訓練和有效的收斂。千卡加速比達到 90%,資源利用率 70%,開發效率提升 100%。這是 AI 大底座爲大模型的開發和應用帶來的價值。"
從目前的實踐來看,以文心一言爲代表的大模型主要應用于 B 端,在張書樂看來,這主要是因爲 C 端延伸存在難度。
他指出,一是個體用戶需求太過龐雜、無序,難以有效滿足不同層次用戶使用需求;二是個體用戶主流需求過于淺顯。大多數 C 端體驗僅僅是嘗鮮,缺乏深度應用能力。就如辦公軟件在 C 端大多停留在文字處理一般,而少有人涉及深層使用,這讓 GPT 的應用場景既雜且淺,缺乏戰略縱深;三是可實現的多模态對于 C 端大多數用戶而言較爲雞肋,加上目前的生成能力依然是 " 小升初 " 階段,無法真正意義上滿足 C 端用戶所謂 " 一鍵式傻瓜操作 "。
至于能否追上 ChatGPT,百度需要培養 AI 原生應用的思維方式和理念,也需要有做 " 敢于吃螃蟹的人 " 的覺悟,争議和期待會在一段時間内共存。
正如李彥宏所言," 改變思維方式會是痛苦的,會經曆各種挫折和煎熬,需要用毅力去克服這種慣性,用發現和探索的眼光來看待這個新的世界。"