中新經緯 2 月 23 日電 前 Google 高級資深研究員吳軍有一部著名的小說《浪潮之巅》,其中寫道," 總有一些公司很幸運地、有意識或無意識地站在技術革命的浪尖之上,在長達十年甚至幾十年的時間裏,他們代表着科技的浪潮,直到下一波浪潮的來臨。"
這樣的公司,站在了浪潮之巅。
當眼下這波由國外 ChatGPT 引發的科技浪潮向中國席卷而來,人們也在 " 衆裏 " 尋找,誰能做出中國的大語言模型?誰會站在新的浪潮之巅?蓦然回首處發現,百度具備這樣的綜合實力。
百度也積極地對市場關切給予了回應。2 月 7 日,百度确認生成式 AI 産品命名爲文心一言 ( ERNIE Bot ) ,并将在 3 月份推出。很快,22 日,百度在 Q4 及全年财報發布當日宣布,計劃将多項主流業務與文心一言整合。
摘明珠的人
百度文心一言站在浪潮之巅,也在蓦然回首處,對這句話的理解,要從兩方面。
作爲 AIGC ( 人工智能生成内容 ) 最成功的應用,ChatGPT 本身是一款自然語言處理 ( NLP ) 大模型。而 NLP 被稱爲 " 人工智能皇冠上的明珠 ",誰能實現自然語言處理技術的突破,誰就能在 AI 領域一騎絕塵。
百度已經摘到了這顆明珠,站在了浪潮之巅。
而之所以身處蓦然回首處,則是因爲百度這個 NLP 領域已經默默深耕了許多年。
早在 2000 年百度誕生之時,準确說從百度處理用戶的第一次搜索開始,NLP 技術就成爲搜索技術的重要組成部分,并伴随着百度的快速發展,同步甚至更快地發展壯大。
2010 年初,百度對 NLP 的工作進行了重新梳理與規劃,百度自然語言處理部正式成立,并不斷在語音、圖片等技術上布局,敲定了在知識圖譜技術上長期投入的戰略。
2019 年 3 月,百度提出知識增強的語義理解框架 ERNIE,在深度學習的基礎上融入知識,同時具備持續學習能力,曾一舉登頂全球權威數據集 GLUE 榜單,首次突破 90 分大關,刷新榜單曆史。
也就是從 2019 年開始,業界進入開放域對話大模型的研究,這個技術讓生成式對話有了質的提升。
2021 年 9 月,百度發布了 PLATO-XL,這是全球首個百億參數的對話大模型,一舉超過 Facebook Blender、谷歌 Meena 和微軟 DialoGPT,成爲全球首個百億參數中英文對話預訓練生成模型,再次刷新了開放域對話效果,打開了對話模型的想象空間。
當市場驚訝于百度能以如此快的速度向用戶推出文心一言時,知情者才知道百度這種底氣來自于強大的 NLP 技術實力。
你無我有,你有我強
除了強大的 NLP 技術實力加持,百度快速推出中國大語言模型文心一言,其他工作絕不是從零開始。
當人類進入人工智能時代後,IT 技術的技術棧就發生了根本性的變化。過去基本分爲三層:芯片層、操作系統層和應用層。現在可以分爲四層:芯片層、框架層、模型層和應用層。
而對于百度而言,其在芯片、框架、模型、應用四層技術棧均有布局,又得益于這四層技術棧,大語言模型相關技術,百度在中國乃至全球範圍均具有綜合優勢。
具體的,在芯片層面,百度自研 AI 芯片 " 昆侖 " 已在多場景實際部署幾萬片,在百度搜索業務中也已形成較強工程化實踐,這讓文心一言底層算力有所保證。
在框架層,飛槳深度學習平台下接芯片上承應用,提供了從便捷開發、高效訓練到滿足多端多平台推理部署的全棧能力,大幅提升了 AI 深度學習模型的研發效率。
在模型層,百度的文心大模型和 Open AI 的 GPT 模型類似,并在 2019 年就已經推出,迄今已經叠代了多次,從單一的自然語言理解延申到多模态,包括視覺、文檔、文圖、語音等多模态多功能,且已在行業得到普遍應用。因此文心一言所基于的 ERNIE 系列模型也已經具備較強泛化能力和性能,足夠爲用戶提供相應的服務。
在應用層面,百度深度學習技術與場景融合創新,應用場景日漸豐富,人工智能技術與實體經濟也加速融合。此外,還催生了一批新業态新模式,有望深刻改變人類生産生活方式和思維模式,實現社會生産力的整體躍升。
其實不難發現,當科技浪潮席卷而來,百度之所以能站在浪潮之巅,很重要一個原因來自于超前布局,早期的投資奠定了百度在人工智能浪潮中的有利地位,也讓百度在市場競争中掌握先機和主動權,成爲中國人工智能市場長期增長的最佳代表。最新财報顯示,2022 年百度核心研發費用達到 214.16 億元,占百度核心收入比例達 22.4%。
看得最遠的地方
雖然這股科技浪潮由 ChatGPT 而起,但必須理性認識到,ChatGPT 并不是革命性的技術。直接點說,ChatGPT 并未實現底層模型的顯著突破,它基于人類反饋進行強化訓練,給人帶來了一種更加智能的感覺。
而百度實際上正在思考更遠方的問題,即如何把技術做成人人需要的産品,讓人們從中受益。
百度創始人李彥宏曾說:"ChatGPT 是 AI 技術發展到一定階段後的新機會。怎麽把這麽酷的技術,變成人人需要的産品,讓每天有幾億人從中受益?怎麽賦能千行百業,讓他們的生産效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠産生影響力的。"
這也就預示了,實際上也是可期待的,百度文心一言,要走比 ChatGPT 更遠的路。
在發給百度全員的财報信中,李彥宏還重點介紹了将在三月份推出的生成式 AI 産品文心一言 ( ERNIE Bot ) ,宣布計劃将多項主流業務與文心一言整合,包括搜索、智能雲、Apollo 自動駕駛、小度智能設備等。
以搜索業務爲例,文心一言推出後,将與目前以 " 知一 "" 千流 " 爲代表的搜索引擎相互協作,共同爲用戶提供服務。可預見的是,與傳統的搜索引擎相比,接入文心一言後的百度搜索,可以提供更加智能化的答案,免去用戶從上到下依次點擊鏈接進行确認的步驟。而這一變化也有望爲百度,甚至爲整個互聯網行業帶來收入形式的革新,并擁有極大的想象空間。
此外,百度将開放文心一言大模型,支持更多企業構建自己的模型和應用,賦能交通、能源、制造等實體經濟領域,實現生産效率的大幅提升。
在不久的未來,因爲文心一言,AI 市場将迎爆發式需求增長。
此外,還有一個容易忽視的細節是,文心一言所基于的文心大模型,是地地道道的本土化的 AI 模型,具備對中文、甚至中國文化的更深理解,這意味着文心一言會更适合中文和中國市場。
而且,随着 ERNIE Bot 的公衆開放,有望建立起立真實的用戶調用和模型叠代之間的飛輪,模型将越來越聰明,給用戶帶來更加聰明的體驗。 ( 中新經緯 APP )
作者:王京晶