圖片來源:圖蟲創意
2 月 7 日,百度确認 ChatGPT 項目名字為 " 文心一言 ",英文名 "ERNIE Bot",三月份完成内測,面向公衆開放。
ChatGPT 在 2022 年 11 月底免費測試後引發全球關注,作為 AIGC 領域的颠覆性産品,僅上線 5 天用戶數量便突破 100 萬。據了解,到今年 1 月,其在兩個月時間内便吸引超 1 億的活躍用戶。
在外界看來,ChatGPT 或成為下一代搜索産品的雛形。百度作為國内搜索引擎和人工智能的代表,自然不會錯過這次機會。
業内普遍認為,ChatGPT 是人工智能裡程碑,更是分水嶺,這意味着 AI 技術發展到臨界點。在人工智能領域深耕數十年的百度能否乘其東風完成自我變革引發業界關注。
" 文心一言 " 或提前開放内測,百度股價漲超 15%
記者從百度處獲悉,目前,文心一言在做上線前的沖刺。去年 9 月,百度 CEO 李彥宏判斷人工智能發展在 " 技術層面和商業應用層面,都有方向性改變 "。據此推測,百度那時候就開始做文心一言。
百度相關人士指出,按照谷歌和微軟節奏,文心一言開放内測還有可能提前。
消息一經曝光,百度集團港股股價一度大漲。截至 2 月 7 日收盤,漲幅 15.33%,收盤價突破 162 港元,市值 4492.16 億港元。
據天眼查顯示,同日,北京百度網訊科技有限公司申請的 " 交互方法、模型的訓練方法、裝置、設備及介質 " 專利獲授權。摘要顯示,該公開涉及人工智能技術領域,尤其涉及深度學習、智能搜索、自然語言處理(NLP)等技術領域。
該發明提供了一種深度學習模型的訓練方法,包括利用無标注樣本語句,通過無監督的對比學習訓練方式訓練深度學習模型,得到第一級模型;以及利用樣本語句對訓練第一級模型,得到一級目标模型。
同時,提供交互方法包括接收來自用戶的問題;将上述問題輸入至特征提取模型中,得到語義向量;從多個語義索引向量中确定與上述語義向量相匹配的目标索引向量;基于上述目标索引向量,确定與上述問題相匹配的答案。
在 ChatGPT 項目名稱公開之際,相關技術專利也獲得授權,百度這步棋恐怕已思慮良久。
ChatGPT 是美國 " 開放人工智能研究中心 "OpenAI 研發的聊天機器人程序,于 2022 年 11 月 30 日發布。作為人工智能技術驅動的自然語言處理工具,它能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。
據了解,有調查顯示,89% 的美國大學生承認使用 ChatGPT 做家庭作業,53% 的學生用它寫論文,48% 的學生使用 ChatGPT 完成測試。
結合 ChatGPT 的底層技術邏輯,中信證券曾列出了中短期内 ChatGPT 的潛在産業化方向,即歸納性的文字類工作、代碼開發相關工作、圖像生成領域、智能客服類工作。
相比于部分科技股蹭熱度,百度近兩年在人工智能領域的存在感更顯真實。
自動駕駛商業化難題待解,百度欲求新故事
1 月 10 日,在第五屆百度 Create AI 開發者大會上,李彥宏重申了他在 2021 年 Create 大會上的觀點," 随着技術應用門檻不斷降低,創造者們将迎來屬于人工智能的黃金 10 年 "。
在 BAT 中逐漸落後的百度自然不會放過人工智能帶來的新機遇。早在 2019 年 3 月,百度已經開發了文心 ERNIE 1.0 系統,其是一種與 ChatGPT 所基于技術類似的深度學習模型。
截止目前,文心大模型已經形成 " 模型層 + 工具與平台層 + 産品與社區層 " 的整體布局。2022 年 11 月底,其發布 11 個大模型和基于文心大模型的 2 大産品,即 AI 作畫産品 " 文心一格 " 和産業級搜索系統 " 文心百中 "。
在百度首席技術官王海峰看來,以人工智能為重要驅動力的第四次工業革命,深度學習是其關鍵核心技術,具有很強的通用性,呈現出标準化、自動化、模塊化的工業大生産特征,推動人工智能進入工業大生産階段。
縱觀百度這幾年的發展史,它也的确是這樣做的。從技術層面,AI 走向了自動生成内容,包括 AIGC 用于作畫、圖文、視頻等多類型的内容創作,如基于飛槳文心大模型 " 補全 "《富春山居圖》、數字人度曉曉 AI 畫作賣出 17 萬元等。
從産業應用方面,百度 AI 已深入産業,賦能實體經濟發展,如智能交通中的 " 智能調度系統 " 是深度學習 + 交通融合創新的智能應用,目前已經落地全國 63 個城市。
百度要抓住的不僅是人工智能的黃金十年,更是過去失去的十年。盡管這十年間百度并沒有落下一個風口,外賣、團購、遊戲、直播、智能駕駛、元宇宙等,但穩定實現商業化落地的産品卻未形成公衆認知。
即便是前景廣闊的自動駕駛,仍面臨商業化難點。實際上,百度從一年前開始,每個季度都發布自動駕駛平台蘿蔔快跑的訂單量,2022 年第三季度訂單量已超過 47.4 萬。但自動駕駛技術本身面臨着較大的商業化壓力,技術進展與社會對無人駕駛期望值的平衡需要長期努力,盈利問題短期内很難解決。
這意味着,習慣以技術作盾的百度必須轉化更多生産力來應對時代變革。
艾媒咨詢 CEO 張毅向記者表示,這款産品本身對于百度未來的商業化來講是非常重要的,在搜索引擎領域 20 年以來沒有更多的創新去挑戰。ChatGPT 這樣的産品創新,對百度來說是一個極大的啟發。
乘 ChatGPT 東風,百度能否 " 狂飙 "?
ChatGPT 東風起,或許會讓百度早已醞釀的 AI 火苗燃燒更烈,不缺技術的百度能否借此重新定義國内搜索業務成外界關注的焦點。
從技術層面來看,進入人工智能時代,IT 技術的技術棧發生了變化。過去基本分為三層,即芯片層,操作系統層和應用層。現在的技術棧可以分為四層,即芯片層、框架層、模型層和應用層。
據了解,百度在人工智能四層架構中都有全棧布局,包括底層的芯片、深度學習框架、大模型以及最上層的搜索等應用。此次推出的文心一言,便位于模型層。被稱為 " 人工智能皇冠上的明珠 " 的 NLP,則從百度處理用戶的第一次搜索開始,便成為搜索技術的重要組成部分。百度在技術上的自信,讓它對順勢而來的 ChatGPT 充滿期待。
李彥宏曾表達自己對 ChatGPT 的看法,"ChatGPT 是 AI 技術發展到一定階段後的新機會。怎麼把這麼酷的技術,變成人人需要的産品,讓每天有幾億人從中受益?怎麼賦能千行百業,讓他們的生産效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠産生影響力的。"
據中研産業研究院公布《2022-2026 年中國搜索引擎行業競争格局及發展趨勢預測報告》(以下簡稱《報告》)顯示,聚焦國内搜索引擎産品,百度搜索市場份額持續增長,至 2022 年第一季度達到 84.21%,是國内第一大搜索引擎。搜狗搜索是我國第二大搜索引擎,但市場份額遠低于百度。
ChatGPT 目前最好的商業應用就是搜索,這剛好是百度一直以來的基本盤,為實現李彥宏 " 人人需要的産品 " 藍圖提供了天然優勢。
實際上,在百度 Create AI 開發者大會前夕,百度搜索便宣布将基于百度自研的生成式模型,升級 " 生成式搜索 " 能力,并指出,生成式 AI 和搜索引擎是互補關系而不是替代,搜索底層技術和 AI 底層技術是相通的。
ChatGPT 契合百度,百度也急需 ChatGPT 實現自我革新。ChatGPT 算不上新應用,但此次卻從核心技術層面擴展到大衆層面。
在國内,百度盡管仍為國内第一大搜索引擎,但抖音、快手、微博、小紅書、微信等社交平台帶來的搜索壓力卻不容小觑。以抖音為例,據官方已公開數據,截至去年底,抖音月活躍用戶超過 5.5 億,而日均搜索用戶已超過 4 億。
在國外,《報告》顯示,2019-2022 年第一季谷歌與 Bing 引擎産品在我國的市場份額均僅有百分之幾,不過 Bing 市場份額逐年遞增,從 2.34% 增至 5.65%。盡管谷歌在國内份額跌破 5%;但在全球獨占鳌頭,近年來市場份額均高于 90%。
ChatGPT+ 微軟 Bing 勢必會對谷歌造成沖擊,而若抓住這次機會,或許會讓百度找到新的增長曲線。
據紅杉資本預測,2023 年文本、代碼生成有望得以成熟應用,圖像、音視頻生成尚處于生成基礎初稿的階段。
張毅指出,搜索引擎是大家虎視眈眈的産品,很多巨頭會布局這個賽道,這是争奪下一代搜索引擎産品的窗口和契機,對所有要獲取流量和占據用戶心智的企業來講,都是一個絕佳的機會。
在百度公布 ChatGPT 項目的同時,三六零在在互動平台表示,該公司的人工智能研究院從 2020 年開始一直在包括類 ChatGPT 技術在内的 AIGC 技術上有持續性的投入。公司也計劃盡快推出類 ChatGPT 技術的 demo 版産品。
面對 ChatGPT 的新起點,傳統搜索需要變革,百度能否借此一路 " 狂飙 ",還需拭目以待。