GPT-4震撼空降，谷歌「緊追」微軟有點難

本文爲澎湃号 · 湃客 X 另鏡聯合出品，湃客财經欄目獨家首發

作者 | 劉雨婷

編輯 | 陳彥旭

運營|陳小妍

策劃| 晨曦 丁珏汭（澎湃新聞高級編輯）

另鏡 ( ID:DMS-012 )

海内外互聯網大廠與創業者，正陷入一場有關 ChatGPT 的競賽中。

3 月 15 日淩晨，OpenAI 推出 GPT-4 多模态預訓練大模型，除語言文本外，還支持圖像識别輸入，以文本形式輸出。

在發布會上，官方人員演示 GPT-4 可以識别手繪網頁草圖，并僅用十秒鍾左右，就根據草圖寫出網站代碼。

在 OpenAI 發布會前幾個小時，谷歌剛剛宣布推出一系列生成式 AI 功能，用于其各種辦公軟件中，包括谷歌 Gmail、Docs（文檔）、Sheets（表格）和 Slides（幻燈片）。

在外界看來，這是谷歌意圖搶在微軟 3 月 16 日預期官宣 GPT 接入 Office 之前，展現自己的成果。

作爲直接競争對手，谷歌已走在 " 對抗 " 微軟與 OpenAI 的最前列。但随着 OpenAI 空降官宣 GPT-4，谷歌又陷入下一場追逐戰中。

ChatGPT 是 AIGC 領域的颠覆性産品，在上線後吸引了全球關注。将 ChatGPT 嵌入微軟 Bing 搜索引擎後，Bing 日活首次突破 1 億，直接影響到谷歌的用戶基礎。

面對微軟的步步緊逼，蘋果、Meta 和亞馬遜等公司也正計劃重新評估其人工智能的開發策略。

3 月 16 日，百度将率先發布 " 中國版 ChatGPT" 文心一言。國内創業公司和互聯網大廠，都迅速跟進，不願成爲新技術掉隊者。在王興、王慧文再度攜手、開啓 AI 領域創業的同時，快手前 AI 核心人物李岩也投身 " 多模态大模型 " 創業。

随着 OpenAI 發布 GPT-4，多模态大模型已成爲最新的技術變革方向，人工智能正邁入 "iPhone 時刻 "。正如 iPhone 帶來的智能手機變革，GPT 模型的出現又将影響未來 AI 領域的發展方向。

如今，微軟與谷歌競争的不隻是當前的市場，還有未來 AI 時代的定義标準與話語權。

GPT-4：多模态變革

Distinct Mirror

面對 ChatGPT 的步步緊逼，海外大廠都在追趕和阻擊微軟，以動搖其目前在人工智能領域的領先地位。

在 " 對抗 " 微軟與 Open AI 方面，谷歌已經走在前列。知情人士透露，谷歌高級管理層已經宣布 " 紅色指令 "，其中要求在幾個月時間裏将 " 生成式人工智能 " 技術集成到谷歌的所有重要産品中。

去年 12 月，谷歌母公司 Alphabet 就曾發布 " 紅色警告 "，已處于半退休狀态的創始人拉裏 · 佩奇和謝爾蓋 · 布林重新回到公司，商讨制定了人工智能後續戰略，并決定将聊天機器人納入搜索引擎，以應對 ChatGPT 的威脅。

但從微軟和 OpenAI 近期舉動來看，單純的文本交互已無法滿足其在生成式 AI 方向的野望，包含文本、圖像、視頻處理等在内的多模态大模型已成爲其最新的技術變革發力點。

在 GPT4.0 發布前，今年 3 月初，微軟發布了多模态 AI 大模型 Kosmos-1。微軟 AI 技術專家 Holger Kenn 表示，多模态 AI 不僅能夠将文本轉變成圖像，還可以轉變成音樂和視頻，尤其在編程領域，AI 模型能夠更輕松的生成樣闆代碼。

在微軟發布 Kosmos-1 後，3 月 7 日，谷歌和柏林工業大學的團隊推出了 PaLM-E 視覺語言模型，參數量高達 5620 億，約爲 GPT-3 參數量的三倍。

據悉，PaLM-E 大模型是在語言類模型 PaLM（5400 億參數）和視覺類模型 ViT（220 億參數）的基礎上開發的。其不僅可以理解圖像，還能理解、生成語言，以及将兩者結合，處理複雜的機器人指令。

谷歌與微軟的較量不僅體現在生成式 AI 的場景應用層面，也聚焦于大模型底層實力。但随着 GPT4.0 的發布，多模态大模型的能力得到進一步展現，谷歌的聲量又再度落于下風。

今天淩晨，OpenAI 發布最新 GPT4.0 多模态大模型，引爆全網讨論。與前一代相比，最新的 GPT4.0 可以識别圖片輸入；文字輸入上限提升至 2.5 萬字；回答深度和專業性、推理和風格變化能力也顯著提高。

OpenAI 稱，GPT-4 在各種專業學術基準上有着人類水平表現。在最新測試中，GPT-4 通過了模拟律師考試，得分約爲前 10%，而 GPT-3.5 得分約爲倒數 10%。GRE、SAT 數學考試成績也有大幅提升，擊敗了 80% 以上的人類答題水平。

GPT-4 也擁有更高級的推理能力。用戶在 GPT 上傳了一張梗圖，問這張圖爲什麽會引人發笑：

GPT4.0 一一給出回答：

在官方的示例中，GPT-4.0 可以 10 秒鍾編寫網站代碼，可以編寫劇本、計算物理題、速讀專業論文、分析數據圖表，甚至可以解讀搞笑圖片與漫畫。

在業内人士看來，生成式 AI 的産生本質上是一種生産力革命，其不僅是工具，而是直接成爲生産要素的重要部分。以文本、音頻、圖像和視頻爲處理對象的多模态大模型和生成式 AI，勢必會對未來的内容創作、數據處理等相關行業帶來巨大沖擊。

AI 對傳統工作方式的革命和颠覆或許即将到來，未來最核心的競争力和技能可能不再是編程，計算，甚至分析能力，而是和大模型的對話能力。

現在人工智能正處于一個決定性的時刻，就像 90 年代的互聯網以及 iPhone 帶來的手機變革，人工智能正朝着大規模采用的方向發展，ChatGPT 類的大模型正推動數據革命。

美國銀行戰略分析師預測，人工智能正邁入 "iPhone 時刻 "，預估到 2030 年會爲全球經濟帶來 15.7 萬億美元的增長。

在過去，蘋果曾經兩次定義硬件工具的交互方式：PC 時代的 Apple Lisa 電腦，是首次采用圖形用戶界面 ( GUI ) 和鼠标的個人電腦；到智能手機時代，iPhone 定義了觸控交互。

如今，ChatGPT 已經改變了人與文字、知識的交互方式，而下一步，ChatGPT 類的大模型又将影響未來 AI 的發展方向和人類的工作方式。

ChatGPT 開放端口是創業機會嗎？

作爲 OpenAI 背後的投資者，微軟的相關産品已經取得了初步成果。

微軟在 GPT-4 發布後第一時間表示，新的 Bing 已經基于 GPT-4 技術運行，這是爲搜索産品量身定制的模型産品。

在集成 ChatGPT 的 Bing 搜索引擎推出一個月後，微軟宣布 Bing 每日活躍用戶首次突破 1 億，每天大約有 1/3 的必應用戶與 BingChat 進行交互。此外，Bing 在移動設備上的使用率也有所增長，BingChat 應用使得每日活躍用戶增加了 6 倍。

此外，微軟宣布，将于 3 月 16 日召開 " 工作的 AI 未來 " 發布會，預計将展示其類似 ChatGPT 的人工智能，如何在 Teams、Word 和 Outlook 等 Office 生産力套件中發揮作用。

從 Bing 浏覽器到 Office 辦公套件，微軟正籌劃将 AI 賦能更多 C 端、甚至 B 端用戶。據悉，微軟計劃将 ChatGPT 背後的技術整合到其 Power Platform 平台上，允許用戶在幾乎不需要編碼的情況下，就能開發自己的應用程序。

" 我們不想把它打造成定制産品，它一開始是一個定制産品，但我們總是想辦法把它打造成通用型産品，這樣任何想訓練大型語言模型的人都可以利用同樣的改進，" 微軟負責雲計算和人工智能的執行副總裁斯科特・格思裏曾對外表示，" 這真的能夠幫助我們成爲使用更廣泛的人工智能雲。"

對旗下平台進行 AI 賦能是互聯網大廠的優勢，微軟、谷歌、BAT 等互聯網大廠具備充足的資金和技術支持，同時具備龐大的 C 端流量入口。對于他們來說，開發自有大模型一方面可以探索更多的場景和商業模式，另一方面也是爲了保證自身對于用戶的競争力和行業話語權。

但對于資金和技術實力欠缺的企業或創業者來說，利用大廠開源模型，優先采用接口模式，結合自身産品，将重心放在更具體的需求場景上，或許才是最優的選擇。

ChatGPT 之父、OpenAI 創始人山姆 · 阿爾特曼在 3 月 10 日的摩根士丹利大會上透露，OpenAI 将重點開發一個平台，向開發者開放 API 接口，并創建類似 ChatGPT 的應用程序，第三方開發者被允許通過 API 将 ChatGPT 集成到他們的應用程序和服務中。

OpenAI 将推出一系列工具，讓用戶可以更好地控制這套生成式人工智能系統，并針對通用用戶用例和具體用戶用例進行改進。

最新 GPT-4 發布後，OpenAI 把 ChatGPT 直接升級爲 GPT-4 最新版本。同時，OpenAI 開放了 GPT-4 的 API。

ChatGPT Plus 付費訂閱用戶可以獲得具有使用上限的 GPT-4 訪問權限（每 4 小時 100 條消息），可以向 GPT-4 模型發出純文本請求，圖像輸入處于研究預覽階段，仍不完全公開。

用戶可以申請使用 GPT-4 的 API，OpenAI 會邀請部分開發者體驗，并逐漸擴大邀請範圍。該 API 的定價爲每輸入 1000 個字符 ( 約合 750 個單詞 ) ，價格爲 0.03 美元；GPT-4 每生成 1000 個字符，價格爲 0.06 美元。

與前一代模型相比，新推出的 GPT-4 API 價格提高不少。3 月 2 日，OpenAI 剛剛放出 ChatGPT API，比之前的 GPT-3.5 模型便宜 10 倍，每生成 1000 字符，價格爲 0.002 美元，即 2.7 美元就可輸出 100 萬個字符。

自去年 12 月以來，ChatGPT 對于處理查詢的方式進行了優化，使成本降低 90%，最終帶來了面向用戶的大幅降價，GPT-4 或許也能在将來重複這一過程，這将大大降低開發人員利用 ChatGPT 賦能自身産品的難度。

當調用 ChatGPT 模型的能力不再是門檻，對于場景賽道的理解、商業模式的構建能力就成爲企業的核心競争優勢。

北極光創投合夥人張朋在一場直播中向創業者提出建議，産品和服務不能僅依靠調用大模型的能力，還要實現差異化，比如工具層 + 應用層結合在客戶的場景落地，讓客戶買的是場景的價值。

張朋認爲，從變現角度，最好從應用層下手，" 以 Pass 爲例的中間層的很難盈利，大多客戶難以從通用模型框架自我研究出解決方案，還需要提供細化到應用的服務，B 端客戶需要的不是工具，是解決方案。"

千萬美元入場券

美團聯合創始人王慧文對于 AI 的态度很明确，" 關于人工智能，到現在爲止，我隻有一個判斷，必須參與。"

今年 2 月，王慧文在朋友圈發布 " 組隊帖 "，要帶資 5000 萬美元進入 AI 賽道，設立光年之外科技有限公司，資金占股 25%，其餘 75% 的股份用于邀請頂級研發人員，打造中國 Open AI。

據王慧文透露，光年之外估值達 2 億美元，下輪融資已有頂級 VC 認購 2.3 億美元。3 月 8 日，美團創始人王興在朋友圈回應王慧文的宣言，宣布将以個人身份參與王慧文的創業公司 " 光年之外 " 的 A 輪投資，并出任董事。

在 " 雙王 " 三度攜手、進場 AI 賽道的同時，衆多互聯網大佬紛紛開始招兵買馬，争相搶奪人才：原京東集團高級副總裁、集團技術委員會主席周伯文同樣在朋友圈發布招募研發、産品及算法人員，原搜狗 CEO 王小川對媒體回應正快速籌備 AI 大模型，快手前 AI 核心人物李岩也投身 " 大模型 " 賽道創業，成立 AI 公司元石科技，進行多模态大模型的研發。

百度、騰訊、阿裏、字節跳動等互聯網大廠也在 " 争分奪秒 " 開發自有大模型，百度宣布将于 3 月 16 日推出類似産品 " 文心一言 "，騰訊針對類 ChatGPT 産品已成立 " 混元助手 " 項目組，阿裏巴巴則表示其聊天機器人正處于研發内測階段。

在 OpenAI 發布 GPT4.0 後，即将發布文心一言的百度壓力再度增加。ChatGPT 的背後離不開大模型、大數據、大算力，大廠想要追趕 Open AI，也需要面臨多方面的挑戰。

在算力要求方面，市場調查機構 TrendForce 集邦咨詢公布的最新報告指出，如果以英偉達 A100 顯卡的處理能力計算，運行 ChatGPT 将需要使用到 3 萬塊英偉達 GPU，目前英偉達 A100 顯卡的售價在 1 萬 -1.5 萬美元之間，3 萬塊售價超過 3 億美金。

除算力要求高外，需要大量的數據集得到 ChatGPT 訓練成本非常高昂。其使用 Transformer 神經網絡架構，訓練數據來自包括維基百科，以及真實對話在内的龐大語料庫，有着多達 1750 億個模型參數。

根據中信研報測算，ChatGPT 生成一條信息的成本在 1.3 美分左右，是目前傳統搜索引擎的 3-4 倍，成本問題中短期内或隻能等待硬件成本的繼續下降。

盡管目前技術上還在追趕 Open AI，但在這條新興賽道上，BAT 并不想缺席。

如今，現在生成式 AI 的商業模式還有待探索，但人的想象力是無窮的。ChatGPT 可以寫詩，可以優化搜索，可以回複郵件，可以整理數據，也可以編寫代碼……

ChatGPT 隻是更偉大事物的開始，英偉達 CEO 黃仁勳表示，" 你知道你今天做不到，但是當然，它總有一天會做到的 "。

無論現在的微軟、谷歌、百度等旗下的聊天機器人表現如何，這也隻是新時代 AI 技術叠代的最開始，未來的 AI 産業勢必會更精彩。