本文爲澎湃号 · 湃客 X 另鏡聯合出品,湃客财經欄目獨家首發
作者 | 劉雨婷
編輯 | 陳彥旭
運營|陳小妍
策劃| 晨曦 丁珏汭(澎湃新聞高級編輯)
另鏡 ( ID:DMS-012 )
海内外互聯網大廠與創業者,正陷入一場有關 ChatGPT 的競賽中。
3 月 15 日淩晨,OpenAI 推出 GPT-4 多模态預訓練大模型,除語言文本外,還支持圖像識别輸入,以文本形式輸出。
在發布會上,官方人員演示 GPT-4 可以識别手繪網頁草圖,并僅用十秒鍾左右,就根據草圖寫出網站代碼。
在 OpenAI 發布會前幾個小時,谷歌剛剛宣布推出一系列生成式 AI 功能,用于其各種辦公軟件中,包括谷歌 Gmail、Docs(文檔)、Sheets(表格)和 Slides(幻燈片)。
在外界看來,這是谷歌意圖搶在微軟 3 月 16 日預期官宣 GPT 接入 Office 之前,展現自己的成果。
作爲直接競争對手,谷歌已走在 " 對抗 " 微軟與 OpenAI 的最前列。但随着 OpenAI 空降官宣 GPT-4,谷歌又陷入下一場追逐戰中。
ChatGPT 是 AIGC 領域的颠覆性産品,在上線後吸引了全球關注。将 ChatGPT 嵌入微軟 Bing 搜索引擎後,Bing 日活首次突破 1 億,直接影響到谷歌的用戶基礎。
面對微軟的步步緊逼,蘋果、Meta 和亞馬遜等公司也正計劃重新評估其人工智能的開發策略。
3 月 16 日,百度将率先發布 " 中國版 ChatGPT" 文心一言。國内創業公司和互聯網大廠,都迅速跟進,不願成爲新技術掉隊者。在王興、王慧文再度攜手、開啓 AI 領域創業的同時,快手前 AI 核心人物李岩也投身 " 多模态大模型 " 創業。
随着 OpenAI 發布 GPT-4,多模态大模型已成爲最新的技術變革方向,人工智能正邁入 "iPhone 時刻 "。正如 iPhone 帶來的智能手機變革,GPT 模型的出現又将影響未來 AI 領域的發展方向。
如今,微軟與谷歌競争的不隻是當前的市場,還有未來 AI 時代的定義标準與話語權。
GPT-4:多模态變革
Distinct Mirror
面對 ChatGPT 的步步緊逼,海外大廠都在追趕和阻擊微軟,以動搖其目前在人工智能領域的領先地位。
在 " 對抗 " 微軟與 Open AI 方面,谷歌已經走在前列。知情人士透露,谷歌高級管理層已經宣布 " 紅色指令 ",其中要求在幾個月時間裏将 " 生成式人工智能 " 技術集成到谷歌的所有重要産品中。
去年 12 月,谷歌母公司 Alphabet 就曾發布 " 紅色警告 ",已處于半退休狀态的創始人拉裏 · 佩奇和謝爾蓋 · 布林重新回到公司,商讨制定了人工智能後續戰略,并決定将聊天機器人納入搜索引擎,以應對 ChatGPT 的威脅。
但從微軟和 OpenAI 近期舉動來看,單純的文本交互已無法滿足其在生成式 AI 方向的野望,包含文本、圖像、視頻處理等在内的多模态大模型已成爲其最新的技術變革發力點。
在 GPT4.0 發布前,今年 3 月初,微軟發布了多模态 AI 大模型 Kosmos-1。微軟 AI 技術專家 Holger Kenn 表示,多模态 AI 不僅能夠将文本轉變成圖像,還可以轉變成音樂和視頻,尤其在編程領域,AI 模型能夠更輕松的生成樣闆代碼。
在微軟發布 Kosmos-1 後,3 月 7 日,谷歌和柏林工業大學的團隊推出了 PaLM-E 視覺語言模型,參數量高達 5620 億,約爲 GPT-3 參數量的三倍。
據悉,PaLM-E 大模型是在語言類模型 PaLM(5400 億參數)和視覺類模型 ViT(220 億參數)的基礎上開發的。其不僅可以理解圖像,還能理解、生成語言,以及将兩者結合,處理複雜的機器人指令。
谷歌與微軟的較量不僅體現在生成式 AI 的場景應用層面,也聚焦于大模型底層實力。但随着 GPT4.0 的發布,多模态大模型的能力得到進一步展現,谷歌的聲量又再度落于下風。
今天淩晨,OpenAI 發布最新 GPT4.0 多模态大模型,引爆全網讨論。與前一代相比,最新的 GPT4.0 可以識别圖片輸入;文字輸入上限提升至 2.5 萬字;回答深度和專業性、推理和風格變化能力也顯著提高。
OpenAI 稱,GPT-4 在各種專業學術基準上有着人類水平表現。在最新測試中,GPT-4 通過了模拟律師考試,得分約爲前 10%,而 GPT-3.5 得分約爲倒數 10%。GRE、SAT 數學考試成績也有大幅提升,擊敗了 80% 以上的人類答題水平。
GPT-4 也擁有更高級的推理能力。用戶在 GPT 上傳了一張梗圖,問這張圖爲什麽會引人發笑:
GPT4.0 一一給出回答:
在官方的示例中,GPT-4.0 可以 10 秒鍾編寫網站代碼,可以編寫劇本、計算物理題、速讀專業論文、分析數據圖表,甚至可以解讀搞笑圖片與漫畫。
在業内人士看來,生成式 AI 的産生本質上是一種生産力革命,其不僅是工具,而是直接成爲生産要素的重要部分。以文本、音頻、圖像和視頻爲處理對象的多模态大模型和生成式 AI,勢必會對未來的内容創作、數據處理等相關行業帶來巨大沖擊。
AI 對傳統工作方式的革命和颠覆或許即将到來,未來最核心的競争力和技能可能不再是編程,計算,甚至分析能力,而是和大模型的對話能力。
現在人工智能正處于一個決定性的時刻,就像 90 年代的互聯網以及 iPhone 帶來的手機變革,人工智能正朝着大規模采用的方向發展,ChatGPT 類的大模型正推動數據革命。
美國銀行戰略分析師預測,人工智能正邁入 "iPhone 時刻 ",預估到 2030 年會爲全球經濟帶來 15.7 萬億美元的增長。
在過去,蘋果曾經兩次定義硬件工具的交互方式:PC 時代的 Apple Lisa 電腦,是首次采用圖形用戶界面 ( GUI ) 和鼠标的個人電腦;到智能手機時代,iPhone 定義了觸控交互。
如今,ChatGPT 已經改變了人與文字、知識的交互方式,而下一步,ChatGPT 類的大模型又将影響未來 AI 的發展方向和人類的工作方式。
ChatGPT 開放端口是創業機會嗎?
作爲 OpenAI 背後的投資者,微軟的相關産品已經取得了初步成果。
微軟在 GPT-4 發布後第一時間表示,新的 Bing 已經基于 GPT-4 技術運行,這是爲搜索産品量身定制的模型産品。
在集成 ChatGPT 的 Bing 搜索引擎推出一個月後,微軟宣布 Bing 每日活躍用戶首次突破 1 億,每天大約有 1/3 的必應用戶與 BingChat 進行交互。此外,Bing 在移動設備上的使用率也有所增長,BingChat 應用使得每日活躍用戶增加了 6 倍。
此外,微軟宣布,将于 3 月 16 日召開 " 工作的 AI 未來 " 發布會,預計将展示其類似 ChatGPT 的人工智能,如何在 Teams、Word 和 Outlook 等 Office 生産力套件中發揮作用。
從 Bing 浏覽器到 Office 辦公套件,微軟正籌劃将 AI 賦能更多 C 端、甚至 B 端用戶。據悉,微軟計劃将 ChatGPT 背後的技術整合到其 Power Platform 平台上,允許用戶在幾乎不需要編碼的情況下,就能開發自己的應用程序。
" 我們不想把它打造成定制産品,它一開始是一個定制産品,但我們總是想辦法把它打造成通用型産品,這樣任何想訓練大型語言模型的人都可以利用同樣的改進," 微軟負責雲計算和人工智能的執行副總裁斯科特・格思裏曾對外表示," 這真的能夠幫助我們成爲使用更廣泛的人工智能雲。"
對旗下平台進行 AI 賦能是互聯網大廠的優勢,微軟、谷歌、BAT 等互聯網大廠具備充足的資金和技術支持,同時具備龐大的 C 端流量入口。對于他們來說,開發自有大模型一方面可以探索更多的場景和商業模式,另一方面也是爲了保證自身對于用戶的競争力和行業話語權。
但對于資金和技術實力欠缺的企業或創業者來說,利用大廠開源模型,優先采用接口模式,結合自身産品,将重心放在更具體的需求場景上,或許才是最優的選擇。
ChatGPT 之父、OpenAI 創始人山姆 · 阿爾特曼在 3 月 10 日的摩根士丹利大會上透露,OpenAI 将重點開發一個平台,向開發者開放 API 接口,并創建類似 ChatGPT 的應用程序,第三方開發者被允許通過 API 将 ChatGPT 集成到他們的應用程序和服務中。
OpenAI 将推出一系列工具,讓用戶可以更好地控制這套生成式人工智能系統,并針對通用用戶用例和具體用戶用例進行改進。
最新 GPT-4 發布後,OpenAI 把 ChatGPT 直接升級爲 GPT-4 最新版本。同時,OpenAI 開放了 GPT-4 的 API。
ChatGPT Plus 付費訂閱用戶可以獲得具有使用上限的 GPT-4 訪問權限(每 4 小時 100 條消息),可以向 GPT-4 模型發出純文本請求,圖像輸入處于研究預覽階段,仍不完全公開。
用戶可以申請使用 GPT-4 的 API,OpenAI 會邀請部分開發者體驗,并逐漸擴大邀請範圍。該 API 的定價爲每輸入 1000 個字符 ( 約合 750 個單詞 ) ,價格爲 0.03 美元;GPT-4 每生成 1000 個字符,價格爲 0.06 美元。
與前一代模型相比,新推出的 GPT-4 API 價格提高不少。3 月 2 日,OpenAI 剛剛放出 ChatGPT API,比之前的 GPT-3.5 模型便宜 10 倍,每生成 1000 字符,價格爲 0.002 美元,即 2.7 美元就可輸出 100 萬個字符。
自去年 12 月以來,ChatGPT 對于處理查詢的方式進行了優化,使成本降低 90%,最終帶來了面向用戶的大幅降價,GPT-4 或許也能在将來重複這一過程,這将大大降低開發人員利用 ChatGPT 賦能自身産品的難度。
當調用 ChatGPT 模型的能力不再是門檻,對于場景賽道的理解、商業模式的構建能力就成爲企業的核心競争優勢。
北極光創投合夥人張朋在一場直播中向創業者提出建議,産品和服務不能僅依靠調用大模型的能力,還要實現差異化,比如工具層 + 應用層結合在客戶的場景落地,讓客戶買的是場景的價值。
張朋認爲,從變現角度,最好從應用層下手," 以 Pass 爲例的中間層的很難盈利,大多客戶難以從通用模型框架自我研究出解決方案,還需要提供細化到應用的服務,B 端客戶需要的不是工具,是解決方案。"
千萬美元入場券
美團聯合創始人王慧文對于 AI 的态度很明确," 關于人工智能,到現在爲止,我隻有一個判斷,必須參與。"
今年 2 月,王慧文在朋友圈發布 " 組隊帖 ",要帶資 5000 萬美元進入 AI 賽道,設立光年之外科技有限公司,資金占股 25%,其餘 75% 的股份用于邀請頂級研發人員,打造中國 Open AI。
據王慧文透露,光年之外估值達 2 億美元,下輪融資已有頂級 VC 認購 2.3 億美元。3 月 8 日,美團創始人王興在朋友圈回應王慧文的宣言,宣布将以個人身份參與王慧文的創業公司 " 光年之外 " 的 A 輪投資,并出任董事。
在 " 雙王 " 三度攜手、進場 AI 賽道的同時,衆多互聯網大佬紛紛開始招兵買馬,争相搶奪人才:原京東集團高級副總裁、集團技術委員會主席周伯文同樣在朋友圈發布招募研發、産品及算法人員,原搜狗 CEO 王小川對媒體回應正快速籌備 AI 大模型,快手前 AI 核心人物李岩也投身 " 大模型 " 賽道創業,成立 AI 公司元石科技,進行多模态大模型的研發。
百度、騰訊、阿裏、字節跳動等互聯網大廠也在 " 争分奪秒 " 開發自有大模型,百度宣布将于 3 月 16 日推出類似産品 " 文心一言 ",騰訊針對類 ChatGPT 産品已成立 " 混元助手 " 項目組,阿裏巴巴則表示其聊天機器人正處于研發内測階段。
在 OpenAI 發布 GPT4.0 後,即将發布文心一言的百度壓力再度增加。ChatGPT 的背後離不開大模型、大數據、大算力,大廠想要追趕 Open AI,也需要面臨多方面的挑戰。
在算力要求方面,市場調查機構 TrendForce 集邦咨詢公布的最新報告指出,如果以英偉達 A100 顯卡的處理能力計算,運行 ChatGPT 将需要使用到 3 萬塊英偉達 GPU,目前英偉達 A100 顯卡的售價在 1 萬 -1.5 萬美元之間,3 萬塊售價超過 3 億美金。
除算力要求高外,需要大量的數據集得到 ChatGPT 訓練成本非常高昂。其使用 Transformer 神經網絡架構,訓練數據來自包括維基百科,以及真實對話在内的龐大語料庫,有着多達 1750 億個模型參數。
根據中信研報測算,ChatGPT 生成一條信息的成本在 1.3 美分左右,是目前傳統搜索引擎的 3-4 倍,成本問題中短期内或隻能等待硬件成本的繼續下降。
盡管目前技術上還在追趕 Open AI,但在這條新興賽道上,BAT 并不想缺席。
如今,現在生成式 AI 的商業模式還有待探索,但人的想象力是無窮的。ChatGPT 可以寫詩,可以優化搜索,可以回複郵件,可以整理數據,也可以編寫代碼……
ChatGPT 隻是更偉大事物的開始,英偉達 CEO 黃仁勳表示," 你知道你今天做不到,但是當然,它總有一天會做到的 "。
無論現在的微軟、谷歌、百度等旗下的聊天機器人表現如何,這也隻是新時代 AI 技術叠代的最開始,未來的 AI 産業勢必會更精彩。