AI 再次看到了實現商業化價值的曙光。
這次,借助 OpenAI 團隊的 AI 夢想結晶,現象級産品 "ChatGPT",AI 應用火出天際。
但是,就目前而言,ChatGPT 和之前的 AI 産品一樣,仍未随之出現可見的商業化模式。
既出人意料而又無意外,這看上去矛盾。但多年的實踐證明,作爲技術應用大國,中國對原創技術的商業化應用探索,常能領先。如今,這對矛盾又一次在類 ChatGPT 商業化價值探索領域,閃耀着這抹中國色彩。
來自中國合肥的 AI 創業公司——未來智能,開發的會議辦公耳機 iFLYBUDS 系列,即爲類 ChatGPT 平台商業化做多年努力的結果呈現,也是爲之實現商業價值的生态系統,提供垂直場景數據和訓練叠代的智能終端。
多年的原創技術和應用大勢都曾經或仍在證明:共建才能産生真正的商業繁榮,而共建法則,即構建生态平台。從 ChatGPT 聚合的技術應用前景看,ChatGPT 具備生态特征。
生态需要何種應用技術?未來智能的會議耳機這種 AI 終端有哪些功能,和 ChatGPT 有什麽關系?如何實現商業化?
老問題:ChatGPT 爲何在美問世
從 AI 技術發展路徑看,ChatGPT 并非新技術成果。在理論上,ChatGPT 沒有更多創建——核心技術在 2017 年就已出現。
這次爲很麽能大火?" 因爲面向公衆開放。" 未來智能 CEO 馬嘯對華爾街見聞說," 原先 ChatGPT 做的是企業級服務,或面向大型開發者,這次對公衆開放後掀起狂潮。"
ChatGPT 問世後橫掃全球,在短期内(2 個月)即積累了 1 億用戶,成爲全球迄今爲止達成 1 億用戶最快的技術應用工具。說這是工具,但究竟什麽是 ChatGPT?
簡單說,ChatGPT 是用 Problem Models(問題模型)加上 1750 億個參數 / 節點,以之爲基礎提供巨量、有監督的學習數據,借助 Transformer 架構," 投喂 " 給 AI 訓練模型,做出的 AI 應用效果。
這麽解釋或許過于抽象,那就換種說法。
顧名思義,ChatGPT 中的 "Chat" 是 " 聊天 " 的意思,GPT 是什麽?這是 OpenAI 公司的一個 AI 技術名詞。民生證券電子行業分析師方競在研報中寫道:ChatGPT 是基于 OpenAI GPT 技術的聊天機器人,擁有 3000 億單詞的語料基礎,預訓練出擁有 1750 億個參數的模型。
由于 GPT 的技術核心 Transformer 神經網絡架構在 2017 年就實現了開源——這個架構由谷歌創建,其革命性在于能讓 AI" 聽懂人話 " ——因此,中國 AI 領域對此也不陌生。
但是,中國在技術領域一向有着秉持實用主義的 " 優秀 " 傳統,不願爲看不見或不明确的未來持續投入資本。因此,沒有人像 OpenAI 那樣,持續保持大投入,通過 Transformer 架構做 AI 技術開發。
" 大模型要燒很多錢,因爲要大規模做算力分布式節點投入。" 馬嘯說," 所以 2017 年以來,國内都在觀望。"
從現實的角度看,國内不敢投入,也确實因爲基于 Transformer 架構的 AI 技術開發成本難以承受。
自 2017 年,Transformer 神經網絡架構問世,AI 即進入大模型階段。這什麽意思?大模型有三要素,即算力、算法和數據。這三要素的相互關系是,算力的強弱,決定算法的效率,而算法又決定數據的有效性;反過來,數據是訓練算法的要件,能決定 AI 學到的知識量。
在業界,能提供高效 AI 訓練的載體是英偉達的 A100 和 H100 等 AI 專用顯卡。這種專用顯卡與普通消費級顯卡的區别在于,後者通常會将部分算力讓渡于光追等功能,而前者的特點是從硬件設計到軟件配套,都爲 all in AI 服務。
如此很明顯,GPT 的訓練效果優劣,與投入的顯卡數量有關——巨額成本即源于此。
這成本多高呢?據說有機構做了測算,訓練一個 GPT-3,需要至少 1024 張 A100 顯卡持續運轉 30 天,而 A100 顯卡最便宜的版本,價格也高達 8769 美元。也就是說,爲 AI 訓練做最基礎的核心硬件準備,就得投入 880 萬美元。
除了最基礎的高額硬件投入,ChatGPT 訓練所耗費的成本才是不可承受之重。訓練一次,需要 1000 萬美元,要訓練出一個 GPT-3,以每天訓練 10 次,持續 30 天計算,需要投入 30 億美元。
這就是爲什麽國内對開發基于 Transformer 架構的 GPT 技術缺乏探索熱情的原因。
因爲,成本太高!
樣本:" 未來智能 " 會議耳機
現在,美國 OpenAI 用實力證明 GPT 技術應用的有效性。
國内聞風而動。
但是,出于同樣的原因——實用主義——國内對新技術全部熱情的考量源自 " 這種技術能不能創造出确定的應用商業價值。
現在,ChatGPT 剛剛問世,還沒出現能大規模落地的商業模式。此時,中國技術公司行動的時刻到了。
就像在頂層話語體系中,相對于傳統的西方式現代化,有中國式現代化一樣(類似的相對于美國夢的中國夢),國内也會出現中國式 ChatGPT,頂層已有此方面的明确指向。
在馬嘯看來,中國式 ChatGPT,可能的演進路徑是數家像百度、騰訊或阿裏那樣的大廠負責平台搭建,之後在此平台上,必然會有 " 大量基于垂直領域的微調模型,在(中國式)ChatGPT 上做垂直領域服務 "。
這是互聯網和移動互聯網技術和商業模式發展的曆史路徑,也很可能是 ChatGPT 在中國發展的未來方向。
一旦國内 ChatGPT 開放 API 接口,這些做垂直領域小模型技術開發或服務的公司,就能随之接入平台,爲之提供垂直細分場景的訓練數據和成果,共同爲中國式 ChatGPT 平台的商業繁榮添磚加瓦。
有沒有這種公司在做這種探索?
答案:有。
馬嘯領導的未來智能,已經持續開發了多年 AI 訓練的終端:辦公會議耳機。這種品類,立足于細分的辦公會議場景,解決辦公場景錄音、記錄、文字轉化或語言翻譯等多種問題,目的是幫助會議參與人提升辦公效率。
辦公會議耳機的定位,也就是目标消費群體,包括城市白領、政府官員、律師、記者、外貿從業人員、跨國公司管理和券商分析師等,從中提煉符合職業标準提問的問題模闆,以供後續同樣場景做調用,這能大幅提升交流效率。
在此過程中,實際上就涉及了垂直領域多種職業的特定語義标簽 / 參數提煉,形成大規模的海量用戶數據(庫),近似于創建語義大模型。在此基礎上,随着耳機目标用戶的高頻日常使用,相當于在做标準職業問題模闆的 AI 訓練。這是未來智能開發的辦公會議耳機與 ChatGPT 的内在關系寫照。
舉個例子,職業投資人經常跟企業開會,以更全面了解企業情況,以此爲投資與否提供參考依據。一般來說,投資人會經常問些共性問題:比如企業年營收多少?有多少盈利?毛利或估值是多少?這種大量的重複性問題,可通過會議耳機的 AI 技術做标準化特性提取。
當這種垂直職業的數據積累得越多,會議耳機能提取的信息就越精準。通過高效問題模型訓練,就會有極大的機會湧現出非常有價值的服務。随後,再通過這種優質服務,帶動耳機或其他可能的硬件端的銷售,以此形成商業閉環,這就是技術和服務雙輪驅動。
目前,未來智能的辦公會議耳機已叠代到第四代,共四種類型。2022 年,會議耳機出貨量同比實現 10 倍增長。到 2024 年,未來智能辦公會議耳機銷量将超過百萬台。
更重要的是,這種耳機的 AI 特性,未來智能的存量或增量耳機都在平時的高頻應用中,持續爲未來智能的雙輪驅動閉環提供動力。
這就是中國式 ChatGPT 平台商業應用的實際發展和可見的商業價值路徑。更重要的是,這一路徑經過實踐被證明是切實有效的。
核心價值:推動生态共建
要明晰未來智能會議耳機的商業價值,這也是中國式 ChatGPT 在垂直領域商業化可能的樣本。對于這樣的樣本,像建立在生成類問題模型基礎上的 ChatGPT 技術應用,同類技術原理的會議耳機,AI 技術的生成性如何形成?
華爾街見聞了解到,未來智能當前推出的辦公會議耳機,自帶的軟件系統能實現自動學習。這種學習結果,能在又一次的基于語言發音生成的語義文本過程中,按照用戶的發音習慣更新自動學習的準确率。由此形成數據訓練效果循環叠代。
在用戶語音和會議耳機 " 記錄翻譯 " 做 " 溝通 ",也就是 AI" 聽懂人話 " 時,這種會議耳機的 " 智能 " 在一開始,做不到精準理解和文本的準确記錄。未來智能設計了一套詢問最終文本是不是符合用戶理想的系統,以解決這個問題。
如果用戶認可,比如打勾,就相當于給耳機做了一次訓練;如果打叉,那也是訓練,相當于告訴耳機,文本結果不準确。通過這樣的方式,實施多輪使用訓練叠代後,耳機就會對用戶的喜好,越來越理解。當再生成語音轉化成文本時,會議耳機對語義的理解就會越來越接近原意。目前,iFLYBUDS 系列辦公會議耳機的轉寫準确率已達 98%,在業内首屈一指。
未來智能爲用戶設立的賬号,是提升 " 人機默契 " 的核心。比如聲紋識别功能,在用戶使用會議耳機是,耳機會自動根據聲紋特質做匹配。一旦發現是某個曾經使用過耳機的人,就自動關聯該用戶的溝通記錄,随之形成一張該用戶的社交網絡數據。
這張網将爲該行爲人的職業特征,提煉重複性的标準問題的标簽參數,供 AI 訓練模型跑數據。不同職業的共性問題參數,即形成問題模型數據庫。
從底層技術原理出發,未來智能的辦公會議耳機,就是所有聲音,隻要經過耳機,都可被記錄和處理。比如将線上或線下的會議語音轉成文字,這種文字可能是英文,也可能是日文或其他語種。這要看用戶需求是什麽。
如果用戶想将中文會議記錄轉成日文,或将英文會議語音轉成中文,都能通過這種耳機實現。同時,未來智能的辦公會議耳機還具備強智能 AI 自動學習能力。
事實上,華爾街見聞發現,未來智能開發的辦公會議耳機,除了聚合多種 AI 應用能力,實現圍繞辦公場景的效率提升,更具想象力的商業前景,是其目标用戶應用耳機的過程,相當于在構建一套垂直細分市場的子生态。
若對整個過程簡做要概括,即在美國推出 ChatGPT 生成式 AI 應用聊天機器人前,國内商業組織在做類似的技術應用探索。雙方的區别是美方做高成本的 AI 技術驗證,中方做同類 AI 技術應用的商業化探索。
比如未來智能,這家公司多年緻力于圍繞辦公場景的細分領域研發 AI 提效工具——辦公會議耳機。自 2021 年以來至今,未來智能的會議耳機銷售的存量和增量終端,在高頻應用過程中,形成了領域内有商業閉環的子生态。這個子生态已運行了至少兩年,而且是在推進商業落地的過程中逐步叠代。
不難預見,一旦中國式 ChatGPT 問世,開放 API 後,未來智能的辦公場景 AI 終端系統就可接入。這相當于給 ChatGPT 提供了辦公場景的 AI 訓練、數據和應用數據庫和技術應用解決方案。
像諸如安卓和 Windows 等平台,之所以具有超越想象的商業價值,是因爲在這個平台之上,奔跑着海量的細分生态子系統。這些子系統,共同構成了繁榮的整體大生态。在共建具有高度價值超級平台的同時,子系統也在持續爲其所在的垂直細分場景,持續提供源源不斷的商業動力。
這才是未來智能推出的會議耳機真正的、核心的、極具商業想象空間的價值核心,也是必将出現的中國式 ChatGPT 爲世界 AI 商業化落地做出的真正貢獻。