圖片來源 @視覺中國
文 | 略大參考,作者 | 楊知潮,編輯 | 原野
ChatGPT 概念股 " 擊鼓傳花 " 的遊戲,如今傳到了知乎手裡。
2 月 8 日,内容社區知乎股價暴漲接近 50%,創下曆史新高。随着 ChatGPT 概念股在本周持續走熱,包括百度、寺庫、雲從科技、漢王科技在内的多家公司,紛紛吃上紅利。
不過,亂花漸入迷人眼。喧嚣中,有貨真價實者,也有濫竽充數者,時間自然會将它們區分。
畢竟,ChatGPT 雖新,但 AI 是個老概念了。在過去很長時間裡,它都在以 5-10 年為周期經曆着波動:在過去的很長時間裡,每隔 5-10 年,人工智能的發展都會經曆這樣的周期:某個現象級的産品,讓大家驚呼 " 人工智能的春天 " 來了,密集的媒體炒作與企業承諾随之而來。但熱度散去之後,寒冬又會籠罩到整個行業,直到下一個現象級産品的出現。
很難說,ChatGPT 就能打破這樣的周期。對于跻身 ChatGPT 概念股的商業公司,同樣如此。對待 AI 技術的不同态度,可能會把它們帶向不同的未來。
01 井噴的 ChatGPT 概念股
很顯然,ChatGPT 讓全世界的科技企業都急了。
比如微軟老對頭谷歌剛剛開了一場反省大會,反思以 AI 技術領先著稱的谷歌為何沒能先做出類似的産品,還加急推出了對标産品 Bard。第二天,微軟就宣布,必應接入 ChatGPT,對谷歌的老本行搜索發起挑戰。
微軟和谷歌打得激烈,大洋彼岸,ChatGPT 概念股成為了熱門話題。
很多企業都在試圖 " 上車 ",把自家業務與 ChatGPT 搭上關系。以 AI 企業标榜的百度宣布,将在今年 3 月推出大模型 " 文心一言 "。老牌互聯網公司 360 表示,已經對類 ChatGPT 技術進行研究,并且有可能帶來颠覆性的革新。就連做奢侈品生意的寺庫,也宣布對相關技術進行研究——反正,隻要你敢信,我就敢說。
因為熱度帶來的收益足夠明顯。科大訊飛在 2 月 6 日股價大漲近 10%,相比年初上漲約三分之一。360 股價漲停。百度港股單日暴漲約 15%。2 月 7 日當天,AIGC 概念版塊整體漲幅一度高達 4%。
其中,以 " 四小龍 " 為代表的 AI 企業最受關注,受益也最明顯。短短一周左右,雲從科技累計上漲近 70%,年内漲幅超過了 100%,商湯科技上漲近 30%。其他 AI 企業,比如漢王科技,也累計上漲超過 60%。
對于股價低靡依舊的 AI 企業,這無異于久旱逢甘露。前面我們提到,AI 技術發展具備極強的周期性,幾乎每隔 5-10 年就能出現一個現象級的産品,帶來春天般的繁華,但它往往難以持續,行業總會在熱鬧過後便陷入寂靜,直到下一個産品的出現。
最近的一次出現在 7 年前。2016 年,橫空出世的阿爾法狗在全球範圍内掀起 AI 熱。國内 AI 企業如雨後春筍般湧現,估值一度走高,商湯和曠視一度都逼近過千億。但這樣的盛況沒能維持太久,由于落地遙遙無期,到 2019 年,初創 AI 企業的融資數量就出現了下滑,AI 四小龍的 IPO 計劃也屢次失敗。
當然,AI 企業在資本市場的失寵,一方面與周期有關,一方面也與應用場景不足有關。
國内多家頭部 AI 企業,都擁有豐富的專利與論文數量。截至 2021 年底,商湯科技累計擁有 11494 件全球專利資産,在各學術頂會發表論文超過 700 篇。但受限于落地場景貧乏,它的商業化進展并不理想。2021 年市值千億的商湯科技,年收入隻有 50 億元左右。
同樣的問題,也要擺在 ChatGPT 面前。
目前來看,ChatGPT 最契合的接入場景是搜索、問答和内容社區。因為機器學習需要海量數據,而這些平台本身就積累了海量的結構化數據。北美新聞聚合平台 BuzzFeed 已經在最近宣布,将用 OpenAI 輔助内容創作—— AI 的威力率先體現在了股價上,消息宣布後,BuzzFeed 股價應聲暴漲近 120%。
在國内,以抖音、快手為代表的短視頻平台,也擁有極強的算法能力和數據資源。不過在當下,視頻内容的 AIGC 難度更大,在北美工作的 AIGC 工程師耿博士告訴 " 略大參考 ",圖片、音頻、視頻的 AIGC 更複雜,"AI 繪畫目前與人類創作的内容差異較大,有明顯的違和感,而視頻落地則更加遙遠。"
機會給到了圖文為主的内容平台。知乎的股價暴漲已經證實了這一點。作為問答社區,知乎積攢了豐富的可供 AIGC 的優質内容。2022 年第三季度财報數據顯示,知乎社區内的内容量已累計超 5.79 億條,問答量累計超 4.82 億條。
說到底,至少現階段的人工智能,幹的還是體力活。它還無法真正像人類一樣去觀察、感受與提煉,人類灌入互聯網的數據,是它唯一的學習樣本。ChatGPT 能在 3 個月内實現用戶破億,靠的是數據積累帶來的爆發。同樣,數據的豐富程度,也将成為 ChatGPT 概念股的分野。
02 數據為王
大火的 ChatGPT,在知乎平台裡也是熱門話題。比如一個被廣泛讨論的答主觀點提到,ChatGPT 最讓人震驚的能力包括:推理能力,歸納能力,在語言作為媒介展現出來的對世界常識的認知,多輪對話的能力。
這些能力都離不開數據。
據悉,ChatGPT 建立在對全網的内容和數據的抓取學習之上,訓練量高達數十億個文本示例。西安交大人工智能學院的浩儒博士在接受 " 略大參考 " 采訪時,這樣形容 AI 的智能化能力:" 簡而言之,做 AI 就是大力出奇迹,超強的算力加上極其龐大的數據量,以量取勝。"
曾經大名鼎鼎的阿爾法狗,靠得并不是棋道或是思想境界,而是堆量。在與專業棋手對弈前,阿爾法狗曾學習過 1 萬多幅人類專業棋手對決的棋譜,完成了三千萬盤自我對弈的棋局,由于數據量過于龐大,阿爾法狗一局棋的電費都以萬元計。
數據是 AI 突破的關鍵因素,這已經是業内的共識。AIGC 工程師耿博士告訴 " 略大參考 ",類似 ChatGPT 這類 AI 的技術原理并不複雜,甚至,越簡單的越有效,國内大廠都有能力做出類似的産品。而競争的關鍵就在于可供 AI 學習的數據量。
也因此,在 ChatGPT 概念股們花樣百出的動作中,百度的 " 文心一言 " 靠譜程度是比較高的,因為它不但具備算法技術,還積累了足夠的數據樣本。在 ChatGPT 概念股前仆後繼的股價上漲之中,知乎上漲的合理程度,遠遠超過漢王科技這樣的企業。原因依然是數據樣本。
用戶的搜索動作,最能直觀體現數據樣本的豐富程度。隻有足夠體量的數據樣本,才能支撐起日益增長的用戶搜索需求。知乎曾經在 2020 年四季度公布過一組搜索數據:日均搜索量達到 2570 萬次,作為一家内容社區,這樣的數據足夠優秀。此後,相關數據持續上漲。2022 年高考填報志願期間,知乎相關内容搜索達到 1.97 億次。
正如 iPhone 的核心是供應鍊,AIGC 的核心是數據。
然而,在各大内容平台紛紛築牆的當下,互聯網數據也逐漸從開放走向封閉。就連 ChatGPT 都不得不求助推特,獲得接通推特數據庫的資格。這也意味着,哪家企業自身就擁有數據和内容,誰就擁有了 AIGC 的硬通貨。
于是,相比坐擁專利與技術的 AI 企業,内容平台也可以憑借各自的内容生态,在 AIGC 的故事裡與前者平分秋色。在中文互聯網世界裡,抖音、快手、知乎、百度積累了大量的數據,可以預見的是,無論是自身開發 AIGC,還是與技術公司合作,它們都有望将數據發揮出更大的價值。
耿博士向 " 略大參考 " 表示,相比于 AI 公司,他更看好一些互聯網大廠,因為他們自身就擁有龐大的數據。中銀國際也給出了類似的觀點:預期擁有數據和資本優勢的大型平台公司,将較 AI 軟件企業更能受惠。
在影響 AIGC 效果的多重因素中,數量之外,數據的質量也極為關鍵。
在這一點上,ChatGPT 是吃過虧的,由于學習了互聯網上大量魚龍混雜的内容,ChatGPT 經常會給出低質量甚至是錯誤的答案,甚至有網站出于内容質量的考慮,禁止用戶分享 ChatGPT 生成的内容。
目前來看,知乎這樣的精品化内容社區,在内容質量方面具備較大的優勢。如知乎上的部分内容已經出版成冊,成為多看、kindle 等平台上的暢銷書。
但對于多數内容平台而言,如果既想要接入 AIGC,又想保障内容質量,就需要多掏錢了。浩儒博士表示,AI 的學習過程中不具備辨别内容的能力,如果内容質量太低,隻能花更多錢、安排更多人力去标數據。也因此他認為,AI 從前是一種勞動力密集型行業,如今更像是資本密集型行業,比拼的關鍵就是算力和數據。
03 搭車,還是被取代?
新的工業革命。這是微軟總裁納德拉對 ChatGPT 的盛贊。
盡管 ChatGPT 是以聊天機器人的身份為大衆所熟悉,但它其實是一種大語言模型,或者說,是以自然語言為界面的機器人。它不會自主創造信息,隻是能夠在不同架構之間進行切換,對已有信息進行歸納、總結、舉例等智能化加工。
當信息流轉的成本被極大降低,一部分信息壁壘被消除,變化便由此而生。
對變化保持警覺甚至是防禦,是寫在人類基因中的生存密碼。關于人工智能,一個經久不衰的讨論是:人類的工作會被人工智能取代嗎?ChatGPT 的走紅又一次帶火了這個話題,人們開始津津樂道哪些職業會消亡,哪些互聯網産品會被 ChatGPT 取代。
至少到現在,人工智能距離真正取代人類、取代人類創造的互聯網産品,還有些遙遠。
人工智能行業流行一個隐喻:聰明的漢斯。這是 20 世紀初因為會做數學題,而享譽德國的一匹聰明的馬,後來人們發現,它之所以能給出答案,靠的是觀察提問者的細微面部表情和肢體語言。後來," 聰明的漢斯 " 就被用來形容,那些表現出理解力,但實際上隻是對訓練員給出的别人難以發現的提示作出反應的個體和程序。
ChatGPT 也是如此。它隻是記住了 1+1=2。
但這并不妨礙 ChatGPT 為現有的互聯網産品們注入新的活力。以内容平台為例,ChatGPT 可以在輔助創作、提升搜索效率、優化推送精準度等方面,發揮出技術的優勢。
ChatGPT 不會取代知乎們,被合理利用的話,是可以讓知乎們變得更好的。
以搜索場景為例。
知乎這類内容平台,正在承載越來越多年輕人的搜索需求。但相比傳統的搜索工具,它們的算法能力偏弱,往往需要人工的輔助,讓優質内容更容易被搜索。比如知乎的優質創作者被稱為 " 寶藏答主 ",這種标記,一方面是因為他們的回答内容質量高,一方面其實也說明,優質内容的發現并不容易。被标記,才能被更好地看見。
也因此,ChatGPT 這類 AIGC 大模型應用的接入,對這些内容平台帶來的變化也會更加明顯。因為用戶對搜索效率的變化,感知往往是最直接的。
同樣會讓用戶感知強烈的,還有推送。
内容行業最近的一次革命正是來自于此。以字節跳動為首的企業,以大數據和算法為基礎,改變了整個互聯網對内容的消費方式。機器取代人工,成為更加重要的推送決策者。
而 AIGC 顯然具備再掀起一場變革的能力,或許在不久的将來,問答會取代信息流,成為用戶消費内容的主流方式。尤其對于 Z 世代的年輕人,問答所能呈現的信息密度更高,因而也更受歡迎。
不隻是内容優化,AI 還能承擔部分 " 後勤 " 工作,比如内容審核。
浩儒博士提到,簡單的内容識别是 AIGC 的重要應用方向,在 ChatGPT 之前,已經有一定規模的應用,可以幫助審核團隊對内容進行初步篩選,但代替程度還不夠高,平台仍然需要維持規模龐大的團隊。據抖音高管透露,抖音的内容審核團隊已經達到幾千人的規模。而一名内容審核每天往往需要審核上千條内容,審核消耗掉了巨大的人力資源,許多平台都曝出過審核人員的稀缺。
ChatGPT 這樣的語言大模型,能夠進一步解放人力。除了安全性的審核,AI 還有能力辨别内容的質量,決定是否給予流量扶持。
當然,ChatGPT 的魔力也讓人擔憂:AI 創作是否會侵占傳統内容社區的生存空間?
耿博士對此持反對态度。他認為,AIGC 隻能取代部分低級内容。更何況内容社區的核心在于人與人的連接,AI 無法取代明星 KOL 與用戶之間的情感連接。尤其對于知乎這樣的平台,創作者的人格魅力,是流量創造價值的基礎。現階段,ChatGPT 更适合做為輔助創作,它能夠幫助創作者整理文案,減少他們的工作量。
被譽為人工智能之父的馬文 . 明斯基曾經說過," 容易的事情做起來難 "。直到現在,這句話仍然适用于人工智能的大部分領域。許多人類的工作對于計算機或機器人而言,可能比我們想象的要困難得多。
當然 AIGC 也在持續進化。ChatGPT 并非當下最新的版本,OpenAI 的 GPT 4 也在研發當中。多位業内人士表示,新的變革可能會引爆科技界。但也有人對它的落地應用表達了擔憂,浩儒博士提到,ChatGPT 這樣的技術對算力和數據的要求太高,投入大,但很難找到賺錢的場景。
ChatGPT 是否會重複阿爾法狗的故事?一鳴驚人之後,把整個行業推向春天,随後貓在漫長的冬天裡靜靜發育。答案還不确定,但知乎們已經搭上了車,它們也相信,這是一趟開往春天的列車。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App