4 月 21 日,鉛筆道 "2023 AIGC 科技大會 " 在北京舉行,數十位科技行業知名企業家、創業者、投資人及學者出席。本次活動的核心議題,圍繞生成式人工智能賽道的 " 大勢與遠景 " 展開,老鷹基金創始人劉小鷹和聯想控股副總裁兼創新發展中心董事總經理于浩博士談了 AIGC 賽道的創業細分機會。
他們認爲,大數據、大模型、大算力,需要的人才、資金、技術,都不是創業公司能玩轉的。而服務于大語言模型周邊的,如信息安全(版權信息安全)、智能感知、信息标注、模型簡化、算法優化等細分行業給了創業公司 " 賣水 "、" 賣鐵鍬 " 的機會。
從另一方面說,AIGC 也絕不是隻有大公司才能玩的遊戲,大語言模型的應用接口開放後,反而它讓創業公司更加 " 平等 ",讓草根創業者具備更強的能力,前提是找準需求。
以下是兩位嘉賓對話精華,經鉛筆道整理:
劉小鷹:從小白用戶的角度,ChatGPT 就是一個很聰明,學習能力很強,背後數據能力很強的一個聊天機器人。
于浩 :它的名字 ChatGPT 已經解釋了,Chat 就是聊天。它從技術上解決自然語言生成的問題。什麽叫自然語言?就是自然形成的語言,人類語言都是自然形成的。還有非自然語言,比如編程的語言、包括用的密碼,這些都是人工設計的語言。自然語言由于是自然形成的,你要教計算機去理解,讓它知道你要幹什麽,并且能夠生成什麽,這是一個比較困難的任務。
一般把自然語言分爲兩部分,首先讓計算機知道你在說什麽,第二步就是讓計算機能夠按照你的要求去生成一個東西出來。過去,我們一直認爲生成是很難的,所以 ChatGPT 最大貢獻就是解決生成的問題,可以說得到了一個飛躍。
它是個會聊天的機器人,我們自己評價它 " 聊商 " 非常高,傳統的對話機器人,其實就是 QA 系統的問題,一般是要正确地回答你的問題,作爲我的一個 KPI。而 ChatGPT 聊天機器人,你發現它未必是回答正确,但是先把你抓住,就先讓你跟它聊下去,然後通過聊的交互過程中逐漸去優化去找到答案。
劉小鷹:對,但是針對 GPT 目前應該說是有兩方面的意見,一方面就是說我們要開始創業,去做幾個大模型,包括(前)美團的王慧文,還有王小川的百川智能,還有 360,我給它的(大模型)取了一個名字叫毒舌,因爲它是殺毒軟件起家。
于浩:确實是這個問題。實際上我們回頭看 GPT 的成功或者 OpenAI 的成功,它做了将近 8 年的時間。在這七八年時間實際上無數個概念風起雲湧,區塊鏈、web3.0、元宇宙,OpenAI 的團隊是很穩定的,沒有受到這樣的沖擊,就是做這樣的一個事情。
現在看(國内)這些比較有代表性的人物,他們有一定的号召力,實際上包括剛才談到的基金也好,投資方也好,可能也需要這樣的一些話題,但是我個人認爲尤其從創業,說想做一個大模型,真的是投入很大的。無論是以前号稱說至少要 1000 張顯卡起步,有的甚至要是萬張顯卡起步,這個投入很大的,包括說電費要算多少錢。其實如果真正創業,我們未必是一定要做 ChatGPT 這樣的一個模型,就像以前經常說美國西部淘金的時候淘金者很多,但實際上最後賺錢的是賣鐵鍬的對吧?而大家都去做鐵鍬的話,我們幹脆還是做淘金者。你像 ChatGPT 是個工具,可能是一個很好的鐵鍬,我們能否用它去做其他的創業?它有幾個特點,第一個它是提升了整個人的認知的底線,當它寫作文能比一般學生寫得都好,我們幹脆用它寫作文就可以了,我們所有人底線能夠提高的話,就能夠做更好的更有意思的事情。
第二點,如果恰恰這一批接口大家都能夠用的話,全部開放了,我們所有的人幾乎是平等的對吧?與其做都去做鐵鍬,咱們是不是也去挖了金子,換時間換地方,也可能會有很好的機會。
劉小鷹:非常贊同。待會我們會有一個很重要的内容是講到未來創業 AI 機器跟 GPT 方面,在大環境下,我們的創業賽道應該瞄準哪幾個賽道?我們老鷹基金有一個叫天使投資 1234 法則,我經常把 1234 法則細分到不同的賽道行業裏面去,剛剛也突發奇想,關于我們的 1234,如果再套用 AIGC 和 GPT 的話,1 可以叫一大升級。有人說 GPT 是一次新的工業革命,我們認爲還沒到,應該差不多是一種比較大的升級,或者是人工智能從 0 到 1 真正突破了,真正是一個相對比較強的人工智能,但它是不是一個工業革命,還是要再看一看。所以一個大模型,一個 AGI 通用人工智能的一個大升級。
那麽 1234 的 2 是什麽?是兩個模型,一個是叫大模型,一個叫多模态。它也可以識别文字、語音、圖片、視頻。這是很重要兩個模型。
那麽 3 是指三大核心。大家都在說大數據、大算力和大算法,其實應該還有好幾個大,包括大型的大量預訓練,還有就是高大上的人才,如果你不是一個 AI 人才,真的不懂算法算力,還不懂這種跟人機對話等機器學習的話,你很難去從事這方面的研發工作,所以三大核心大算力、大數據和大算法。
大算力怎麽辦?這些年芯片其實是一個痛點,我們要去思考到底我們能走多遠,能做多大,能夠掌控多少數據,因爲各大平台都要搞自研大模型,實際上這個市場應該容不下這麽多,有可能是有些上市公司它有一個股票炒作的概念,有一些可能擁有自己的數據,它是相對比較獨立跟分裂,所以跟國外的可能不太一樣。于總你怎麽看?
于浩 :其實大家好多人都在考慮,爲什麽 ChatGPT 突然間就會出現這樣的爆發突破,實際上我們在兩周前,人工智能協會在杭州就要搞大模型,當時我們請了好多院士,也有一些科研界的專家,他們提到一個詞叫做 " 湧現 ",什麽叫湧現?可能還不是爆發,突然間出現——湧現,這個詞很好,爲什麽會有湧現的概念?
湧現這個詞就可能稍微比較難理解,通俗話講就是吃火鍋。大家吃火鍋的時候,如果這個火鍋沒開,你可能放幾片肉,放幾片蔬菜到火鍋裏,那麽等鍋開的時間還會更長;當火鍋完全開起來,尤其四川火鍋上面有一層牛油全開的時候,你再扔幾片肉扔幾片菜不會對它有影響的,還是一個很沸騰的狀态。這就是湧現。
爲什麽後面會湧現?算力的進步非常大,大家的手機現在也都超過我們上學那時候的電腦,然後包括大數據,特别是互聯網出現的大數據,實際上爲什麽大家讨論 AIGC ,一般說 web3.0 的一個重要點是 AIGC 的出現,像新浪搜狐這種當年第一代互聯網巨頭,那麽第二代就是 web2.0,web2.0 一個重要的媒體出現,就是微博出現之後,整個自媒體的發展特别快,所以現在 AIGC 出現之後,又帶來整個數據的增長,所以在這個情況下确實是促進了一個湧現情況。
回過頭來确實剛才提到我們重點的三大,但是大數據包括大算力可能是創業公司,很難去觸達的東西,我們不可能每個人都去做英偉達對吧?這個是很難實現的。每個創業公司都去做一個大模型也很難,除非像剛才說到有學術背景。
劉小鷹 :對,其實我想在座應該是大部分是創業者對吧?都很關心到底 ChatGPT 爲我們的創業能指明什麽方向,能帶來什麽樣的一個創業機會,所以剛才我的 AIGC 投資 1234 法則裏面的 4 大賽道,應該說第一個可能是信息安全這一方面有一些機會,比如說版權信息安全這些;另外就是數據的捕捉,這裏面有一些智能感知和一些 AI 标注,最後就是自動駕駛,也有大量的标準。第三個可能叫模型簡化,基于大模型的小模型應用。第四就是算法的優化,有些共享的一些算力優化。
其實我想說的是什麽?作爲普通人跟小白來講,GPT 爲什麽那麽有名?就是因爲它的話驚醒了大家,但是在中國我認爲 AIGC 已經存在很多年了,特别是像我們 10 年前投了一個天使的項目影譜科技,到現在已經是 AI 獨角獸了,在剛剛發布的《2022 年 AIGC 創新 Top30》排行榜也很靠前。影譜做的恰恰是 AI 機器視覺和 AIGC 行業應用,它在 6 年前就采用 AI 大模型進行自動生成視頻内容,早在 2013 年他們用 AI 的方式去生成一些原生視頻廣告,2018 年影譜也最早發布 ADT,就是數字孿生,最早做數字人和商品數字孿生的,所有這些其實都是跟 AIGC 有關系。
其實 AI 從 AlphaGo 到早期的很多的創業項目,包括我們的 AI 市場,當各大平台包括光年之外上來說要做大模型的時候,我們在哪?從商湯到曠世到雲從,它們有大量的 AI 數據,大量的 AI 技術,它們爲什麽不去做這個事?後來商湯也出來一個對吧?有時候你不得不做,其實有很多的平台或者企業可能不太想做,但别人做了總是被人問,那我也跑出來做,去燒錢去砸錢,這幫互聯網大咖其實都有錢,所以一上來就是天使輪 5000 萬美金,然後馬上就 A 輪,我們看見的是中國互聯網産業大平台實力的上升,還有他們的背景已經是跟往年不可同日而語,但是我們草根創業者怎麽辦?我們到底能做什麽?這個是大家很關心的一個問題。
于浩 :無論是對 AIGC 也好,産業基金也好,還是要有一個很好的認識。首先它不能說是革命,但是确實是一個突破,那突破實際上給我們帶來更多的機會,好像一扇門在我面前打開,能夠提升我們自己的能力,能不能做一些相關的事情。
創業者兩個做法,一個是你能不能把你的團隊去找到跟大模型結合的這樣一個點,其實很多這種算法應用,包括剛才第一個嘉賓談到英偉達的時候,他特意提到芯片之間的通訊問題,我個人最近也在看相關的項目,你上來要 1000 張卡甚至 10000 張卡,那麽這種的計算不是能疊加的,卡之間的通訊也好,數據的交換也好,怎麽樣去做,像這樣的問題可能有很多,需要有一定的技術基礎的人,創業公司可以不做的,比如說傳統做通訊的公司能不能做這樣的方向,那麽這是第一點。
第二點實際上在 AI2.0 的時代,肯定還會出現更多公司做面向這樣行業的應用。剛才一直強調,整個 AIGC 是給每個人一個平等機會,把你的能力提高了,你爲什麽不去闖一闖試一試?不管怎麽說,總之還是要正面看 AIGC,今天我也特别點贊,鉛筆道沒有把題目定到 ChatGPT 而是定到 AIGC 這點就很對。再一個我也特别認同,像我剛才提到其實 AIGC 早就存在,不是說現在突然很多人在做,包括您提到的數字孿生,我以前在企業研究院做總經理的時候,我們做了大量的 To B 的數字孿生,那時候數字孿生還是從真實世界到模拟世界,這樣的一個數字孿生,換句話說還是人在做内容的生成,但如果 AIGC 發展到一定程度,那麽再從虛拟到真實,或者叫完全的真正元宇宙時代,這樣的時代技術可能還會有很多這樣的應用場景,所以我們也特别期待無論 To B 、To C 都會有一些場景等待着我們創業者去開發。
劉小鷹 :對,站在普通人角度,其實我想說一下,如果你是個會計公司或者是客服或者是旅遊行業,很有可能會被被 AI 或機器人颠覆掉颠覆掉,很快會失業,這個時候應該是去面對,因爲沒有辦法,浪已經蓋過來了,那趕緊就是去學習新的技能。換一個工作環境,人總是有很多機會的。另外一種就是你是創意人才的話,如果你還是沿用傳統的方式去做你的創意,可能你就會跑輸給别人,那麽别的畫家藝術家,還有很多文學家的小說家,他們能夠去用 GPT 來提升他們的效率,能夠在加速他們創意的一些作品的生産,競争力就會提升了。所以這個時候其實大家起點是一樣,任何新的工具,其實它是對所有人都是公平的,就看你自己是否願意去擁抱新東西。
于浩:現在 AIGC 剛剛打開一扇門,我們不要着急,精彩在後面,把一切交給市場,一切交給時間,讓子彈再飛一會兒。
劉小鷹:人的大腦裏面大概有 1000 萬億個腦系統,通過 100 萬億個神經元網絡連在一起的,現在的 GPT 的參數是 1000 億,所以 1000 億跟 1000 萬億的腦細胞其實還有很大的差距,等到它跑到有 100 萬億的時候,相當于 1/10 的腦細胞的話,我想就很接近人了,但是有一點目前的 GPT 其實它可能是有一個大腦在背後,但是它可能不太會思考,但它學習能力很強,記憶很強,這一點我們需要把他變成我們的工具,所以未來其實我們應該把它私有化,甚至你可以自己建一個私有的 GPT,然後未來的公司有可能一個人就可以開一家公司,因爲你有很多垂直細分行業的 GPT 助手幫你去完成你日常的工作,你就可以很從容就可以做很多事情,所以想象空間是非常大的。