品玩實錄 | 北京網絡文化産業發展大會暨北京數字文化發展論壇
演講人 | 駱轶航
演講主題 | 探索 ChatGPT 背後的産業邏輯
頭圖 | 源于 Midjourney 由品玩制作
我最近有時候我覺得很累,過去我很少出現信息過載的狀況,我認爲我每天讀的東西基本都能給消化掉,但最近我經常覺得信息過載,而所有的信息過載都是來自 ChatGPT。通過這樣的信息過載,但這個過程其實也是一個讓人既興奮又焦慮的這樣的一個過程。ChatGPT 的出現震驚了世界。尤其是最近兩個月,人機交互的機器人帶給大家的一個非常大的變化。
一個屬于人工智能的大時代突然就來了
首先,這是人工智能與人機交互基點臨近的以此突破。上次人工智能對大家的颠覆和影響,還是 2016 年的 AlphaGo。它在韓國擊敗了李世石,之後又打敗了柯潔。但之後幾年,關于人工智能到底能夠多麽像人類、人工智能能夠替我們做什麽之類的争論就慢慢平息下來。因爲像下圍棋這些事都不足以真正撼動我們作爲一個人與機器在大部分場景之下的交互方式。
但是我們每個人都在說話,我們中很多人每天都在生成文字,甚至很多人賴以爲生。所以我們看到 ChatGTP 和類似于 Midjourney 這樣的東西在過去幾個月展現出的能力。基于自然語義的人工智能的這種能力的湧現之後,人們會直觀感受到這種能力的驚豔。
這對于人的挑戰是非常深遠的,讓我們非常有壓迫感。我覺得這個其實是人類文明發展到今天,我們非常意想不到的這樣一個時刻就突然來了。
然後他是我們自然語言達模型的普及應用一個開端,以及神經網絡處理 natural language processing(NLP)的一個最高的水準。
過去這麽多年我們做過很多事情,然後很多公司都在搞各種各樣的大模型,包括 NLP 用于其他的很多領域,比如自動駕駛、客服機器人等。它們做了很多的事情,但從來沒有一個像 ChatGPT 這樣的東西。它其實是神經網絡的處理的一個最高的水準,每一個獨立的個體都可以用,它是一個非常有意思的開端。
在 GPT 4 它發布之後,隻同時配套發布了一篇論文。當時我覺得天哪,怎麽回事?這樣一個成果難道就隻值一篇論文嗎?還是你自己隐藏了很多東西?
後來一想的确到了這個階段,論文研究不是最重要的,工程是最重要的。
什麽是工程?就是你用多少條的芯片、多少算力,多少台服務器,用怎樣的這種基于約束的調優和這種調參的模式,早期建模怎麽去做?一次次的反複的嘗試,這種不斷去做調優調參這樣的一個過程。
它是一個工程學的實踐,它不是靠我們做了多少基礎研發的突破,它是不斷的試出來,所以所以這個事特别有意思。就工程實踐這件事情,第一個靠錢,第二個靠意志力,第三個靠團隊,也就是靠人。
有人形容這個事像是煉丹,你喂的那些藥草就像語料,火爐的熔爐就是建模模型。加火的過程就是訓練指令集調參調優的過程。這中間不斷嘗試的一個過程,非常的像煉丹。
我覺得寫 Prompt 這事像念咒,我不太會煉丹,但我現在正在學會去念咒。煉丹的過程,其實上是人工智能工程實現的一個奇迹。
這也是工業革命以來人類生産力最強大的一個效率革命。過去經常說人類已經經曆了四次産業革命。第一次是蒸汽機,第二次是電力,第三次是計算機革命,第四次當前年代的智能革命。
但我認爲 18 世紀末開啓的蒸汽機革命一直到 20 世紀中期開啓的信息革命是一個階段。而智能革命其實是一個新的階段。大語言模型的廣泛應用,讓人們意識到人們的經驗、智力、智能在很多時候可能也是不夠用的,可能也是需要一個更強大的東西與人去配合去工作。
我們去想效率革命這個事情,它極大的提升了我們的效率,也能夠激發我們在創造力方面的能力。他會創造一些新的工作機會,或者讓人們去重新地認識自己的社會價值和商業價值。
最近我們公司要搞一個 prompt day 活動。讓所有人去分成兩個組,圖片組和文字組,可能會請幾個人命題,讓團隊來參與生成内容。我們現在内部有很多團隊都開始接觸 AI 内容生成。比如視頻團隊,他們現在也開始用 Midjourney 畫畫了。然後要聞團隊也開始用這個東西寫一些微博的推廣文案,寫一些快速的要聞。商務團隊,市場團隊現在已經在用它去寫一些文案,跟客戶進行溝通了。當然做深度報道和深度内容的團隊,暫時這個東西還替代不了。
我們搞這個東西,不是要吓唬大家,我們要讓大家知道這個事能夠提高多少效率,激發我們多幹多少事情。能夠探索我們作爲個體能提升多少生産力,我覺得這是非常有意義的事情。我認爲她的确是重新定義職業腦力勞動和體力勞動之間的關系。
中國爲什麽需要自己的 ChatGPT 公司?
爲什麽中國需要自己的大語言模型産品。文心一言已經發布了,阿裏達摩院也帶來了通義千問,接下來幾周還會有很多類似的産品推出。中國爲什麽需要自己的 ChatGPT 公司,他們不做行不行?不做會不會死?
我覺得這個事情其實也是我近期思考比較多的東西。
首先我認爲自然語言大模型的本質是基于語言的文化話語權。大家都知道這個世界上尤其是互聯網上的主要内容,90% 以上的内容是英文内容,中文内容隻占其中非常少一個比例。
這就意味着無論是 OpenAI 的 GPT 也好,谷歌的 Bard 也好,還是其他的大語言模型也好。都是基于英文以及自己特定預料語料構建起來的一個模型。建模的過程既是選擇語料、調優和調參的過程,也是他們在這個過程當中形成一個自然語言模型的價值觀的過程。
它是基于語言的文化話語權,這也意味着基于英語語言的文化霸權,有可能會通過人工智能和人機交互機器人的方式得到進一步的強化。
所以全球自然語義處理框架不僅需要中文語義基礎和中國語料,也需要中國價值體系與中國解決方案。
前不久其實我接受過一個調研,問我們怎麽能夠把大語言模型做好。當時我說首先要在語料庫上下功夫,我們要訓練好的優質的高質量的中文語料。
其次,我認爲應該形成一個更互動的産學研結合的方式。公司有動力去做模型,而高校有研究人才和研發資源,然後政府有集中這樣的資源,爲這個事情把握方向的這樣一個能力。
最後就是說我們要訓練好的中文語料,我們也要訓練英文語料,把英文語料通過我們的模型調優調參訓練成輸出的方式,成爲帶有我們的價值體系和解決方案的東西。
再一個,我認爲大語言模型背後是芯片軟件和雲計算構成的系統。中國是世界上除了美國幾乎唯一有能力獨立開發的國家。當然要承認,我們算力可能不如人家,系統能力不如人家,投的錢不如人家多。
但從另外一個維度來看,這個世界上有沒有第三個國家的科研機構、企業能夠跳出來講我們來做自己的大模型?沒有,是不喜歡嗎?其實就是因爲這個東西不是所有的國家都有能力去做的。
芯片我們現在肯定是不是最強的,我們肯定是相對落後的,而且現在随着一些這種不合理的制裁,就這個領域我們可能還要再繼續的落後下去一段時間。但是雲計算這個領域中國的實力是擺在這裏的,我們既然有能力去做,有能力哪怕是世界上的老二,我們就沒有理由不去做這件事情。
我認爲自然語言大模型的聖杯之戰是中美科技實力競争的一個重要的維度。我認爲人文社會科學就是文化觀念的輸出,它的載體是語言,到最後本身就是語言的符号化和數學化,其實也是會讓它走向桂冠的這樣一個過程,這個東西其實我們現在形成的就是一種自然語言的這種模型的研究。這個也是基于前面這個點上非常重要的一個維度。
最後一個,是我們文化安全、數據安全、國家安全發展安全的重要保障。主要是所謂的安全發展。
自然語言大模型激發的數據再生産将創造前所未有的數據價值。我們中國過去這麽多年積累下來的各個産業的垂直産業的數據,沉浸在各個行業的公司服務器和數據中心。那麽這些數據有的是死的數據,但也有很多活的數據,它是可以拿出來被再研究和被用來人機交互和人機溝通的數據。
其次就是就是基于垂直産業的人工智能的發展邏輯與通用人工智能的化學反應。我前不久寫過一篇文章,叫《是誰拖了中國 ChatGTP 的後腿》,我把責任主要扣到了中國的 VC 的身上。我爲什麽這麽講?如果我們回到 2016 年那個時間節點,中國和美國在這種人工智能的基礎的一些東西上面其實水平差距沒有那麽大的。但當時的一些做大語言模型的初創團隊基本都拿不到很多的投資。
這個文章出來之後很多投資人都表示反對,說這個東西是投多少錢都見不了底,但這些人現在也都去投這個東西。
我想講一個基本的邏輯,通過我們做煉丹的過程産生這種人機交互和對話生成的結果,其實是可以支持更多小模型和小場景發展垂直的人工智能産業發展模型。我們現在會用到很多的小模型,和機器人産生對話,但這些對話目前還是太小了。
但如果我們去想,他是基于大的模型的語料分析、調參最後形成的人機交互的成果,它是不是有可能真的能夠幫你解決更具體、更切實,更能夠幫助你的一些問題。
國内最近有兩個趨勢,第一個就是類似于像文心一言,包括像阿裏達摩院這樣的機構,他們這樣的巨頭公司及其下屬機構在推出自然語言大模型的測試。此外,他們也正在積極的在去做一些基于産業、基于垂直領域結合的一些東西。其他比如科大訊飛也好,京東也好,他們也在試圖基于打的一些平台上的數據去做一些更大的模型,實現一些更具體的場景。
這點我們有自信,中國人在做原生産品上可能不是最強的,但是我們落到産業、落到場景上可能會産生一個更好的成果。
那麽這個東西既然這麽重要,它會反向激發中國在半導體、雲計算操作系統等自主關鍵領域的創新。如果我們這種自然語言大模型起來了,其實它會反向的去激發很多在半導體領域,在雲計算領域,在操作系統裏的這種進化和升級,對我們基礎的這種架構的數據相應是一個非常有意義的事情。
最後我特别想講的一個點,它将推動更廣泛意義上的數字平等,而不是更廣泛的不平等。大語言模型給了很多人機會,他比你學編程要容易,他給了很多的機會讓人們去創造更好的東西。當所有人的當一個事情彌合了人們更多的知識差異和技能差異的時候,其他會推動更廣泛意義上的數字平等,而不是制造更不平等。
最後還想多說一句話的話,就是說還是想給中國的 LLM 領域和産業鼓一把勁,這個領域能夠誕生出很多的新的機會,如果我們把它當做是下一次工業革命去看待的話,它可能意味着更多的東西。