曠視科技聯合創始人、CEO 印奇(來源:受訪者提供)
钛媒體 App 獲悉,北京時間 3 月 15 日淩晨,美國 OpenAI 公司正式發布多模态預訓練大模型 GPT-4,實現了多個領域的飛躍式提升:強大的識圖能力,文字輸入限制提升至 2.5 萬字,能夠生成歌詞、創意文本,實現風格變化等。
這一消息引發了 AI 技術圈内熱議。短短五個小時,GPT-4 推文閱讀量超過 367 萬。
實際上,近幾個月,基于 OpenAI GPT-3.5 模型研發的對話産品 ChatGPT 掀起熱潮,引起全球高度關注。從大學教授到創業者,從投資人到科技部部長,都在讨論這個 60 天月活超 1 億、上知天文下知地理的 ChatGPT,甚至引爆了全球科技巨頭與 AI 行業的新一輪大模型軍備競賽。因此,GPT-4 讓人更加期待其帶來的技術變革。
相對于 OpenAI,盡管中國在 AI 領域進行了很多研究成果和布局,但目前要達到像 OpenAI 的效果可能還需時日。
科學技術部部長王志剛 3 月 5 日表示,ChatGPT 證明了 AI 是大方向,而 OpenAI 在 AI 對話實時效果方面有優勢," 比如發動機,大家都能做出發動機,但質量是有不同的。踢足球都是盤帶、射門,但是要做到梅西那麽好也不容易。" 王志剛表示。
自 1956 年達特茅斯會議上創造 AI 這個術語以來,過去近 60 年間,全球共經曆了三次 AI 浪潮。前兩次 AI 浪潮中,不管是芯片 " 摩爾定律 " 速度跟不上 AI 的算力要求,還是數據量不夠、算法不強、商業化不如預期,整個 AI 技術并未呈現機器特性。
直到 2016 年,谷歌 DeepMind 的 " 阿爾法狗 "(AlphaGo)擊敗韓國圍棋冠軍,深度學習和新的學習框架 Transformer 的誕生,讓 AI 算法、算力、數據 " 三駕馬車 " 全面發力。
中國在 AI 技術領域發展迅速。據工信部科技司副司長任愛光公布的數據,目前中國 AI 核心産業規模達到 5000 億元,企業數量接近 4000 家,覆蓋芯片、開源框架、智能終端、智慧城市等領域。
那麽,爲什麽在 ChatGPT 熱潮中,中國 AI 領域卻很難出現 OpenAI 公司或是 ChatGPT?GPT-4 已經發布,中國企業如何攻堅 AI 大模型産業落地難題?
針對這些話題,近日,钛媒體 App 和曠視科技聯合創始人、CEO 印奇進行了一次深入交流。
曠視科技自 2011 年成立的 12 年來,一直緻力于構建萬物互聯的 AI 基礎設施,聚焦消費物聯網、城市物聯網、供應鏈物聯網三大核心場景。根據美國機構 ZetaAlpha 基于 2020 年、2021 年和 2022 年每年被引用次數最多的 100 篇論文最新數據顯示,已發表 AI 論文高引用轉化率的排名中,曠視排名全球第二,僅次于 OpenAI。
作爲最接近 OpenAI 的中國 AI 企業,印奇告訴钛媒體 App,中國攻堅 AI 大模型要先把 GPT-3.5 複現出來,但過程沒有想象的那麽容易。相對于美國不計代價的純技術創新,中國 AI 公司還是要面臨相對短周期商業化的壓力。" 我們要有極強的危機感。"
" 未來的一段時間,能不能有一個公司首先把大模型真的做出來,且性能真的是達到 GPT-3.5,這是所有事情的起點。就像菜你沒有炒過,不知道鹽和味精怎麽放,而且 GPT 所消耗的資源、門檻都非常高。"
印奇表示,因爲大部分中國 AI 公司是不賺錢的,不會燒這麽多錢。從務實角度,中國 AI 公司不可能擁有 OpenAI 和 DeepMind 那樣奢侈的條件,因此,國内一方面要用最艱苦樸素、奮鬥的狀态來攻堅核心 AI 技術,另外中國 AI 公司想活得長,必須要把大模型商業化。
感知、決策、執行、反饋四大模塊是重要的通用 AI 技術體系。在印奇看來,AI 未來會沿着兩個大的方向演進:一是 "AI in Digital",以 ChatGPT 爲代表的技術,将給數字世界帶來新技術範式的遷移;二是 "AI in Physical",以特斯拉爲代表的企業,将 AI 技術引擎與硬件載體結合,産生自動駕駛、機器人等不同類型的智能機器,對物理世界進行改造。
印奇表示,如果在 AI 核心技術上無法引領,曠視乃至中國的 AI 企業,就會在全球競争中逐漸失去自己的位置。而曠視的目标是要做影響物理世界的 AI 技術創新,而且一直堅定的保持核心技術能力長期領先。" 國内隻要迎頭趕上,還是有優勢的,所以現在沒有那麽悲觀。"
具體來說,印奇對钛媒體 App 表示,過去幾年曠視一直深入大模型技術研究,而且有專門的技術團隊研發原創的大模型成果。目前,曠視研究院基礎模型科研聚焦于通用圖像大模型、視頻理解大模型、計算攝影大模型和自動駕駛感知大模型四個方向,提出了 RepLKNet、RevCol 等多個創新性模型,并與整個曠視産品應用結合,從而推動 AI 大模型商業落地。
不過,印奇也對 ChatGPT 賽道過熱表示保持謹慎樂觀的态度。他提到,大家對這個技術有的時候認知還沒有那麽深,但技術不是 " 大力出奇迹 ",不能簡單按照互聯網邏輯發展 AI 技術," 大家對這個表示重視總是好的。"
此次交流過程中,除了談及 " 技術信仰 ",印奇還談及了 " 價值務實 " 另一曠視技術 DNA,回歸業務本質去思考 AI 與商業目标之間的關系。
印奇并不避諱談及目前外界對于 AI 公司規模化盈利難等諸多行業挑戰,他表示,未來曠視不僅長期做技術投入,還要 " 降本增效 " 全力拼盈利。
當談及曠視計劃何時盈利時,印奇告訴钛媒體 App,未來兩三年内部定的兩組關鍵詞是——技術領導力、全力拼盈利。他希望未來 5 年内,曠視科技能突破枷鎖、實現盈利,從而打造一家商業化成功的 AIoT 公司。
" 我們在減成本,公司運營能力在過去幾年有很好的提升。我們要 5 年以内盈利,也可能是更短的時間。" 印奇表示。
印奇對钛媒體 App 表示,真正的 AI 場景創新會發生在邊端側。未來,曠視主打 4-5 個大的垂類場景,包括智慧城市、運營商、智慧教育、工業領域(包括鋼鐵、煤炭)等領域,紮紮實實把合作夥伴服務好。
" 我們内部有一個打法,曠視不用有那麽多客戶,隻要在每個行業裏面真正找到合适的頭部企業、能夠牽引你完成 0 至 1 的 PoC(具體應用的概念驗證測試)客戶,做好深度服務,後面的事情就會自然發生。當你 0-1 做完之後,後面 1 到 N 一定是快速自然的過程。" 印奇表示,在接下來 4-5 年的時間,曠視能有 5-10 個行業能夠做得很紮實就很厲害了。
印奇強調,曠視 "Power Humanity With AI"(用人工智能造福大衆)使命一直沒變。未來曠視不僅要推動通用 AI 技術最終到來,而且要成爲一家商業化非常成功的 AIoT 公司,才有足夠多的資源、資金、人才密度和數據去推動 AI 技術發展。
" 中國和美國未來的 AI 技術路線會很不一樣,很難去做對比。最早曠視成立的時候我們希望成爲谷歌,但後來發現我們不會出來谷歌。我們要走出一條獨特、正确的路線。" 印奇對钛媒體 App 表示。
以下是钛媒體 App 和印奇的部分對話記錄:
钛媒體 App:AI 大模型落地還有哪些難點?
印奇:難題很多,首先,中國就沒有誰能夠迅速擁有 GPT-3.5。其次,中國能夠把兩萬塊 GPU 卡訓練出來的公司,隻有 5 家企業以内。
此外,我認爲最重要的事情就是現在能把 GPT-3.5 複現出來,這件事情沒有想象的那麽容易。在互聯網時代,大家很多時候隻講 what,不講 how,好像 what 想清楚了,how 就很容易,大家沒有想到,我做大模型後面做什麽應用,你先把大模型做出來,如果看現在已經公布的大模型,跟 3.5 的差距非常大,而且這個差距有可能是本質的差距。
在未來的一段時間,能不能有一個公司首先把大模型真的做出來,且性能真的是達到 GPT-3.5,這是所有事情的起點。就像這個菜你沒有炒過,不知道鹽和味精怎麽放,而且這個東西所消耗的資源、門檻都非常高。
大家喜歡用類比,有人說這是一個 iPhone 時刻,有人說這是當年谷歌發明搜索引擎的時刻。你要真正對科技史了解的話,你會發現在谷歌之前有很多搜索引擎,跟谷歌是代際的差别。
我們來看數字引擎,包含兩部分,一部分包含底層技術的突破,我是相信這個底層技術可能已經突破了,但是還有一些問題沒有搞的特别清楚;還有一點,這個底層技術和核心應用真的要變成一個閉環。我們還沒到 " 谷歌發明搜索引擎 " 的能力,但是有可能是前夕,大家比較興奮也很合理。
钛媒體 App:中國 AI 企業當中爲什麽沒有出現 OpenAI 或是 ChatGPT?
印奇:首先,我認爲中國 AI 行業已經算挺争氣了。其次,美國在中國最熟知的,除了互聯網大廠之外就是 DeepMind 和 OpenAI,美國也許對于純技術創新方面确實有一個更大的資金量,而且很長期的投入,中國 AI 公司還是面臨相對短周期商業化的壓力,這個還是挺不一樣的。
美國整體原創性的創新能力比我們要強,但我認爲,至少在 AI 領域裏面差距并沒有那麽大。
不過,我們要有極強的危機感。如果我們能夠把 GPT-3.5 複現出來,至少對這件事情大家的認知接近,GPT-3.5 是更重要的點,至少讓大家在共同的基準上,這樣後續無論是應用的創新、對技術的創新各方面至少有感覺。如果再晚去投入的話,至少是一個跨 10 億美金起跳。這個門檻是比較高的。
國内隻要迎頭趕上還是有優勢的,所以現在沒有那麽悲觀。但不要指責中國 AI 企業,因爲大部分中國 AI 公司是不賺錢的,不會燒這麽多錢。而從務實角度,中國 AI 公司不可能像 OpenAI 和 DeepMind,我們沒有那麽奢侈的條件。
所以在我看來,一方面,我們要用更艱苦奮鬥、樸素、節約的狀态來攻堅核心技術,這是最重要的能力,但是挑戰很大,因爲這是一個長期積累的過程;另一方面,别要有幻想,在中國 AI 公司想活得長,必須要商業化。這兩件事都很重要。因此,大家對中國 AI 公司不用太苛責,我們已經挺努力了。
钛媒體 App:對于爆火的 ChatGPT,曠視有哪些看法和思考?
印奇:在過去四五年時間,曠視對大模型這件事情一直非常深度 Follow(關注)的,而且,曠視還有很多一些原創、非常重要的大模型成果,曠視專門有個組叫 Foundation Model,這個組隻做核心的模型設計,不是做一個工程化。他們有非常強的技術方面的科研能力。
我給出三個很簡單的結論:
第一、大模型這個方向是确定性的。我們不是因爲今天熱門了才做,而是已經做了有四、五年的時間了;
第二、大模型從 Transformer 之後,基本上形成大一統的局面,語言模型、視覺模型,甚至說谷歌的機器人控制模型,這裏面基本上形成了非常明确的行業共識。比如你會發現真正抓住這波 NLP 機會的人 , 都不是傳統 NLP 的人,因爲傳統 NLP 的人有一套建構性思維,逐步體系往前走,你會發現這波都是做深度學習(DeepLearning)的人,就是 " 暴力美學 " 的這幫人,這個已經形成了大一統。大模型是個确定性的方向。此外,大模型的多模态融合已經不那麽區分細分領域,核心則是看其在深度學習領域的深度理解能力;
第三、曠視無論是以往的積累,還是未來,一定是非常堅定的投入,但是我們在應用方向上也很堅定,我們還是在 AIoT 大環境下,并不會去趕熱點。舉個最簡單的例子,比如像自動駕駛領域,我們内部做了很多的研讨,ChatGPT 具備很多帶邏輯引擎的能力,這對實現自動駕駛未來真正的全面推廣非常關鍵。
大家要把 ChatGPT 做區分,裏面有兩層,Chat 是上面的應用我們不會做,但是下面的 GPT-3.5 核心技術能力,我們肯定會儲備。本質上,GPT-3.5 語言模型包括知識引擎、邏輯引擎,這兩個東西不光是跟對話場景相關,是跟所有邏輯知識相關。下面大模型的技術能力曠視會非常堅定的投入,且我們認爲現在的技術和條件都非常好。
钛媒體 App:AIoT 賽道玩家衆多,曠視曾把華爲、大華、海康威視當同行業可比公司,那麽,曠視是想要做下一個華爲、海康嗎?還是有其他想法?
印奇:我們非常尊敬華爲和海康、大華這些具有強實力的智能化轉型的硬件廠商公司。不過,我們成爲不了華爲、海康、大華。所以,大家認爲計算機視覺公司越來越像安防、視頻監控等領域企業,但其實大家已經放棄這個幻想了,這個領域還是老玩家的天下。
不過,這個領域的邊界擴的非常大,我們将持續專注在數字化感知,而不是安防。在數字化轉型方面,我幾乎看到所有的行業會發現上面那層叫 "IT",有些制造業下面有些是 "oT",中間有個非常大的空間叫 AIoT,中間這個空間不是視頻監控,它可能更多是泛廣義的數字化感知能力,跟很多核心業務整合。這個是我們想真正去長期耕耘、相對偏早期運營階段的市場。
曠視要做萬物互聯的 AI 基礎設施,裏面我們非常強調邊 - 端 - 側,這是我們一直沒變的。
總體來說,曠視戰略邏輯比較清楚。我們認爲,真正的 AI 場景創新會發生在邊 - 端 - 側,而邊端側的本質是要降低門檻。你發現,算法變便宜了,而且每個行業對算法的要求不一樣,還要不斷地叠代。算法裝到一個硬件上,那個盒子傳感器就得很标準化,這就是算法定義硬件。而且,我們會算法生成、計算平台、傳感器,甚至未來會提供一個類似用模型去做、偏自動化編程的東西成爲我們的産品。我認爲,這套東西能把邊端很多核心創新的部分核心解決掉,接下來每個行業的合作夥伴,再從上遊去做更深度的應用邏輯、業務開發。
值得一提的是,降低 AI 門檻或價格不會導緻毛利率的降低。而且,算法定義硬件,最終本質上硬件的平台越标準化、規模化,成本越低就越好,軟件的比重會越來越高,而且還提供軟件相關生态。因此,我們會堅定去做 " 算法定義硬件 "。
钛媒體 App:曠視現在處于活下去階段,還是要考慮未來生态?
印奇:其實曠視的使命一直沒變,叫 "power humanity with AI"。中國很少有一家企業從出生開始就伴随着一個核心技術,且這個技術從底層業務創新到整體産業化的落地。之前我們說模式創新,曠視從一開頭就跟 AI 這個技術相伴。
技術推動、商業化成功這兩個東西很難說哪個是目的,哪個是手段。本質上,基于 AI 技術的到來,且能夠造福大衆,這件事情很重要。甚至回頭來看互聯網的發展、移動互聯網的發展,是不是真正所有的技術保持着讓整個大衆或者社會群體能夠變得更好。這是不一定的。
未來曠視階段化發展有兩點:第一個是推動 AI 的到來,而且真的對大衆是有益處的,這件事情曠視一直沒有變,推動技術最後的到來是很重要的點;第二個是打造一家商業化成功的公司。我自己一個很重要的想法是,想要推動通用人工智能(AGI)技術最終的到來,一定是要在一家非常商業成功的公司,才有足夠多的資源、資金、人才密度和數據去推動這樣技術的發展。
對于我們來說,目的和手段并不重要,但這兩件事情必須同時達到。
钛媒體 App:之前你提到非常關心腦科學領域,那麽爲了通用 AI,曠視未來是否也會做相關工作?
印奇:最早我非常關注腦科學,當時我認爲對腦科學很多基本判斷會幫助 AI 的發展,但邏輯反而是,AI 的快速發展促進了大家對大腦的認識。比如,飛機的發展,本質上是先研究了鳥,但發現做不出來,最後卻突然做出了飛機,做出了飛機之後後面才衍生出了空氣動力學,而不是研究了鳥,一下子就把飛行這件事情從物理領域解決了。我相信,AI 也會走這條邏輯。
人類對腦科學的研究進展沒有那麽快。這個時候用 AI 的方式,本質上是對人腦核心智能結構的判斷,認爲真的突破了,這個時候我們一定發現有個 " 智能算法 " 的東西。
曠視一直在做,技術都是長期積累、從量變到質變的過程。OpenAI 最牛的是,他們是大模型的原教旨。所以,我們一直說技術信仰很重要,同時價值務實也很重要,這是曠視核心的 DNA。
(本文首發钛媒體 App,作者|林志佳)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App