1 月 21 日,傅盛攜手混沌舉辦了 2024 · 傅盛的 AI 開年大課《每個企業都有私有化大模型的時代到來了》,并重磅發布獵戶星空企業應用大模型。本次演講也邀請了多位重量級嘉賓:360 集團創始人周鴻祎、極客公園創始人 & 總裁張鵬、中國移動通信集團終端有限公司副總經理汪恒江、亞馬遜雲科技大中華區解決方案架構部總經理代聞、混沌學園合夥人張雷……
以下内容根據圓桌論壇内容整理,混沌君略有删改:
圓桌論壇主持人
韓 笑| 混沌學園課程主任
圓桌論壇嘉賓
汪恒江| 中國移動通信集團終端有限公司副總經理
代 聞| 亞馬遜雲科技大中華區解決方案架構部總經理
張 雷| 混沌學園合夥人、混沌學園 ToB 事業部負責人
傅 盛| 獵豹移動董事長兼 CEO、獵戶星空董事長、混沌學園三期學員
主持人韓笑:接下來,我們開始今天的第二場圓桌讨論,這一場的主題将會圍繞 " 企業私有化大模型技術在産業落地的應用與展望 "。今天的嘉賓分别代表了不同類型和規模的企業,也都是各自領域的專家。
第一個問題,首先請問各位嘉賓,做企業私有化大模型的準備工作都有哪些,特别是在數據管理、技術選擇和團隊準備等方面,各位認爲企業應該重點關注哪些方面?
汪恒江:首先感謝傅盛的邀請。我先簡單介紹一下中國移動終端公司。中國移動終端主要做兩件事:一是手機銷售業務,比如蘋果、華爲等手機的全國代理和地方省級代理;二是家庭終端設備的研發生産業務,比如光貓、機頂盒、路由器、攝像頭等家庭智能硬件。
回到問題,大模型來了之後中國移動終端很關注以下兩點:第一,站在企業角度,中國移動終端作爲硬件廠商,我們的業務流程中是否存在一些環節更适合用大模型進行改造,以提升收益比;第二,不同地區需求不同,面臨的問題也不同。比如中國移動的家庭工程師入戶時,要求 15 分鍾内必須要完成全部安裝,但安裝現場總會遇到一些問題,比如,如果機頂盒出現問題,要如何處理?那麽,發生上述情況的時候,AI 是否可以成爲客服幫助家庭工程師。
對此,我們在 4 個省做了相關試點試驗,大概回答了 530 個問題,并且都是在 1 分鍾之内解決的,且一分鍾就有一個回答。反之,如果不用 AI 的話,可能 15 分鍾内沒有回答,這對工程師來講是很無助的,且工程師還可能會有投訴。因此,用大模型的第二個好處是提升效率降低成本。
代聞:我來分享一下在企業私有化大模型的落地方面亞馬遜雲科技的幾點觀察。
首先,結合近兩年的經濟環境,目前大多數企業都意識到使用生成式 AI 至關重要,且都當成了一把手工程。之所以如此,核心就在于生成式 AI 在降本和增效兩方面非常明顯。此外,這次 AI 的爆發最大的不同在于,以前是技術部門有一款産品推廣到業務部門,而這一次相反,是業務部門有明确的需求,需要技術部門承接。
第二,從企業私有化大模型來講,安全是第一位。對于企業而言,如果因信息洩漏導緻企業出現問題,企業甯願選擇不做。比如,因爲企業很多的财務數據、法務數據都非常敏感,規則不好、工具不行就有問題。所以,企業在私有安全方面看得很重。
第三,大模型落地工具的選擇。大模型很容易讓人聯想到技術,所以大家都會去考慮模型間的技術性能比較,反而忽略了在落地時需要一系列的工具支撐,實際上,大模型在落地的時候,整個工具鏈也是有變化的,所以一定要選擇合适的工具來加速落地。
第四,數據平台的進一步建設。以前,數據資源如何轉爲資産不太明确,但生成式 AI 對于數據資産的等級、質量和安全提出了更高層級的要求。此外,不同大模型對數據的提供形式和調優方式不同,這就要求數據平台不僅完備而且靈活。
張雷:混沌自從擁抱 AI 開始到現在,基本都是使用理工科的思維和體系來進行業務拓展和團隊建設。而傅盛總說要 "Think different",而不是 "Think better",所以,在此我嘗試通過 "Think different" 的文科思維的角度來講述一下混沌的思考。
我認爲,企業私有化大模型應該做如下準備:
第一點,團隊共識很重要。在我看來," 知道要做 " 和 " 動身去做 " 是兩回事,團隊動起來才能真正的把企業私有化大模型做好。以混沌爲例,爲了要推動私有化大模型,混沌花了近大半年的時間去做準備。2023 年 4 月份,混沌内部就意識到私有化大模型是一個機會。于是,我們在 5 月份、7 月份、9 月份分别開了一次合夥人級别的會議,三次會議沒有得出非常具體的結論,但是形成了一個非常重要的共識,即 " 大模型很重要 "。在團隊上層達成一緻後,10 月份公司将各個部門骨幹和核心員工聚集在一起又開了一次會,以探索 2024 年在課程制作方面混沌可以開拓哪些新維度。可以說,從 4 月份到 10 月份,整整 6 個多月的時間,混沌都是在做團隊準備,進而自下而上在 " 要做大模型 " 上達成了一緻。
第二,要有技術儲備。混沌本身不是一家技術驅動的公司,我們可能因此不是最懂大模型的,但是,我們可以和精通大模型的團隊合作,通過專業的團隊建立好相應的私有化大模型,相當于爲 "AI 新員工 " 做好辦公層面的 " 基礎設施 ",進而形成基本的生産力。
第三,梳理和積累過往的内容和數據。這就好比,大學生入職後如何培訓,以及過往的内容有沒有流程化,有沒有教材可以學習等等,都需要形成數據流,進而爲大模型的生成做好準備。
第四,團隊基本能力構建。比如,大學生入職後誰來領導他們,告訴他們工作重點和時點。爲此,我們開始号召全員學習 AI 和相應的認知,如此員工才能知道如何指揮 AI 爲工作賦能,以及如何叠代進步。
第五,找靠譜且願意跟我們共同成長的供應商。因爲人力管理是一件非常重要的事情,比如一千個員工的管理非常複雜,比如日常管理、社保繳納等,因而需要找一個專業的 AI 服務商。簡而言之,就是找優質的人力外包公司,這也是我們與獵戶座合作的原因。
總之,需要做到面面俱到,但也不需要想得太複雜。
主持人韓笑:接着上述三位的回答,我想請問傅盛總,在數據準備、應用場景和數據安全等方面,獵戶星空有沒有賦能的策略可以幫助用戶快速适應?
傅盛:我補充兩點。第一,今天的 AI 變化很快,并不是簡單用一個工具就可以完成,實際是整個生産流程、組織流程的改變,所以一把手自己一定要上。
第二,組織流程必須發生改變。比如,計算機信息化的時候,肯定不是買兩台電腦和用一些軟件就可以,而是需要培訓,成立專門的部門,要進行各種考核才可以完成。爲什麽我們提出咨詢服務,原因在于不可能用标準化的套件解決企業問題(至少在今天不行)。總之,大家還是要從邏輯上重新思考這件事。
至于數據準備,我覺得難度不大,因爲 AI 把數據外延給打開了——以前,數據準備必須成爲報表系統,現在隻要有文字在裏面就可以做出來。相反,我認爲數據本身是跟着應用生長出來的,而不是先兜底再上,應該先慢慢實施,包括汪總講的問題是特别通行的問題。
主持人韓笑:第二個問題希望請教代總,我們知道亞馬遜雲科技有衆多不同領域、不同規模的企業用戶,同時我們還有 Amazon SageMaker 這樣的機器學習平台作爲在生态裏面的算力管理和運維服務商。從亞馬遜雲科技的視角看,不同規模的企業在采用私有化大模型時有哪些不同的訴求和挑戰?
代聞:劃分的維度有很多:一是小微型公司、初創公司和大企業的不同;二是國内與國外的不同。小微及初創公司更多的訴求是如何跑起來、跑得快,有明确的效益,這是首要的訴求。因此對模型能力開箱即用的要求是非常高的,這也符合絕大多數小企業對于 SaaS 的一些訴求。
大企業會複雜很多。比如,大企業可能有一些文檔還沒有電子化,電子化的文檔格式可能很多、存儲可能很分散,甚至需要考慮部門之間的不同權限,等等。大企業要求大模型落地既要有業務效果、又得是安全可控的。
簡言之,大企業要穩、要達到成效,小企業需要更靈活易用的工具、更願意承擔試錯風險。
至于國内和國外,考慮到國内外的模型生态是非常不一樣的,因此如果要做全球的業務布局,就要考慮國内外分别用什麽樣的模型、框架來落地。此外,要特别考慮數據的合規和安全,哪些數據能傳,哪些數據不能傳,等等。
主持人韓笑:接下來我想請教一下汪總,中國移動終端已經擁有超 2.9 億的家庭用戶,同時我們也了解到中國移動終端正在發力于家庭智能硬件和終端算力,我們很好奇這些領域是否有應用私有化大型的可能性?
汪恒江:作爲終端的業務單元,中國移動終端在考慮推進算力網絡的過程中,去設想在端側到底能不能承載智算的需求。今天也借此機會和大家介紹一些關于 AI 終端的基本情況。實際上,從今年開始,我們團隊一直關注這個方面,因而我們也關注了一些重大事件:第一是高通和 MTK 兩家芯片廠商在 11 月份陸續發布了兩款旗艦機的芯片,基本上能跑到百億級的參數。由于這兩款芯片的發布,榮耀、VIVO、小米也随之發布自己的端側模型。
第二是在 2023 年年底的 AIPC,聯想高管也正式提出來 AI-ready 和 AI-on 的說法。從目前的情況來看,2024 年的上半年應該處于 AI-ready。換句話說,在硬件層面,聯想通過使用英特爾和英偉達的一部分芯片,已經準備好了。
所以,盡管很多人都說,大模型在中國落地比較難,但我個人認爲 AI 在硬件落地的事情,應該是一個大概率的事情。因此,從這個角度上,未來可能有幾個技術上的事情需要行業裏逐漸攻關解決:
第一是關于協同的框架研究,端成本是非常敏感的。比如,智能音響的硬件需要 300 元,但假設 300 元的硬件都在雲側做一次 GPT4 的大模型推理的話,成本是 200 美金 / 月,顯然是不可接受的。
第二是将模型的 Size 縮小到一定程度,能做一些專屬領域的回答,剩下回答的不好的," 甩回 " 雲側來做。這樣一方面解決成本的問題,一方面也解決了滿意度的問題,以達到增流、減支。
第三是個性化。人類的很多數據是一定需要私有化和個性化的,特别是在端,比如手機裏面的數據。所以,我們要構建一個在端側能夠在不出廠的情況下,能夠進行個性化的模拟。
最後,AI 終端對生态的影響也是非常深遠的。大模型來了之後,應用之間的壁壘可能通過端來具體的協調。比如,選擇哪一個打車軟件,可能是端側需要控制的,所以生态上可能會發生一些變化。以上是我的幾點觀察。
傅盛:我簡單補充一下,剛才周總有一個誤解就是你做機器人又做大模型,做了大模型就不做機器人,我覺得這兩者完全不是對立的。爲什麽我們這麽重視量化版,能在一千塊錢的顯卡中跑的版本,我們除了做企業經營應用之外,就是我們覺得端上有大模型是必然的,就今天汪總說的那些芯片廠商都在上,喊出了 AIPC。
主持人韓笑:問題回到混沌學園張雷老師,混沌代表了泛内容行業的企業用戶,同時,混沌作爲創新創業商學教育的頭部品牌,有大量的、來自各行各業頂級頭腦的高質量語料沉澱。這一輪我們也是獵戶星空的首批用戶,請您跟大家談談,混沌是如何利用私有化大模型來推動業務發展的?
張雷:我認爲泛内容行業應該是最先與 AI 結合,或者說最先被擊穿的行業,因爲泛内容行業天生就能夠被數字化。舉個例子,從物理性質和産業規律來看,聲、力、熱、光、電中,隻有電符合摩爾定律,因此,芯片的叠代很快,性價比也呈現規模效應。但是,人形機器人則不然,很難把成本壓縮得很低。
同理,内容行業擁有足夠的語料庫,有輸入和輸出的設備,能夠與大模型和大模型上的相應應用匹配,讓原來單向的、規範化的内容有了智能交互的可能,相當于插上智能化的翅膀。比如,通過智能化手段,直接呈現用戶最想要的核心内容。
因此,混沌想做的就是借助大模型的智能化力量,讓在混沌學習的同學,可以離想實現的目标更近幾步。例如,參與線下課程的同學有機會與教練和導師一起交流,任何問題可以及時響應,導師也可以當面與學員打磨方案,因此,對于線下的同學而言,他們的收獲是很大的。但是,同樣的場景如果轉到線上,就會遇到麻煩。比如,線上同學遇到問題要如何實現及時的響應?凡此種種,都需要一個更好的解決方案。
因此,混沌目前是通過訓練大模型以實現以下幾個目标:第一,幫助學員快捷吸收課程内容——同學對什麽東西感興趣,我們就直接推薦相應的内容框架、摘要。第二,爲學員提供線上的陪練、教練,同學有什麽商業方面的問題,比如要做 IP,可以利用大模型系統化整理的理論和經驗進行學習。
我們深知,學習成果的轉化是需要時間的,且這個過程對于大多數人來說也比較累。所以,如果我們能夠創造一些條件,例如,讓學員直接獲得答案或是專業人士陪伴式教學,就能縮短時間,降低學習難度,提升學習效率。與此同時,如果有數字分身,如數字教練、數字同學,既能夠讓線上同學之間随時保持交互,形成即時性的互動學習,不僅對于線上同學而言是好事,對于大模型的發展和混沌内部團隊的認知和能力提升,也是好事。總之,混沌的終極目标是能否讓更多人不花太多時間學習,就能迅速提升。
主持人韓笑:基于張雷老師的答複,我在此向傅總提出一個問題,我們是不是可以認爲混沌的 " 學習官 " 也應該分學科、分領域進行更細化的再調優?以及在這樣的情況下,它的回答質量會更高嗎?
傅盛:第一,在獵戶星空爲混沌服務的過程中,我們确實是在不斷地進行細化調優。因爲沒有完美的技術,重要的是,在技術的生長過程中做好足夠的拆分,當做好垂類應用的時候,體驗就會上去。第二,混沌做的嘗試非常有意義,AI 應用最先重塑的其實就是教育。比如,如果你在 3 月份給自己一個目标,不借助任何網上搜索、不看任何書籍,不找任何程序員,要學會用 Python 寫一個貪吃蛇的遊戲,如果沒有相應經驗可能很難,但如果你會使用 AI 助手,可能在幾個星期的交互下,就有可能學會,真的是 " 亂拳打死老師傅 "。
主持人韓笑:在各位看來,未來三年,私有化大模型将如何影響企業的未來發展?您會如何建議企業利用這些模型實現商業價值的最大化?
汪恒江:我認爲,随着端側硬件能力逐漸增強,模型算法和數據量的提高,假如 2023 年底出現一百億的芯片,那麽,2024 年底出現三百億承載的芯片是有可能的(假設)。
第二,家庭并不是一個端,而是有很多端和數據,端 - 端之間的數據打通也很關鍵。所謂的智能,是由感知開始,因此端 - 端之間就需要協同。數據彙集到強端點的時候,可能會起到比今天更加智能的智慧家居服務。
第三,今天講私有化模型,其實是兩個模型的叠代。端的模型可以在雲上訓練,谷歌 Gemini 有 Nano 1 和 Nano 2,它是訓練叠代,有兩個叠代的飛輪:一是在本身私有化數據下定期的叠代;二是在雲上訓練出來端用的模型叠代。雙輪叠代的數據也會讓端的能力和模型有比較好的提升。
這是我展望的三個點,可能不是很成熟。
代聞:講一下三年之後的期待,或者大概率會實現的事情。
第一,企業應用把 AI 能力作爲默認選項。現在很多公司都已經開始嘗試,比如保險公司使用 AI 研發新的産品,企業銷售部門使用大模型分析商機、洞察業績等等。
第二,工程領域裏的工具鏈更加标準化。舉個例子,現在我要退大促期間買的貨,這可能會調動多個模型的多個能力,需要有很多的中間件,而這些中間件還沒有标準化。希望三年後,無論是大廠還是初創公司,都可以使用相對标準化的工具鏈,讓整個業态的創新能力加快發展。
第三,負責任的 AI 成爲日常——企業在應用大模型能力的時候,對大模型的能力邊界和企業責任邊界有充分認知,而且有成熟的工具評估模型、支撐策略落地甚至策略發現。
張雷:我的第一點感受是,先解決應用問題,目前,在大模型領域還沒有出現任何一個 " 殺手級 " 的應用,也還沒有人通過研發相應的應用賺到錢。但是,從商業的角度來看,因爲人類向前創造價值的規律是一緻的,每個時代最重要的事情就是連接。哪怕供給側不一定爲我所掌控,但我可以在大模型的時代找到應用場景,且這個應用場景有人願意付費,就有價值。當然,能否找到應用場景就需要創新者非常理解需求,所以一定是産業側的人能做到,而混沌願意成爲第一個探索者。
第二點感受,未來三年,會有很多企業上私有化大模型。因爲如果用大模型不私有化,相當于訓練的員工是兼職的,雖然可以形成生産力,但無法形成競争力,所以很多企業一定會做私有化的考慮,隻有這樣,才能形成可持續化的競争力。
第三,2024 年是混沌成立的十周年,我們自己定義 " 下一個十年就是 AI 時代 ",商業世界這艘大船即将湧入 AI 時代的驚濤駭浪之中。在此,我稍微打一個廣告,混沌計劃在三月初三包一艘郵輪,我們稱之爲 "AI 時代的啓願之舟 ",屆時我們将會在船上舉辦一系列的活動,主題是圍繞 " 對 AI 未來可能性的探索 ",包括大模型、私有化、各行各業的應用。在此,我也先邀請在座幾位上船,共同探索。
傅盛:三年在 AI 領域真的會變化很多。第一,一定規模的企業都是私有化大模型,這一點我是比較笃定的,它不像雲,雲是越公有成本越低。第二,一些原生應用會迸發出來,因爲經過兩三年的打磨,一定會出現像滴滴打車、美團外賣一樣的産品,具體是什麽我目前不知道。第三,機器人可以開始進入家庭,不一定是人形那種炒菜做飯,但可以陪伴父母、教育孩子,你做好 Agent 等可以輕松做到。
主持人韓笑:在讨論接近尾聲之際,希望能夠邀請四位嘉賓爲我們正在展開的 2024 年留下一句寄語或者爲大家送出一個 2024 年的 " 認知錦囊 "。
傅盛:AI 時代,所有人都在同一個起跑線上,所以其實機會是更大的,我覺得大家要躬身入局,認認真真深入學習,讓自己成爲 AI 時代的弄潮兒。
汪恒江:人人都需要私有化的個人大模型,并建立你自己的個人知識飛輪。
代聞:沒有一個模型會統治一切,場景明确,以終爲始。
張雷:帶着大家跟我們一起上 AI 時代這艘船,海上夜裏,可以看見獵戶星空。
主持人韓笑:謝謝大家,今天的《2024 · 傅盛開年 AI 大課》到這裏就要結束了,再次感謝每一位參與者的支持和貢獻,也感謝線上同學們的一直陪伴。請大家繼續關注獵戶星空,繼續關注混沌學園,我們邀請大家一起,繼續探索 AI 的未來!