在繪畫、寫文章、創作視頻之後,AGI 應用的另一大場景是:編程。
曾經大家認爲編程有很高門檻,但在 AGI 時代,它在變成人人觸手可及的技術,越來越多的 AI 編程工具,讓不會代碼的普通人也能輕松制作 App。
我們如何擺脫基于移動互聯網時代的想象,展開大模型時代新的可能性?未來是不是人人都能成爲 AI 程序員,創造專屬于自己的「個性化應用」?
對于這些問題,AIGCode 創始人宿文在極客公園 IF2025 創新大會上,給出了自己的答案。
宿文認爲,在 AGI 的賦能下,AGI 代碼可以把應用帶入更有「個性化」的階段,讓每個用戶可以實現自己小衆但精準的需求,小團隊也可以降低成本,快速叠代。這是宿文眼中編程的終極場景。
在宿文看來:
在互聯網時代創造的應用、平台,并不生産任何内容,隻完成内容的聚合和分發。
在大模型時代,大模型隻有一個核心功能:在底層幫大家生成内容。
大模型時代剛剛拉開序幕,大模型的鏈條會長什麽樣,每個從業者還在探索,但這條鏈條可能不會長成上個時代的樣子。
AI 編程将重塑軟件開發行業,軟件開發「又好又快又便宜」可以同時實現。
在大模型時代,沒有超級應用,隻有超級智能。
以下是 AIGCode 創始人宿文在極客公園 IF2025 創新大會上的現場演講實錄,由極客公園整理。
宿文在極客公園 IF2025 創新大會上進行演講|圖片來源:極客公園
01
從 Copilot 到 Autopilot
即将過去的 2024 年,大模型賽道引發了許多讨論,AI 編程是其中一個繞不開的話題。
大家都會說程序員被大模型改造得很深刻,全世界程序員群體有七八千萬,占世界人口 1% 左右。這麽厲害的軟件代碼改造技術,怎麽讓其他 99% 的人使用呢?
我們可以舉一個例子,今天中午極客公園鵬總突然說這個活動辦得很好,除了線上買票、線上收費,咱們線上直播行不行?會務組小夥伴崩潰了,去哪找直播管理平台,去哪找 SaaS,如果自己定需求,自己去做開發,至少幾個周、幾個月時間。
爲了方便大家了解 AIGCode 的産品 AutoCoder,我們把這個平台給大家看一下。
AutoCoder 演示界面|圖源:AIGCode
這個産品完全面向不會編程的人群。
另外很重要的點,相比大家現在拿到的類似産品,主要圍繞前端,但是 AIGCode 能夠把後端和數據庫一體化交付給大家,能交付出一個完整的軟件工程。
做這個事的源頭,跟我上一段創業有關系。我上段創業是做軟件,有一個比較大的痛點是效率,我們經常提出一個需求,程序員要做幾周甚至幾個月,我們看到很多很好的技術棧,字節、阿裏用得很好,但我們程序員用不起來,而且程序員成本很貴。
所以做軟件,怎麽做得又快又好又便宜,這是每個行業都面臨的難題,不可能在一個維度上去解決。然而大模型來了,又好又快又便宜可以實現了。
當然實現過程中,目前主要有兩類解決方案:一類就是 Copilot,就像名字一樣的,幫程序員做輔助駕駛。另外就是我們想做的 Autopilot 這樣的産品。
Copilot,目前主要還是圍繞程序員工作場景在 IDE 裏面做代碼補齊,中國沒有 IDE,甚至全球最主要的 IDE 80%、90% 的市場都在微軟手裏,作爲初創公司很難在生态裏 PK,隻能繞開這個很大的生态競争。我們在 Web 端做 IDE Free 的産品,端到端去做。我們用戶會完全不一樣,我們把用戶群體從 1% 放大到 10%、20% 都有可能。
目前大家所用到的模型和 Copilot 産品,主模型能夠用上最好的基模,不管海外還是國内,大家都在使用 Deepseek 這種水平的基模。要把代碼鏈條優化得足夠好,核心的技術都卡在模型上,所以自研模型不會套殼,不會用 Llama 去做,我們會有自己的模型架構解決這個問題。
還有很重要一點,傳統軟件架構跟生成式軟件架構不一樣,兩大支柱做了算法和軟件架構層面的創新,這是我們兩塊主要的工作。
右面是模型上的工作,核心解決兩個點:又大又準,大的是「大上下文」,而不是後半段做 4K 窗口的串聯。另外是新的網絡結構帶來的收益,還有一塊是在軟件結構的創新。
ChatGPT 的火爆正好兩年多,我們其實站在今天這個節點來看,我們很憧憬大模型可以解決很多問題。
今天可以解決的問題主要在寫字和畫畫兩個場景,很多理科生的的問題,比如數學、編程這樣的工作還沒有解決得很好,我們遇到了很多其他問題,比如訓練成本、資金、模型本身的泛化能力、訓練效率等等。
目前網絡結構在 Transformer 往前叠代,去年上半年提出的 MOE 這種架構也在改造整個大模型,在 MOE 之後還有 MMOE 等很多技術叠代。
我們率先使用 PLE 架構,核心是我們能夠在網絡結構層讓專家或大模型,更有結構化地深度學習人類高質量樣本。至于樣本不夠用的問題,其實不會出現,因爲我們有很多高質量的樣本,像論文、代碼這些樣本還沒有被徹底學到。
爲了讓整個模型可以支撐起完整的代碼生成,模型底層還要配套很強的算法,所以我們自己去做優化,包括不同的算力平台的整合,一體化平台上的算力加速,我們看到的技術卡點,都解決掉了。
我們自己的模型成果,也不會拿國内任何一個軟柿子去捏,去對比,我們還是拿全球頂尖的團隊的最新版本,最大參數量去做,我們在泛化指标上,是跟主流模型基本平齊的水平。
我們會在接下來三個季度把 13B 和 33B 也發布出來,給有模型使用能力的團隊使用。
這句話是我們公司的願景,剛剛主要解釋了上半句,Auto-coding is AGI,我們看起來在解決代碼編程的問題,但是核心問題是:能不能把端到端代替程序員寫完代碼。
02
Auto-coding 加速「個性化」
這問題由 AGI 模型本身決定,我們發現,無論解決上下文還是網絡結構、底層優化器、算力加速等等問題,都是目前 AGI 最大的痛點,這兩個問題幾乎是等價的,AGI 和 Auto-coding 基本上同一個時間點到來。
底層邏輯有兩個:一、代碼本身就是一種高質量語言,對于模型訓練非常重要。另外,我們覺得 AGI 本身從一個新技術的出現,到兩年前的 ChatGPT 進入大衆視野,我們對它有很多憧憬,但它解決很多行業問題還不成熟,所以很多行業專家或者用戶就會罵街,說這個工具不成熟,解決不了問題。
但是對于代碼這個賽道來說,比較幸福的是:我們算法工程師,95% 都是程序員出身,因此思路上閉環很快,自己做得好不好,我們自己心裏有數。
第二點是,這樣的 Auto-coding 準備好後,解決問題時,怎麽端到端,要打到哪些需求點?
用戶體驗上的核心之處:第一個點是準确,我們所有需求,怎麽達成底層産品鏈條裏的準确率?今天使用很多 Agent 類産品,第一個生成的版本很好,但細微的需求點沒有辦法實現。
第二個點是靈活性,在一個應用的生成過程中,最重要的是要實現各種各樣個性化的要求,比如一個搜索框,能不能實現得足夠靈活,能跟所有功能邏輯串通。
第三個點是完整度,這是軟件工程上的工作,要解決工程的安全問題、部署問題。在這些工作做完後,這套方案就會變成基礎設施,程序員的工作全部用推理算力成本就可以解決。我們想去做的 Personal App(個性化應用)就可以實現。
大家看到這個場景的時候可能會說:「我們手機裏裝的都是通用應用,我要一個 Personal App 做什麽呢?」也有很多人問我:「你們要 ToB 還是 ToC?」
其實一個新的生産力工具出現時,這些問題都不重要,舉兩個很有意思的例子:
上周我去雲南某城參加一個會議,會議組織方帶我們去景區,很多人排長隊在買票,但旁邊有好幾台自動售票的機器,我走近一看都開着機,機内裝着 Windows 系統,這時候如果有一個管理人員可以提出一個售票系統的需求,都不需要在當地找程序員,用可以在 Windows 裏部署一套售票管理軟件,排長隊買票的問題就很好解決。
另外一個例子,我跟一個朋友讨論播客,我們聽播客很多都依賴于小宇宙這種播客客戶端。在美國,很多主播會在 YouTube 上有視頻播客的頻道,國内很少用視頻的方式做播客,這個朋友說我們不太想露臉,如果有一個卡通形象體出鏡,去做視頻播客,主播就會自然舒服很多了。
所以大家會發現,在我們場景裏有非常多個性化應用的需求,哪怕是基于一個通用的平台,都可以加很多個性化的功能進去,這在編程的終極場景裏都可以實現。
我們在小紅書、知乎或者百度上,想搜索一個軟件去解決我們一些問題時,本質上都是在提需求。如果這樣的需求可以通過自動生成的代碼和應用實現,而不需要用戶去找各種各樣的應用,找到後還要克制自己的需求。這兩種體驗完全不一樣。
03
大模型的核心功能,究竟是什麽?
關于代碼生成和我們公司要做的事情,介紹到這裏就結束了。接下來我有三個真話想說:
一、大家一直在追求 AGI 或者解決 AGI 問題,是很割裂的。比如很多大佬都會說,整個大模型目前還處于嬰兒期,但是從 2024 年初到現在,大家都說今年是 Agent 元年,但一個嬰兒期的工具怎麽解決那麽多問題?
我們經常聽到說 Scaling Law 走到盡頭了,但是囤卡樂此不疲,H100、B200,1 萬張,10 萬張,大幾十萬張卡,現在大廠甚至開始搞核電站了,包括 Ilay 最近提到的,預訓練期結束了,其實裏面沒有什麽幹貨,主要把樣本學完,但是還有很多高質量樣本,需要結構化輸入進整個網絡結構裏。
所以有什麽資源,大家就會依賴什麽路徑,對于我們這樣的公司來說,我們看到更多的是網絡結構層帶來了非常大的紅利。從 Transformer 出現,到前面幾十年,大家對于通用人工智能的追求,都避不開網絡結構這個環節,這一層獲得的收益和待解決的問題更多。
宿文對大模型的核心做出預測|圖片來源:極客公園
二、互聯網或者移動互聯網,給大家留下的思維慣性太強了,不管投資人、創業者、産業分析師,在大模型出現的第一天,很快就出現了一個分析框架,這個框架鏈條裏有基模、OS、Agent、應用 …… 但這些分類的基礎,都是從上個時代複刻下來的,大模型時代的鏈條會長什麽樣,我們都不知道,它大概率不會長成上個時代的樣子。
我們做的過程中發現,做 Infra 這一層、做基模、做應用,各個環節的基礎鏈條都不成熟,在不成熟的時候,大家如果去等待鏈條成熟,或者自己找一段去完善,這個商業通路很難跑通,因爲它很難把價值直接傳遞給用戶。對我們來說,我們有能力把這些鏈條打通到一起做,而不會很刻闆地停留在過去的技術思路裏。
三、在大模型出現第一天起,就很多人提超級應用,這同樣是互聯網時代留給我們的想象。移動互聯網時代,我們看到這種超級應用本身不産生内容,更多是做一個信息的嫁接平台或者一個中間平台,讓我們搜内容搜得越來越快,給我們推薦信息越來越準,讓我們交易越來越高效,但這個平台本身不會提供内容服務。
但是到了大模型時代,這些互聯網産品特性基本都消失了,大模型隻有一個核心功能:在底層幫大家生成内容。
這個競争力一定是最底層的,未來超級應用長什麽樣不知道,甚至不會存在。但是超級應用底層是對超級智能的支持,這一點是一定避不開的,這是最内核的競争力。
看起來我們是在做 AICoding,但其實我們是在這樣一個商業場景裏,去解決 AGI 自身的問題,我們朝着 AGI 一路狂奔,也是希望有更多小夥伴像我們一樣,大家向上卷,向核心技術卷,最後把這些技術沉澱在産品上,提供給我們的用戶。
謝謝大家。