斯坦福大學講席教授、馮 · 諾依曼理論獎獲得者:葉蔭宇
钛媒體特别專題策劃《數字思考者 50 人》:探訪中國 50 位獨具代表的數字化思考者。我們理解的 TechThinker ,涵蓋了中國數字化浪潮中的技術踐行者、政策制定者與投資決策者。在這場長達 10 年的乘風破浪中,我們每個人都在分享技術進步的果實,卻鮮有人知道結果背後的故事。我們期待通過《50 人》,還原中國數字化推進過程中的關鍵決策,同時也爲你呈現數字思考者們的管理與經營之道。
國際市場震蕩不定,供應鏈波動劇烈、芯片短缺、碳排限制 ...... 百年變局疊加世紀疫情,大環境的震蕩層層傳遞到企業生産制造中,當這些限制條件突然産生的時候,整個企業的生産運營如何應對?怎樣能夠在受到限制的情況下,仍然最大化利用産能去實現生産?
這時簡單依靠經驗 " 拍腦袋 " 決定顯然不再奏效,因爲人工經驗總是基于過去已經發生的,沒有辦法快速地應對不斷産生的新問題,也無法精确優化一個高度複雜與随機的大系統。
盡管在工業數字化的進程中,方式方法持續升級,但是常規的數字化系統要麽協同性不夠,要麽精準度較差,計算和決策效率低,一旦遇到變化就顯得非常脆弱,更不要說在多種突變因素之下快速制定優化方案,沒有辦法真正發揮數據的價值,而此類問題正是智能決策技術所擅長解決的。
小到一個需求的波動、一個生産場景下的急單插單,大到疫情、國際形勢這些黑天鵝事件,智能決策就是在大量的約束條件下,快速找到最優的解決方案,讓資源的使用效益最大化。比如訂單滿足率最大化、庫存成本最小化,或是運輸成本最小化等等。
随着數字化轉型進入深水區,外部經濟增長放緩,對于企業而言,如果不緊跟步伐做出轉型,那麽面臨的就不是賺不賺錢的問題,而是生與死的問題。越來越多的企業渴望通過引入智能決策,以直觀發現、分析、預警數據中所隐藏的問題,及時應對業務中的風險,向最優決策無限靠近。
智能決策的共識在倒逼中逐漸建立起來,但實踐道路比想象中艱難得多、複雜得多。
技術被寄予厚望,但技術也有能力邊界。随着 ChatGPT 大熱,很多人都開始暢想 AI 技術能在工業的複雜決策場景中發揮越來越重要的作用。
從上世紀 80 年代開始,葉蔭宇教授就一直專注在運籌優化領域的研究。2009 年曾獲得美國運籌與管理學會最高獎,馮 · 諾依曼理論獎,也是獲得此獎的首位華人學者。在他看來,精确的數學建模仍然是主流的方法,運籌學的誕生就是爲了解決問題,因爲有可解釋性、可控性," 有些企業管理者會特别關注決策結果的可解釋性。特别是在工業運用中,有些是多目标的,不是隻有一個目标函數,要權衡各種不同因素,權衡不同的利益,完全靠黑箱是會有問題的。"
不過,技術的使用并不是 " 非黑即白 " 的選擇題,數字化的商務決策中,一般要經曆建模、求解、決策多個流程,AI 的強項在于量化、需求管理、規律性分析,而決策中則需要平衡與優化一些高度複雜,約束互相制約的優化模型和運籌學模型。盲目的追求單一技術的 " 通用性 " 并不是最好的方式,"AI 也不會完全取代優化算法 ",将運籌學和 AI 深度融合,各取所長,才是更實際的做法。
比起短平快的 To C 企業 ,To B 企業接受考驗的鏈條更長、維度更多,技術之外,要解決的問題和場景更複雜。一方面既要深入行業,又要避免掉進勞動密集型的定制化陷阱。另一方面,像經營決策、計劃排産、資源調度等等,這些答案都掌握在行業 Know-How 手中。
技術與實踐短兵相接的地方不是一個接觸點,而是一個多方位的接觸體,既要向内招攬行業專家,歸納不同行業底層邏輯,平衡服務邊界與服務成本,又要向外坐在一起了解一個個具體的需求,向下紮根服務能力。
面對技術在業務面前 " 自證價值 " 的問題還要拿得出 " 真金白銀 " 的量化指标:在庫存上節約了多少錢,在訂單滿足率上提升了多少個百分點,産能利用率提升了多少,産能浪費降低了多少,碳排放指标合理利用了多少……
凡此種種,我們不難看到,智能決策技術落地的背後早已不是一個方向性的大問題,而是實踐過程中十個、百個、千個的小問題。此刻,唯有紮紮實實的苦功夫,才是真實有效的。
去年下半年,葉蔭宇教授開始了六年一次的學術假期,這次他把大部分時間放在了國内,走訪企業、在智能決策公司杉數科技指導算法研究、在大學授課。借此機會,钛媒體 APP 和葉蔭宇教授聊了聊運籌優化的應用發展與趨勢、AI 的影響和融合等話題,希望借由他多年的學術研究視角,以一個更理性的角度看待當下的熱點與實際問題。
從 AlphaGo 到 ChatGPT,深處是求解優化問題
钛媒體:您有關注目前大熱的 ChatGPT 嗎?
葉蔭宇:從我的角度來說, ChatGPT 在應用場景中還是屬于一種你來我往的形式,有人把它叫做 " 博弈 ",有人把它叫做 interaction(交互)。之前的 AlphaGo 的場景是下圍棋,也是你來我往的博弈過程。其實嚴格地說,瞄準這種場景的過程,在運籌學中很早就有模型,例如常見的 " 馬爾可夫決策過程 "(Markov Decision Process),就是刻畫如何在不同情況下,采取最優的行動(action)。
最近又出了一個 Markov Decision Process with generation(生成式馬爾可夫決策),generative 有兩個含義,一個含義就是更多的案例,更多的語種,用 ChatGPT 來說就是更多的文本出現了。可以采索的 action 可以不斷地創造新的答案,新的回答。ChatGPT 将大語言模型和強化學習有機的結合起來,使得我們可以對語言模型的輸出質量進行有效評價,這樣的獎懲反饋機制可以使得 ChatGPT 不斷進步,創造出更好的文章。而本質上,強化學習也是一個基于馬爾可夫決策過程的多階段複雜優化問題。它将機器學習和馬爾可夫決策過程融合起來,自動地學習馬爾可夫決策過程中的獎勵函數和狀态轉移過程。
钛媒體:也就是說,不管是 AlphaGo 還是 ChatGPT,最終都可以追溯到求解優化問題。
葉蔭宇:所有這些模型都是先要搭建一個框架,多少層,多少個函數源,是什麽架構等等,最後架構出來。AlphaGo 和 ChatGPT 某種程度上可以看作數據,算力與算法在工程上的完美結合與實踐。在這個過程中,每個部分都發揮了極其重要的作用。毫無疑問,算法是其非常核心的重要環節。
钛媒體:之前看過您一個發言,講到了當年選擇專業的時候,也是 AI 和運籌學做了一些權衡的,後來還是選擇了運籌學。
葉蔭宇:對,我 1982 年去美國的時候,AI 也是非常火熱的時候,當時我還參加了一個叫做 " 構造一個專家系統 "(Experts System),就是建一個好的方法,希望把所有專家的東西整合起來,形成一個統一的回答、統一的意見。
但是當時有兩個瓶頸,第一個是數據不大,當時沒有網絡,大家隻能在報紙上搜集東西,太慢了,沒有很大的數據來訓練那個專家系統;第二個就是哪怕數據大了以後,算力跟不上,就不可能把模型訓練得很好。
後來我就改做運籌學,搞算法,在某種意義上也是因爲那個方向當時遇到了瓶頸,轉而去搞底層算法構造、底層算法設計。
不要盲目 AI 化,要和優化算法融合使用
钛媒體:我們和一些做大模型研究的人交流過,他們說原來很多算法随着參數、數據的增加,曲線會有平緩的趨勢,但現在在大模型下,隻要往裏面灌更多數據,加更多參數,曲線還是在非常陡峭地在增長。所以我也想聽一聽您的意見,人工智能這套打法,将來對運籌學的理論和實踐會有什麽影響?
葉蔭宇:運籌學和 ChatGPT 能做事情還是有一些區别的。ChatGPT 包羅萬象,什麽問題都能給你輸出一個看似說得過去的回答,但是在專業性很強的問題上,比如超大規模複雜系統的快速求解,它肯定是做不了的。而且 ChatGPT 目前還很難自主的進行數學建模,比如爲一個大規模複雜問題,準确的收集相關的數據,分析約束,自動進行建模。打個比方,某種程度上,他更像是一個全科醫生,各種病都能看的,有些問題看得還不錯。運籌學,以及求解器,像是一個專科醫生,在某些特别複雜的專業問題上,造詣會更高深一些。
運籌學有時候也有一些類似做法,比如窮舉法。比如說有一個優化問題,現在算力這麽高、這麽強,把所有解都求出來,然後找一個最好的。但是這樣的話比較暴力。
目前像 ChatGPT 這種,畢竟有時間讓它訓練,哪怕訓練一個月也可以等得起,就算是出下一代的 GPT 也可以。但是有些實際問題是等不起的,比如說現在杉數科技搞了一個南方電網的現貨市場的調度問題,這個調度過程中狀況變化太快,理想狀态是最好是每秒鍾都能重新計算,我們把它叫做 online optimization(在線優化)。美國電力日内市場的計算間隔爲 5 分鍾,但國内日内市場更爲複雜,當前的計算間隔爲十五分鍾,計算未來一小時(以五分鍾爲顆粒度)的機組調度問題。時間顆粒度的細化大幅度提高了調度模型的複雜程度,同時要求算法的求解能力也需要提升。
再就是從人類的追求來說,暴力法總是太粗暴了,目前的做法确實可解釋性也是個大問題,本來 AI 就是要把算法搞得更精細,能夠節省成本,用最少的時間,最小的案例辦更多的事,這也是爲什麽當時在美國後來對算法比較情有獨鍾的原因。
另外,我覺得 AI 也不完全是靠暴力的。AI 的底層設計中一定是有方法的,不然爲什麽說國内有些同樣的産品可能訓練不出來,不然它也可以暴力緻勝。所以這點上講 ChatGPT 肯定不是簡單的暴力方法,必然有更好的技術,比如說在底層設計中運用了最好的優化算法。實際上國内要趕上去,不光是模型、架構、數據要比它全,也要把算法設計、底層訓練搞得更精細,更有效。
钛媒體:基于大模型的人工智能,其實是一個算法的黑箱子,很難追溯内在的邏輯。在整個求解器的模型裏,現在存在不存在這樣的黑箱子問題?
葉蔭宇:優化裏确實也有黑箱問題。比如有一類問題我們連建模函數的形式都沒有,需要用到優化的 zero order method(零階算法)來進行求解。這類問題的應用場景越來越多了。比如說石油行業的鑽井問題,由于看不到底下的石油分布在什麽地方,因此在什麽地方鑽井,在什麽地方注水,這些就完全沒有表達式,隻能觀測結果,隻有 input(輸入)和 output(輸出)。
又比如說工業界,當時我們做優化,結果鋼鐵行業突然來了一個碳排放,這個環境因素怎麽表達成一個解析式放到優化目标裏呢?此外還有一些社會問題,政策場景,甚至包括直播帶貨,這個模型有解析式嗎?有公式嗎?要優化什麽東西?隻能通過做了這個事以後得到,是 a 就有這個結果,是 b 就有那個結果,在某種意義上,這些都是屬于一種黑箱優化問題。
以前我們認爲要用優化求解器必須要有一個所謂的特定目标函數,而且目标要有一定的表達式,約束也要用數學公式來表達。現在要跳出這個圈子了,就是要對付黑箱子。另外黑箱子問題的背後還是有一個規則,有一個好和壞的區别,雖然可能數學性質不好,甚至導數不存在,但是隻要兩個東西能夠比較誰好誰壞,就可以做優化。
钛媒體:黑箱會不會導緻決策失控進而帶來風險?
葉蔭宇:雖然模型是一個黑箱模型,但是解必須要有可解釋性,這是我認爲最重要的問題。而且,要能夠控制。
我們現在特别強調問題的魯棒性,黑箱模型的決策一定要有魯棒性,不能讓它肆意妄爲,通過這樣的結果保證風險可控。我自己認爲這要通過決策模型間的調節,把魯棒性加上去,把風險函數加上去,這樣盡管黑箱,還是可以兜底的。
钛媒體:ChatGPT 出來後,有些人就在預測說 AI 很快就會有自主意識。
葉蔭宇:我倒不覺得用 ChatGPT 做決策會帶來失控,應該還是可控的。AI 最終還是人在它的脖子上拴了一個繩子,你怎麽引導,它就會怎樣。包括黑箱這些東西,也可以通過調整參數讓它的回答變成可控的,不是不可解釋的。
我現在倒是擔心另外一點,就是如果我們這個社會普遍都來用這種 ChatGPT,會帶來單一化的風險。如果大家都用這個做作業的話,ChatGPT 就是唯一标準,這個社會就不那麽多姿多彩了,真正這個社會要能夠開放,還是要多樣化,還是要有一些個性化,不同的聲音、不同的創新。
钛媒體:您提的這個也是我有點擔心的問題,現在大家如果都 AI 化,就有點像當年做高頻交易的狀态,都用同樣的算法,會在一個時刻形成刺激振蕩,變得非常可怕。
葉蔭宇:對,在某些特定環境下,可能要這樣,但是對一個社會來說,并不希望都是一個面孔,都是一種聲音。所以在這個意義上,我覺得反而是另外一種風險。
另外,我覺得 AI 還不能完全取代優化算法,優化算法還是有一定的規律,有一定的機理的,而且把它的思路放進去,有些企業高層是能夠理解的。現在有些企業高層還是覺得 AI 不可信,質疑是怎麽出來的?下一次出來會不會又不一樣?或者出來的話,爲什麽這個比那個好?特别是在工業運用中,有些東西是多目标的,不是隻有一個目标函數的,要權衡各種不同因素,權衡不同的利益,所以完全靠黑箱還是有問題的。
求解器要向多樣化發展
钛媒體:您在很早的發言裏提到過行業定制版的 AI,在您看來,行業定制版 AI 落地的難度有多大?瓶頸在哪裏?
葉蔭宇:我跟葛冬冬、王子卓(兩位均爲杉數科技聯合創始人)他們也提過,一定要做有定制化的求解器。我們以前搞運籌學,總是希望有一個算法能夠解所有問題,後來發現,追求能夠一個算法解所有的問題是很好,但卻忽視了很多問題本身是有特點、有特征的。我們要根據問題的特征,選擇不同的方法,有時用内點法,有時用單純形法,有時用原始型的方法,有時用對偶的方法……
最近我們就在做這個試驗,針對不同問題,得出在那個特征下的最好的工具,也是通過機器學習的方式,我們把它叫 ML To Optimize(機器學習驅動的優化方法)。
以前我們在學術上認爲搞特定問題的算法設計是不好的,但是你仔細想想怎麽能夠把問題解決,哪怕用不同武藝對付不同的敵人,這在某種意義上也是說得過去的,這就是定制化的問題,而且這個優化,你可以看到采取不同方法,速度可以提高十倍、一百倍。
钛媒體:您覺得這個行業特點怎麽體現出來呢?在将來的這套智能決策裏,比如說行業 know how 怎麽體現出來呢?
葉蔭宇:行業中的 know how 要結合領域知識,我現在感覺有個問題是國内的人才培養上,搞算法的和搞業務的是分開的。從教育層面要培養這樣一種人,對算法也懂,但是不一定要非常精,但是業務又很熟,這個中間的橋梁作用非常重要。
另外我覺得從我們搞求解器、搞算法的這些人,也需要主動走出去,了解某一個行業,了解他們的痛點,求解器作爲最底層的軟件,需要在外面做很多包裝,需要很多系統,很多軟件,這樣才能提升它的應用效率。
钛媒體:做定制化的話,投入和産出以及未來規模方面的問題如何平衡?
葉蔭宇:比如說做金融決策的 FICO Xpress(美國一家分析軟件公司),就是把優化作爲核心部分,然後在核心上面構造了更多層的應用,那樣就大多了,哪怕隻是用到金融行業裏,用戶已經足夠多了,結果它就更容易吸引顧客,更容易賣錢,市值也高。
钛媒體:以前求解器相對小衆,現在華爲、阿裏這些大廠都參與了進來。
葉蔭宇:光有求解器的話,這個量很小的,它是太底層的路線,大投入的話我覺得會浪費一部分資源,搞什麽東西不能太多,大概三五家就可以了,搞得太多的話就惡性競争了。
可以去做,但是不一定要做求解器,比如專門做一些能源方面的、供應鏈方面的或者通信方面的,這就是我剛才說的個性化,我們最缺的是這樣的東西。
在美國,做求解器的主要是三家:Fico、Gurobi、IBM Cplex。谷歌雖然也有一些搞求解器的人,大規模線性規劃搞得還不錯。但是他們更注重研究這個東西如何加速 DeepMind 或者底層的一些東西,微軟的那個部門直接叫 Quantum Computing,跟我也保持交流,對量子計算和其它一些業務相關的算法更強調一些。
钛媒體:優化算法技術有很多成熟的應用場景,例如金融、供應鏈、物流等等,這幾年有什麽新的應用場景被發現?比如前面提到的能源類
葉蔭宇:能源不是新應用場景,很多年前,國内的南方電網、國家電網,都有很大的 OR(Operations Research,運籌優化)團隊,專門做優化的,并且能力不錯。
但是新能源如何接入,這就是一個新問題。比如怎麽更加安全地把一些新能源融合到供電體系當中。比如風能光能容納進來如何考慮它的随機性,電動車的充電樁怎麽布局。
還有就是在醫療治病方面,包括癌症治療決策,醫療資源規劃等方方面面,優化都用上去了。再一個就是前些年比較火的自動駕駛,也會用到很多優化問題,就是最優控制的問題。
钛媒體:在國内外,運籌優化的應用場景有什麽樣的不同嗎?
葉蔭宇:在發展趨勢上,其實沒有很大不同。決策環境中比較有規則的,規則比較清楚的,标準比較統一的,運籌優化用得都會比較好一些。
但是我個人認爲運籌優化反而在國内有更好的發展空間,你像我剛才說的自動駕駛能不能上道,可能在美國要真弄個十年還弄不下來,但是在我們國内可能很快可以達到一個共識,運籌優化也是同樣道理。
不過,國内也要讓那些企業有更多的自由空間和環境,不要把他們的手腳綁定了,讓他們能夠更有信心一些。
钛媒體:目前優化算法、求解器産品的落地,都還是需要極高的智力資源投入,這也限制了這個技術在産業的滲透速度。您覺得這個問題的答案是什麽?
葉蔭宇:這個發展滲透需要環境,需要生态構造慢慢培養,人家也在看我們目前正在做的這個事情,到底能不能起來。
钛媒體:這些應用的企業有什麽共同特點嗎?
葉蔭宇:都是頭部企業或者腰部以上企業,規模比較大。特點有三個,一是數據完備,沒有數據,這個事情是做不成的;二是意識完備,領導重視,也有專門的部門或者人力;三是體量大,意味着它有足夠資金投入,願意花錢做這個事情。
钛媒體:在應用智能化技術來幫助決策方面,您對國内企業的建議是什麽?
葉蔭宇:還是要一步步地走,像美國那樣,從一些比較确定的、可解釋的決策模型、決策算法,主要是運籌優化方面的來做起,做得更高了以後再看 AI。因爲美國也在嘗試 AI 怎麽用,現在也比較彷徨,主要是它不能保證一定的魯棒性,在一些像航空等對安全性要求很高的領域,要是出一點錯的話,都是不得了的,是要用傳統的工具。
钛媒體:剛才也談到了學術的起起伏伏,AI 在美國的确做了很多年的學術冷闆凳,它一直不是顯學,這幾年因爲各種原因,算力、數據等等,一下子就起來了。您怎麽看待美國這麽年學術的起起伏伏,而且現在也在談基礎創新,您覺得坐冷闆凳的能力是不是才是這種基礎創新最需要的東西?
葉蔭宇:我覺得 AI 最近的發展不能說是 AI 自己憑空而起,而是得益于其他學科的不斷發展,有很多綜合因素需要考量,比如很重要的兩點,一是硬件方面,計算機越來越快;另一個是算法的改進,比如大規模線性與非線性優化的算法不斷提升。
所以在這個意義上确實要耐得住寂寞,隻要有興趣你就去做,盡管當時不是在風口上,我覺得這也是好的。有時候搞研究不要追風,政策也不一定說因爲這個東西很火,就趕緊把資源都放到那個地方去。各個學科像是一個網一樣,不均衡發展的話,還是會被拖後腿。(本文首發钛媒體 APP,作者|韓敬娴)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App