機器之心報道
編輯:楊德澤
在對談中,俞舟不像其他創業者那樣大談 ChatGPT 對于行業的巨大影響力,她更加關注産品、更加關注使用産品的人,她不相信 AI 可以替代人類,而是幫助人類提升技能。
在俞舟開始她的對話系統創業的時候,大模型的熱潮還沒有到來,她隻是認準了要做一個好産品。在公衆都對于大模型的能力驚歎不已的時候,俞舟認爲,關鍵是産品和客戶服務。
俞舟本科畢業于浙江大學竺可桢學院,在拿下了計算機和語言學雙學位後赴美攻讀 PhD,俞舟認爲社交語言在人的日常交往中占了極大的比例,如果要打造一台能夠與人進行無障礙交流的對話系統,那麽社交語言的研究一定是不可避免的。
在俞舟身上,有兩個特點十分突出:" 倔強 " 和對于 AI 研究的堅韌,在卡内基梅隆大學讀博士期間,曾二度更換導師,還因此差點學費中斷,最終靠實習找來經費才得以完成學業。
2017 年,俞舟博士畢業進入 UC Davis 執教,研究方向是多模态對話系統,次年,俞舟入選福布斯 U30 in Science,2021 年又再次進入哥倫比亞大學,職業生涯可以說是一片大好,如今她的身上又多了一層身份 —— 創業者(Articulate.AI 創始人)。
當年執着選擇對話系統的俞舟肯定沒有想到今天 ChatGPT 的大火。過去 6 個月,ChatGPT 完成了破圈、增長、大衆化,如今它的用戶總量已經超過 5 億。"iPhone 時刻 "、" 所有行業都值得用 GPT 重新做一遍 ",這些宣言似乎都預示着 AI 的好時代到來了,而問題的另一面在于,我們并不十分清晰地知道 GPT 是什麽,也不知道 ChatGPT 能幹什麽。一個對技術有着深刻了解的人轉向創業,她的意見或許是一個有效參考。
按照俞舟的想法,ChatGPT 更像是一種産品主義的成功。
在 AI 學術界,ChatGPT 的技術突破似乎并沒有想象中那麽大。OpenAI 的成功更大程度上在于産品而非技術,這是一個利用産品向全球播報技術進步的故事。俞舟的産品想象則更爲智能化,"Imagine a 24/7 AI coach who trains you for new skills and supports your work and life." 這是俞舟寫在商業計劃書中的産品願景。
無可否認,ChatGPT 的成功促進了當下 AI 大爆炸的繁榮,随之而來的是資本、技術、人才的投入,也包括俞舟的公司。在對談中,俞舟不像其他創業者那樣大談 ChatGPT 對于行業的巨大影響力,她更加關注産品、更加關注使用産品的人,她不相信 AI 可以替代人類,而是幫助人類提升技能。她曾經開發的雅思學習産品已經擁有了 5000 + 用戶。
在當下這樣的一個大模型遍地的時刻,它可能人類創造生産力的一次變革,抑或是一個資本泡沫。在這個機會和危險并存的時刻,俞舟既是技術的研究者,也是創業者,對于回答 "AI 将向何處去 " 提供了一個樣本。
俞舟
以下是機器之心和俞舟的對話:
關于 ChatGPT 和對話系統
機器之心:作爲行業内人,你是什麽時候開始感受到大模型帶來的沖擊力?當時的觀感是什麽?
俞舟:其實大模型相關的研究在很早之前就出現了。這裏主要的原因是量變引起了質變,當模型參數帶到一定程度的時候,它确實有一些非常好的表現。在公衆了解之前,我們已經做了很多這樣的工作,如果關注我們的研究成果,就會看到在疫情之前我們就在做一相關的工作了,就是說如何去預訓練對話模型才可以得到更好的表現。
隻不過 GPT 一類的大模型有一個特點就是:面向公衆,具有非常強大的輿論功能。在此之前我們做的工作很多都是基于一些開源模型,但是這些模型普通人是用不了的,因爲你沒有硬件設施。Open AI 推出 ChatGPT 以後所有人都可以用,相當于做了非常大的推廣。然後大家都突然意識到這個東西好像挺有點意思,說不定可以在自己領域應用一下。
機器之心:它和 AlphaGo 當年的影響相比呢,哪個觀感更強烈一些?這次 AI 浪潮又出現了哪些新機遇?
俞舟:首先這次大模型浪潮影響的人更多一些,AlphaGO 它隻是一個應用,而且它隻做了下圍棋這一件事情。現在大模型你可以跟他聊各種各樣的東西,他可以解決不同的問題,但是雖然它的精确度也有各種各樣的問題等等,但它是更融入到人們的日常生活中的,所以它會有更大的影響力。
在學術界外我們确實也看到了一些影響力,有意思的是很多相關領域的人都更願意跟我們合作,認爲我們這是一個突破,也就是說給大家帶來了一些新的機遇。
機器之心:在此之前,其實國内外一直都有很多人在做 AI 方面的研究和創業,爲什麽等到 ChatGPT 出來之後大家才恍然大悟,大家原來都忽略了什麽?或者說不敢想?
俞舟:其實 AI 一直在進步,特别是在 17 年前後 Transformer 出來了以後,很多東西它其實做得非常好。OpenAI 隻是把它産品化之後放開了,讓每個人都可以用,大家瞬間意識到這個東西已經做得這麽好了。
比如機器翻譯,谷歌在很早之前就做的挺不錯的了,但是公衆對其不夠了解,突然 GPT 就破圈了,然後所有人都知道了這件事情,這也打開了很多可能性,就相當于做了一個百億公關,讓大家重新意識到了 AI 的可能性,這樣子也讓大家對它重新建立起了一些信心。
機器之心:對于你們的研究産生了怎樣的影響,您最近的研究方向有哪些方面的進展?
俞舟:首先它提升了整個的自然語言包括文字生成、圖片生成、圖片理解、視頻理解等各種各樣的能力,整體觀感上帶來了一些提升。
我們組主要還是在對話系統,怎麽樣更好的用更少的資源,比如更少的數據、更爲 efficient 的模型,來完成不同的對話的任務。然後我們也會做很多一直在做的博弈和談判研究,我們稱之爲影響對話系統(Social influence dialog system)。
俞舟和圖靈獎得主 Raj Reddy 在 CMU speech 50 years 的合照
注:Raj 是最早一批人工智能的開拓者,也是李開複、洪小文等 AI 領軍人物的導師
機器之心:從理解人類意圖、做出決策方面來看, 它的表現似乎比 GPT 更爲智能?
俞舟:其實任務有一些不同,我們是做一個對話系統,GPT 是通用系統。我們是爲對話訓練的系統,在這個系統裏面不僅包含對話,還包括決策,是一個非常大的強化學習系統,比如有一部分是如何去理解用戶意圖,然後據此選擇更好的策略去優化他的博弈行動中的行動。
之前有很多對話系統,能夠做到的隻是交換信息(exchange information)。比如說有一個機器是用來做訂票訂酒店的,人知道這個機器隻能做這件事情,然後人和機器通過交互式對話的方式之來交換信息,然後完成一個任務。但是 social influence dialog system 和這些都不同,除了信息交換還有影響人的行爲和想法,它多了一層更難的部分。如果要做到這些事情的話,機器就需具有更好的理解人類對話的能力,因爲人類的語言在不同語境之下代表的意思是不一樣的。
比如我跟我的孩子說,You have to behave yourself,意思是你要乖一點,如果我跟我的博士生或者員工說 You have to behave yourself 代表的完全是不同的意思,孩子聽到這句可能會不耐煩,如果是員工可能就會覺得肯定是老闆特别不滿意我做的事兒。其核心是在不同的語境同一個人對不同人說的同一句話,也會代表不同的意義,需要更全面的去理解。特别是在這一種比較複雜的任務中,它是需要有更好的理解才能做出準确的應對。
OpenAI 做的最好的是産品
機器之心:從技術實現的角度來說, 大模型主要是哪方面的技術的進步?
俞舟:其實說實在的,比如 GPT3.5,它首要的進展是把這個模型的參數數量變大了,其次他們有很多比較好的訓練數據,通過人工收集了這些數據,數據是它的一個壁壘。其次它也用我們稱之爲它稱之爲人類反饋強化學習(RLHF)的東西把很好的跟數據結合在一起,然後做一些很不錯的功能 。
但是它的基礎,比如架構都是之前以 Tansformer 爲基礎的模型,我覺得他最重要的創新就是說他自己 Houst 這些模型,可以通過網頁的方式來直接用這個模型,再比如說 Instruct running 等等也不是新的,之前都有不同的人做過。
機器之心:你剛才提到 Transformer 的作用,是不是意味着谷歌已經把一些偉大的創新做完了,OpenAI 隻是在這個基礎上向前推進?
俞舟:Transformer 隻是一個基礎架構,OpenAI 還是做了很多技術上的貢獻。但是我覺得最重要的一點是 OpenAI 認真地把它作爲這個是一個産品來做的,它做了很好的工程創新,比如說 ChatGPT 的回應速度是非常快的,這麽多人同時做他也都不會有問題。讓所有人可以來用它,我覺得這個是他非常重要的貢獻。
機器之心:OpenAI 更像一個偉大的産品經理?
俞舟:對。
創業:其實産品到最後也是一種服務
機器之心:你們在産品化上做了哪些努力,以及爲什麽選擇創業?
俞舟:現在我們自己是有一個公司,主打的産品是一個對話系統的模型,與其他模型不同的是,我們的産品不是簡單的指令問答系統,我們可以做一些類似角色扮演的職業培訓。
通過這種交互式的方式,通過即時反饋,對話系統可以針對不同人群給出個人化的反饋。比如說做企業培訓,如何增強業務人員的營銷能力,我們通過角色扮演的的方式圍繞一個産品展開對話,從而更靈活、更快捷獲得一些談判和博弈的社交能力。
我們想做的是職業培訓,在一個大家都覺得這 AI 是要代替人類的時刻,其實 AI 也可以成爲一個工具,讓人可以更容易的學習一些新的技能,應用到一些高級技能的獲取之中,可以讓你的學習更加高效。
機器之心:您當時是如何選擇培訓這麽一個細分的行業?主要基于哪些方面的考慮?
俞舟:在一年半之前我們的公司就成立了,但是當時語言模型技術并不是很成熟,最近這段時間得到快速地發展。最開始我們是做英語培訓,通過對話的方式來訓練應試英語,比如雅思,用戶可以和對話系統自由對話,然後你跟他對話了以後它也會給你評估打分,告訴你說你語法上面有沒有哪些錯誤的。在這個過程中我們首先有對話的練習,然後反饋。我們在銷售這個英語學習産品的時候發現,在現在經濟環境下,各個公司都想降本增效,更注重如何增加營收。于是我們發現,最直接幫助這些企業的還是培訓他們的銷售人員,讓培訓時間變短,讓成單率變高,從而帶來更多的營收,這個是解決他們的核心痛點的事兒。然後結合我們之前做過的角色扮演的工作,我們可以讓機器人扮演銷售人員會遇到的不同類型和職業級别的客戶來訓練銷售人員。同時機器人也會給出合理的評價和提高的建議。從另一個角度來說,銷售培訓正好很好的結合了我們之前的角色扮演、問答和談判的研究工作。大語言模型讓這些研究問題有了一個突破,正好是可以做相關産品的時候。
機器之心:對于普通人而言,爲什麽談判和博弈這方面是重要的?技術和場景的契合點在哪?
俞舟:比如學生群體,當他拿到了一個工作的 offer,這個時候就需要去跟公司談薪資,很多人是之前沒有做過經過談判的訓練,他很容易做的不好,而談判的結果對你的人生有非常大的影響力。我見過很多女孩子害怕談判,心理壓力大,就會回避談判,接受比較低的薪資,其實對職業發展是很不好的。我們看到的痛點就是如何去教大衆如何去做正确的談判。因爲生活中充滿了談判,小到你要勸說讓小孩每天刷牙,大到國家貿易合同的簽訂,都是談判。我們說的談判不是争執,而是通過共同來達成一個雙赢局面。
在中國,我發現有很多人完全沒有接受過任何談判訓練,其實這是一個通識教育,是非常重要的一個日常技能。在美國也是一樣,現在隻有 MBA 和律師專業是有這個課程的,其他系都是沒有的,我覺得這個能力是需要慢慢在全球被普及的。
機器之心:和幾位合夥人是怎麽認識的,是什麽讓你們決定做這麽一家公司?
俞舟:我的合夥人其實都是科研上的夥伴,比如我的 CTO,他是以前跟我讀過碩士,在這之前他已經在業界工作過很久,有很多業界積累。我們一起合作過很多。
我所在的環境是鼓勵做新意的而且實用的工作。我做東西并不是爲了發論文的。發論文是一個副産品。我的追求一直是一個有影響力的技術創新,要做對整個學術界和産業界都有影響的工作。發論文,給演講都是幫助我們傳播這個技術創新的手段。讓更多的人了解我們這個創新,然後以我們的創新爲基礎上做更多的創新或者應用。當我覺得這個創新在實用度上已經有一個飛躍的時候,就是落地的時機了。
機器之心:目前有尋找投資嗎?你用來打動對方的最有說服力的話是什麽?
俞舟:最近我們也在接觸不同的投資人,計劃是能夠融 2-5 個 million。
首先,我們看到企業培訓的這一個需求很大,用我們對話模型是實際可以給它産生利益的,比如說銷售培訓,就是說你用更短的時間更有效的去培訓銷售,能夠得到更好産出,這樣子的話它可以幫你拿到更多訂單,是有非常實際回報的。
其次,我們之所以用以大模型爲基礎的東西來做,就是因爲它不需要做太多的調整,就可以降低成本,同時使用大模型的對話完成度也會更高一些。
機器之心:所以創業在美國的大學裏面是一種很普遍的現象嗎?在美國創業和國内有什麽不同?
俞舟:對,我有挺多同事也在創業。在學校裏本身就是一個非常好的環境,大家都對很感興趣。
我覺得美國一直是創業氛圍非常好,中國是近 10 年才興起創業,在美國則有很悠久的創業傳統,比如說我們拿到的 NSF 的一個 SBIR 基金,它支持中小型企業已經很多年了。在美國一直是政府和民間都非常支持創業的,它有一個非常深厚的傳統。比如,父母聽說你要去創業,就不會覺得說你很奇怪爲什麽不做一個穩定的工作,在社會上的看來創業是一個非常好的事情。包括矽谷、紐約等,都是有比較好的創業氛圍,有各種各樣配套的活動,可以讓你認識其他想要一起創業的朋友,它具備一個非常好的圈子。
機器之心:對于公司的未來、規模、發展路徑有設想嗎?你想做一家怎樣的公司?
俞舟:我們最終的夢想是做一個培訓方面的私人教練,可以教你不同技能,可以跟你一起練習,跟你一起成長,就像一個老師 24 小時跟在你身邊,你想要學什麽他就可以教你什麽。另一方面,還可以根據你自己實際情況和個性推薦你更适合學的東西,以及哪些技能在你現在的生活、工作中是有一些缺失的,可以給出建議。這是我目前想做的。
當然我們會從企業培訓開始,因爲這個是最能看得到盈利的。然後我們會從博弈和說服擴充到其他領域,使其他技能也可以通過對話系統習得。我希望它不僅局限在職業領域,以後可能科學研究、興趣愛好中間的許多技能都可以通過對話系統習得。
機器之心:現在無論海内外,有很多大公司、創業公司和再創業公司,你們在這一波浪潮中的角色是什麽,你們的機會在哪裏?
俞舟:首先,在時代背景下,一定要抓住這個機遇,我們是非常幸運的,在有一個新的技術在日漸完善的過程中,可以依靠技術突破來去做一些之前沒有的産品,而且可以搶先占領市場。同樣地,因爲大家的關注,也讓更多的企業願意嘗試去嘗試我們的産品。
其次比如說在金融市場,對大模型的重視,也讓我們更容易融到一些錢去做我們想做的事情,讓我們有更多空間來發展我們的企業,也讓我們有更大的更多的認知去做一些比較鋪的比較開的東西,所以說我們覺得這些都是一些機遇了。
當然我們也必須要知道,AI 的熱點就說這個事情可能過了一陣子它就過去了,對個人的挑戰就在這個過程中,怎麽樣做好一個公司的長期發展,這是我們要面對的問題。短期計劃和長期計劃都是應該有一些調整,爲應對市場未知風險做一些準備。
機器之心:在 AI 領域創業,投入和創新哪個更重要,底層創新來自何處?
俞舟:我覺得底層創新包含底層的模型能力、自己的數據積累,這兩點是跟其他公司差異化的地方。此外,對行業的理解、業務的拓展等等,這些都是要通過不同的團隊來磨合,然後找到自己技術驅動的産品到底是什麽,其實做産品到最後也是做服務。
© THE END
轉載請聯系本公衆号獲得授權
投稿或尋求報道:[email protected]