什麽樣的 AI,能通過自家公司的程序員面試?
剛剛出爐的國産大模型「天工」做到了,黑馬,絕對是黑馬。
其開發商昆侖萬維的 CEO 方漢在與量子位合作的首發直播中透露:
對天工模拟過校招算法工程師的第一輪面試,可以很流暢地通過。
△天工回答算法題示例
如果你開始好奇天工是什麽,不如請先它來一段自我介紹:
除了在編程語言上經受住面試級别的考驗之外,在自然語言上天工還特别修煉過中文。
天工團隊投入大量資源攻克了中文語料庫的質量瓶頸 , 從數十萬億的數據中清洗、篩選出了3 萬億個單詞數據用于訓練大模型。
開發團隊認爲,優質的中文語料庫讓「天工」作爲國産 AI, 在" 更懂中文 "這件事上具備天然的優勢,更符合本土用戶的使用偏好。
天工自己倒是對此挺謙虛的,看來不僅學會了中文,還學會了謙虛的傳統美德。
那麽天工的中文水平到底如何,在首發直播中就進行了現場實時演示,不是放錄像,是當場把問題敲進去那種。
大模型作爲新一代生産力工具,首先要考察的就是能不能在工作場景中幫到大家。
方漢表示天工在文本生成和文案撰寫上的表現令他驚喜,并現場展示了三個場景。
首先是很多人都頭疼的寫周報,可以讓天工直接搭一個框架出來,避免疏漏。
對于直接生成可用文本方面,選擇的問題是寫一個電商運營的招聘 JD。
天工給出結果後,方漢評價 " 沒有一到兩年的 HR 工作經驗是很難寫這麽完整的 "。
接下來要考驗的是天工的創意能力,畢竟新晉獨角獸 Jasper.ai 就是靠 AI 創意營銷起家,AI 有了這方面能力商業化就有了保障。
直播中由于時間關系,隻展示了編寫二次元 mmorpg 遊戲廣告文案一個例子。
不過方漢補充道 " 由于每個人輸入的條件和上下文不同,生成的結果也會千差萬别,對廣告文案工作非常有幫助。"
直播過程中,除了官方準備的問題,網友也在彈幕中提出各種刁鑽問題。
比如腦筋急轉彎問題,天工也沒有被難住,表現出一定邏輯能力。
還有一些靈魂拷問,天工給出的回答也都符合道德和人類價值觀。
更有意思的是,量子位 CEO 孟鴻在現場也向天工提出了一個尖銳的問題:
我是一個自媒體創作者,現在有個大公司請我評測他們的産品,但是這個産品客觀上有亮點也有不足,我應該怎麽做才能既不把自己的路走窄了,又堅守自己的節操?
從結果上來看,天工确實是做到了 " 既要又要 ",是一個" 三觀比較正 "的 AI 了。
天工,是如何煉成的?
在看過天工的能力之後,想必很多朋友們都會好奇,它到底是如何煉成的。
對此,昆侖萬維也毫不掩飾地将背後的 " 秘笈 " 給亮了出來。
首先便是 " 大力出奇迹 " 的大模型,而且還是雙千億參數的那種:
千億預訓練基座模型
千億 RLHF 模型
千億預訓練基座模型,是指至少有一個千億參數的深度學習模型,可以遊刃有餘地應對語言生成、文本分類、機器翻譯等自然語言處理任務。
千億 RLHF 模型,是指基于 "Reinforcement Learning with Human Feedback(RLHF)" 強化學習方法的一種模型。
RLHF 模型可以視爲一種特殊的交互式機器學習框架,可以通過人類的反饋來優化模型的性能,由此可以更好地處理不确定性和稀疏性問題。
而在二者的 " 強強聯手 " 之下,大模型的優勢便凸顯了出來。
例如預訓練基座模型本身便具有很強的表征能力和泛化能力,加上 RLHF 模型可以吸收人類反饋的能力,讓整體模型的性能更上一層樓。
不僅如此,在決策過程的可解釋性、模型的魯棒性和穩定性,以及處理更多的學習任務方面,這種方式的操作也起到了一定提高作用。
而除了模型層之外,在算法層方面,天工也有自己的獨到之處。
衆所周知,目前市面上許多類 ChatGPT 産品的背後,所采用的基本上都是 Transformer 架構的自然語言處理模型。
簡單來說,它包括多層 Transformer 編碼器和解碼器,自注意力機制,預訓練和微調等技術。
而天工團隊首次在此基礎之上,引入了蒙特卡洛搜索樹算法,名震一時的 AlphaGo 背後便是結合了這一算法。
其一般分爲選擇、擴展、模拟和回溯四個過程,核心思想總結來說就是把資源放在更值得搜索的分枝上。
天工引入蒙特卡洛搜索樹算法主要應用在了對話管理這個任務中,更能理解在對話中何時轉換話題,并且能懂得如何詢問更多信息等。
這也就是天工擁有超強記憶能力、能夠支持 1 萬字以上文本對話、20 輪交互,而且過程可以非常自然的原因了。
但除了模型和算法之外,天工的 " 利刃 " 還不僅于此。
中國最大 GPU 集群加持
數據和算力,亦是這輪 ChatGPT、大模型之戰的關鍵所在。
在數據方面,天工所采用的策略是" 開源的力量 "——凝聚了百位開源社區 AI 科學家。
也正因如此,天工從數十萬億的數據中,最終清洗、篩選出了近 3 萬億單詞的數據。
要知道,ChatGPT 在訓練過程中的單詞數據量也僅 3 千億;這也就是爲何在使用天工過程中,會感覺更加流暢、理解力更強的原因了。
那麽面對如此龐大的數據訓練量,接踵而至的老大難問題,便是算力了。
對此,昆侖萬維方漢在直播過程中非常自信地表示:
天工的算力是基于中國最大的 GPU 集群之一。
這也就是 ChatGPT 在支持十輪對話的時候,天工能夠達到 20 多輪的原因所在了。
但若是縱覽昆侖萬維在技術上的布局,就不難發現,天工的誕生并非是一蹴而就的事情。
因爲早在 2020 年昆侖萬維便已然入局,累計投入了已達數億元人民币、數百人參與研發。
并且在 2022 年發布 AIGC 全系列算法模型的同時,就開源了百億級參數模型,積累了廣泛的開發者好評與社區共創。
而至于爲何選擇在這個時間節點發布天工,方漢表示:
是綜合考慮了技術水平和用戶需求後做出的選擇。
我們的大模型在今年四月上旬取得了技術上的較大突破,國内對類 ChatGPT 産品的關注度也達到了空前的關注,用戶的習慣已經得到了初步的培養。
因此在這個時間節點推出,便可以很好地滿足用戶的現實需求。
據了解,目前昆侖萬維集團的各個業務均已經在向 AI 化轉變,内部的遊戲設計、策劃、内容運營、編輯、公關策劃等工種,是天工最早參與内測的 " 用戶 "。
在未來,昆侖萬維也有計劃向 B 端用戶開放 API 接口。
總而言之,有大數據、有大算力、有大模型,昆侖萬維在國産 ChatGPT 之戰上的前行道路,是值得期待一波了。