黑馬入局！昆侖萬維版ChatGPT「天工」通過自家程序員面試，首發就敢現場演示

什麽樣的 AI，能通過自家公司的程序員面試？

剛剛出爐的國産大模型「天工」做到了，黑馬，絕對是黑馬。

其開發商昆侖萬維的 CEO 方漢在與量子位合作的首發直播中透露：

對天工模拟過校招算法工程師的第一輪面試，可以很流暢地通過。

△天工回答算法題示例

如果你開始好奇天工是什麽，不如請先它來一段自我介紹：

除了在編程語言上經受住面試級别的考驗之外，在自然語言上天工還特别修煉過中文。

天工團隊投入大量資源攻克了中文語料庫的質量瓶頸 , 從數十萬億的數據中清洗、篩選出了3 萬億個單詞數據用于訓練大模型。

開發團隊認爲，優質的中文語料庫讓「天工」作爲國産 AI, 在" 更懂中文 "這件事上具備天然的優勢，更符合本土用戶的使用偏好。

天工自己倒是對此挺謙虛的，看來不僅學會了中文，還學會了謙虛的傳統美德。

那麽天工的中文水平到底如何，在首發直播中就進行了現場實時演示，不是放錄像，是當場把問題敲進去那種。

大模型作爲新一代生産力工具，首先要考察的就是能不能在工作場景中幫到大家。

方漢表示天工在文本生成和文案撰寫上的表現令他驚喜，并現場展示了三個場景。

首先是很多人都頭疼的寫周報，可以讓天工直接搭一個框架出來，避免疏漏。

對于直接生成可用文本方面，選擇的問題是寫一個電商運營的招聘 JD。

天工給出結果後，方漢評價 " 沒有一到兩年的 HR 工作經驗是很難寫這麽完整的 "。

接下來要考驗的是天工的創意能力，畢竟新晉獨角獸 Jasper.ai 就是靠 AI 創意營銷起家，AI 有了這方面能力商業化就有了保障。

直播中由于時間關系，隻展示了編寫二次元 mmorpg 遊戲廣告文案一個例子。

不過方漢補充道 " 由于每個人輸入的條件和上下文不同，生成的結果也會千差萬别，對廣告文案工作非常有幫助。"

直播過程中，除了官方準備的問題，網友也在彈幕中提出各種刁鑽問題。

比如腦筋急轉彎問題，天工也沒有被難住，表現出一定邏輯能力。

還有一些靈魂拷問，天工給出的回答也都符合道德和人類價值觀。

更有意思的是，量子位 CEO 孟鴻在現場也向天工提出了一個尖銳的問題：

我是一個自媒體創作者，現在有個大公司請我評測他們的産品，但是這個産品客觀上有亮點也有不足，我應該怎麽做才能既不把自己的路走窄了，又堅守自己的節操？

從結果上來看，天工确實是做到了 " 既要又要 "，是一個" 三觀比較正 "的 AI 了。

天工，是如何煉成的？

在看過天工的能力之後，想必很多朋友們都會好奇，它到底是如何煉成的。

對此，昆侖萬維也毫不掩飾地将背後的 " 秘笈 " 給亮了出來。

首先便是 " 大力出奇迹 " 的大模型，而且還是雙千億參數的那種：

千億預訓練基座模型

千億 RLHF 模型

千億預訓練基座模型，是指至少有一個千億參數的深度學習模型，可以遊刃有餘地應對語言生成、文本分類、機器翻譯等自然語言處理任務。

千億 RLHF 模型，是指基于 "Reinforcement Learning with Human Feedback（RLHF）" 強化學習方法的一種模型。

RLHF 模型可以視爲一種特殊的交互式機器學習框架，可以通過人類的反饋來優化模型的性能，由此可以更好地處理不确定性和稀疏性問題。

而在二者的 " 強強聯手 " 之下，大模型的優勢便凸顯了出來。

例如預訓練基座模型本身便具有很強的表征能力和泛化能力，加上 RLHF 模型可以吸收人類反饋的能力，讓整體模型的性能更上一層樓。

不僅如此，在決策過程的可解釋性、模型的魯棒性和穩定性，以及處理更多的學習任務方面，這種方式的操作也起到了一定提高作用。

而除了模型層之外，在算法層方面，天工也有自己的獨到之處。

衆所周知，目前市面上許多類 ChatGPT 産品的背後，所采用的基本上都是 Transformer 架構的自然語言處理模型。

簡單來說，它包括多層 Transformer 編碼器和解碼器，自注意力機制，預訓練和微調等技術。

而天工團隊首次在此基礎之上，引入了蒙特卡洛搜索樹算法，名震一時的 AlphaGo 背後便是結合了這一算法。

其一般分爲選擇、擴展、模拟和回溯四個過程，核心思想總結來說就是把資源放在更值得搜索的分枝上。

天工引入蒙特卡洛搜索樹算法主要應用在了對話管理這個任務中，更能理解在對話中何時轉換話題，并且能懂得如何詢問更多信息等。

這也就是天工擁有超強記憶能力、能夠支持 1 萬字以上文本對話、20 輪交互，而且過程可以非常自然的原因了。

但除了模型和算法之外，天工的 " 利刃 " 還不僅于此。

中國最大 GPU 集群加持

數據和算力，亦是這輪 ChatGPT、大模型之戰的關鍵所在。

在數據方面，天工所采用的策略是" 開源的力量 "——凝聚了百位開源社區 AI 科學家。

也正因如此，天工從數十萬億的數據中，最終清洗、篩選出了近 3 萬億單詞的數據。

要知道，ChatGPT 在訓練過程中的單詞數據量也僅 3 千億；這也就是爲何在使用天工過程中，會感覺更加流暢、理解力更強的原因了。

那麽面對如此龐大的數據訓練量，接踵而至的老大難問題，便是算力了。

對此，昆侖萬維方漢在直播過程中非常自信地表示：

天工的算力是基于中國最大的 GPU 集群之一。

這也就是 ChatGPT 在支持十輪對話的時候，天工能夠達到 20 多輪的原因所在了。

但若是縱覽昆侖萬維在技術上的布局，就不難發現，天工的誕生并非是一蹴而就的事情。

因爲早在 2020 年昆侖萬維便已然入局，累計投入了已達數億元人民币、數百人參與研發。

并且在 2022 年發布 AIGC 全系列算法模型的同時，就開源了百億級參數模型，積累了廣泛的開發者好評與社區共創。

而至于爲何選擇在這個時間節點發布天工，方漢表示：

是綜合考慮了技術水平和用戶需求後做出的選擇。

我們的大模型在今年四月上旬取得了技術上的較大突破，國内對類 ChatGPT 産品的關注度也達到了空前的關注，用戶的習慣已經得到了初步的培養。

因此在這個時間節點推出，便可以很好地滿足用戶的現實需求。

據了解，目前昆侖萬維集團的各個業務均已經在向 AI 化轉變，内部的遊戲設計、策劃、内容運營、編輯、公關策劃等工種，是天工最早參與内測的 " 用戶 "。

在未來，昆侖萬維也有計劃向 B 端用戶開放 API 接口。

總而言之，有大數據、有大算力、有大模型，昆侖萬維在國産 ChatGPT 之戰上的前行道路，是值得期待一波了。