做 Excel 表,真就動動嘴就夠了!
看,輸入想要幹的事:給學生成績排個名吧。
簡單敲個回車,表格唰一下就列好了!
檢查一遍也沒錯。
還能跨表格處理。
比如标記出兩張不同表格中排名都在前十的學校。
哦豁,還有點超越 ChatGPT?
畢竟給 ChatGPT 提出類似的要求,它隻能幫我寫出對應的代碼,操作還得自己手動來。
這就是最近在知乎上引起關注的 AI 工具ChatExcel,一發布就登上了熱榜。
它主打用對話的形式實現 Excel 複雜操作(Chat-to-Excel),告别記函數、手動設置公式。
做好的成品,支持一鍵導出成标準 Excel 表格,連複制粘貼這道工序都省了。
而且不用注冊、網頁上就能用、不限使用次數,相當利好懶人和 Excel 小白。
甚至懂 Excel 技能的人都感慨,自己會的這些是不是要沒用了。
這就是由北京大學深圳研究生院 / 信息工程學院3 位碩博生,獨立開發的項目。
目前已開放 Demo 供大家試玩。
看到這可能很多人都以爲," 這又是一個受到 ChatGPT 影響開發的項目嘛 "。
還真不是。
GitHub 項目上的第一個 commit 是在 22 年 3 月就提交了。
而背後真正的契機——
其實是團隊中一位小哥,想用技術幫女票解決點工作中的小煩惱啦。
這到底咋回事?量子位聯系了主創團隊,來一一給大家揭秘 ~
ChatExcel 表現如何?
咳咳,别人女票的事稍後再談,咱們先來看看 ChatExcel 的表現到底咋樣。
總體來說,它想做的事就是跳過學習 Excel、跳過寫函數公式,直接把腦子裏的需求變成表格裏的内容。
團隊在知乎首發産品時,用了一張圖做解釋:
老規矩,我們來上手體驗下。
進入主頁面後,網站默認展示 demo,點擊 UPLOAD 就能上傳自己的表格。格式需要是标準 Excel 文件。
我們找隔壁 ChatGPT 生成了一份學生成績單,讓 ChatExcel 進行計算操作。
主要測試了需要插入函數的 Excel 操作。比如:
給總分在 255 以上的人标記爲 A,總分在 240-255 的人标記爲 A-,總分在 210-240 的人标記爲 B。
打完内容,敲一下回車,它就開始處理了。
假如老師想知道誰是單科第一呢?輸入:
找到表格中數學成績最高分的人。
然後,它就生成了一個新的界面,裏面隻有最高分童鞋。
如果還想對表格進行其他操作,點一下頁面中的 "UNDO",它就能返回到操作前的表格了。
我們還讓它對表格中的學生進行成績排名、并列出名次,ChatExcel 都沒有出錯。
除此之外,它還能連續完成任務。
比如想在表格裏增加一欄平均分,可以先要求它增加一列:
再進一步輸入需求,讓它把計算好的結果填進去:
最後得到的表格,點擊 "DOWNLOAD",即可導出爲普通的 Excel 表格。
體驗下來,感覺 ChatExcel 主要有兩大特點:
連貫性
準确性
比如之前也有幫人生成 Excel 公式的工具,excelformulabot 能實現這一功能,但它是獨立在表格外的,需要自己把單元格帶入到給出的公式了。
如果是具體一些的描述,還會出現給不出公式的情況。
而對比 ChatGPT 來說,ChatExcel 計算的準确性更突出。
比如計算同一個表格的平均數,ChatGPT 不是弄錯到底有多少個人,就是計算的時候帶錯數字,反複糾正都救不回來……
所以,ChatExcel 是怎麽做到的?背後原理到底如何?
把 " 乙方思想 " 貫徹到底
ChatExcel 的原理一言以蔽之,就是直接把 " 大白話指令 " 轉換成類似于 VBA 這樣的程序語言,然後再執行程序。
底層基于 Transformer 架構,基本技術路線就是無監督訓練 + 具體場景微調。
但 NLP 模型搞數學,一直都很容易出錯,強大如 ChatGPT 都很難避免。
爲此,團隊在訓練模型的過程中,将重點放在了符号邏輯上,期間還有意引入了一些邏輯符号的新知識。
由此我們也看到,它在計算上出錯的概率并不高。
除了數學能力出衆之外,ChatExcel 最大的一個特點就是持續交互。
這是因爲 ChatExcel 每次的生成結果,都是基于用戶提出的新需求 + 上一輪生成的表格。對模型的理解力及運算其實提出了更高的要求。
爲什麽要實現這一功能?
團隊介紹說,如 Dall · E、ChatBCG 等 AI 工具,完成任務的方式都是單次不持續的。但在人們的實際使用過程中,想法是一步步推進的。
舉例來說,用戶和 ChatExcel 之間的關系就好比甲乙雙方,ChatExcel 是乙方,用它處理表格的我們就相當于甲方:
要求隻管提,改到滿意爲止。(Doge)
同樣,這個乙方思維也體現在開發團隊自己身上。
Demo 發布後,很多人跑來圍觀、試用和提建議。最常出現的反饋是,ChatExcel 有點理解不了提出的要求,需要重新措辭調整。
對于這些情況,團隊先闡明态度:建議我們全盤接收。
同時也進一步解釋了原因,目前開放的 demo 還不是很完善。
這一方面是爲了看看大家的反饋做進一步優化;另一方面,也是希望收集更多的語料,讓模型之後能更聰明一些。
比如,有人就提出:
既然都已經有 "undo"(撤銷)操作,什麽時候可以把它處理表格的過程顯示出來。
還有人附議,表格數據太多就很難檢查它是否處理正确:
提高 ChatExcel 執行任務的透明度,方便檢查錯誤。
對于這些建議,團隊和我們說,他們已經在開始着手調整了。
比如很多人反饋的語言理解問題,他們打算之後在對話框下根據用戶的輸入,推薦一些标準操作語句,大家直接選擇就可以了,不用自己研究措辭,有點現在 AI 客服那味兒。
除此之外,還有這些功能也在開發的路上了:
表格上傳格式更加兼容
展示 ChatExcel 處理表格的具體過程,更加透明化
……
以及 ChatExcel 更加具體的原理介紹,之後也會在官網以博客的形式發布。
甚至包括代碼,也會進行開源。
受到女票啓發,把業餘項目做成正式課題
說來 ChatExcel 的誕生,也是相當因吹斯聽了。
它受啓發于團隊成員的女票、導師立刻拍闆認可、把業餘項目做成正式課題……
這還要從Kid和CY拉起小團隊說起。
他們都來自北京大學深圳研究生院信息工程學院袁粒老師的課題組,已經是準博了,還有一位成員正在讀碩士。
作爲機器學習的基礎理論研究者,他們日常和論文打交道更多。
爲啥突然從理論研究轉向應用?
這還得從Kid的女票說起。
他說自己的女朋友是一位中學信息老師,日常工作中經常需要幫年紀大的老師處理 Excel 表格問題。
爲了幫女朋友多分擔一點工作(bushi) ,當然也看到确實有很多人深受 Excel 複雜操作困擾,Kid 就萌生了試試看的想法。
我覺得 Excel 公式的使用,多少還是需要編程思維的,這對于很多人、尤其是不擅長電腦操作的人來說,很不友好。而拿着工具書從頭啃,也确實比較麻煩。
當時正值 OpenAI 的 Copilot 大火,看到 AI 在提升生産力上大有可爲,他就拉着 CY 一起,打算仔細研究研究這事兒。
但事情前期,并沒有想象中順利。
一方面,它剛開始隻是個業餘項目,大家都是抽空來做。
另一方面,團隊在技術路線上也做過重大調整。
最初,他們覺得 ChatExcel 應該是往判别式模型那塊兒走的,于是就順着這一思路推進,但沒想到:
前期處理工作量太大,需要引入非常非常多的符号邏輯,數據要求很高。
這對于小團隊來說基本上是緻命的,因爲數據量意味着人力物力時間成本都會飙高。
沒有辦法,Kid 和 CY 就坐下來重新複盤這件事:
我們想到李沐老師發過一個視頻,講 "BERT 和 GPT 之争 ",我們最初都覺得 BERT 各種指标表現更好。GPT 呢,有點摸不清它想幹啥。
但仔細一想,從任務本身的需求來看,生成式才是我們真正想要的東西。
加之去年 OpenAI 一系列生成式工作開始大火(如 Copilot、Dall · E),兩個人最後決定,推翻原有思路,重新從生成式模型做起。
明确了技術路線,後續推進也就更順了。
加上這項工作還得到了導師袁粒的認可和支持,團隊在資源和經費上也更充裕了一些。
(p.s. 但團隊也和我們解釋說,目前其實還不能負擔太多成本,運行速度會受到影響、一些命令行識别也還存在問題)
不管怎樣,曆經 1 年時間,ChatExcel 終于發布 demo。
但這隻是計劃的第一步。
團隊表示,接下來還将對産品做更多叠代升級,并會開源代碼、揭秘背後技術。
對于 ChatExcel 的定位,他們堅持 " 小而美 "。
Kid 介紹說,大模型的确是當下的趨勢,如 OpenAI、百度等都在通用大模型領域不斷推進成果。但他們認爲,在一些子任務領域上,模型的能力還有待提升,這可能會是未來的一個趨勢。
由此,他們目前會更加專注于模型特定場景下的能力提升。
至于長遠目标,團隊希望打造一個"Chat 生态 "、交互式 AIGC。
終極 "Chat 生态 "(幻想版)大概會長這樣:
而回到 ChatExcel 本身,團隊表示的确有商業化的考慮,但會是 To B 層面的。
(聽說 demo 一發布就已經有不少公司聯系他們了)
在 To C 這邊,會堅持公益開放的形式,人人都能用。
而回看整個開發過程,Kid 和 CY 的很多感受都記憶猶新。
比如看到 ChatGPT 做表格大火後,他們又驚又喜。
" 驚 ",是因爲開始擔憂會不會有很多同類産品出來?自己的項目沒有生存餘地了?
Kid 說自己看到這些新項目不斷湧出後,晚上都要睡不着覺了。
" 喜 ",則是因爲覺得自己的想法和趨勢發展一緻,這也是一種肯定。
至于項目本身,他們的态度非常坦然,問題全盤接受,但對自己的成果也很有自信。
我們現在依舊覺得自己的方案很 " 優雅 "。
感覺做理論的人轉來做應用,總是能想到一些奇怪的思路 hhh。
(應受訪者要求文中 Kid、CY 爲化名)
傳送門:
https://chatexcel.com/
參考鏈接:
[ 1 ] https://www.zhihu.com/question/586673687
[ 2 ] https://zhuanlan.zhihu.com/p/607997627