好家夥,現在随便打開一個大模型應用,支持的文本都有那————麽長。
最新消息,7 億人在用的釘釘也加入戰局,一出手就是長文本、多模态和工作流三大能力升級,全是最熱門的 AI 叠代方向。
專門提一下,釘釘 AI 助理的長文本這次能輕松拿捏幾十萬字的文檔,甚至放話單文檔理論上無上限。
釘釘那邊倒是沒避諱,直言采用的是自研的 RAG 方向的路線。目前考慮到工作場景的實用性,單文檔還是限制在上限 500 頁(小聲說,可能也是要考慮成本?)。
講道理,普通人應該很少有需要大模型吃超長文本的時候……但是作爲用戶和體驗者,咱就一個原則:我可以用不上,你不能不提供(手動狗頭)。
除了 " 量子速讀 ",釘釘 AI 助理在文檔細節上也對答如流。
一份文檔喂進去,你得到的不是隻讀了一遍的助手,而是研究了千百遍的專家。
再者,除了祭出長文本能力,釘釘還全面升級,繼續在集成 AI 能力上整大活。
多模态速讀:不隻是文檔、圖片的理解,還支持解析網頁、書籍、視頻的摘要速度。在釘釘知識庫中,如果你的文檔比較多,甚至可以一次性解析幾百萬甚至幾千萬字的文檔,也能做到跨文檔的解析、問答。
自定義工作流:可視化配置 AI 的工作流程,把 AI 能力真正用到業務流程裏。
能寫會看,還能自定義工作流,在釘釘,用戶完全可以擁有新造的 AI 同事。
同時也可以從這件事上看出一些市場動向。目前,做 AI 的公司逐漸劃分出兩派。
以技術爲出發點的公司,去尋找場景,目前主要在長文本、多模态等純技術能力上狂卷。
以場景爲出發點的公司,去集成技術,已經陸續放出來了一些不一樣的東西。
書歸正傳,下面就來實測一把,看看集 AI 能力大成的釘釘,到底實力如何。
實測釘釘 AI 助理:實用玩家
釘釘功能這麽豐富,AI 助理入口在哪?
其實不用去找它,像平常一樣把工作需要的文檔、網頁丢給同事或群裏,AI 會主動來找你的。
接下來輕輕一點,萬字長文就被總結成了幾個要點,緩解信息爆炸焦慮真是一絕。
除了網頁、文檔速讀,多模态速聽速看也是釘釘 AI 這次更新的一大重點。
先上最基礎的圖片。
一張投資機構整理的 AI 視頻産業全景圖,信息非常豐富。
如果想提取其中信息,先來看傳統選手—— OCR 的效果:格式混亂不說,還容易把公司 Logo 識别成奇奇怪怪的符号。
把圖發給釘釘 AI 助理,就省心很多了。
不用多餘的解釋,它不僅能識别其中的公司名稱,還把分類給整理出來了。
視頻也是同樣的配方,同樣的味道。
大神 Andrej Karpathy 在紅杉的活動上講了 36 分鍾,釘釘 AI 助理看完隻需要 3 分鍾。
伴随着一聲清脆的 " 釘 ",大段聽着頭疼的英文演講就變成中文總結了。
目前市面上的多模态 AI 産品,往往都在強調視覺能力。但是可别忘了,表格模态才是日常工作中更常用的。
釘釘 AI 助理對于表格的處理非常有主動性,無需額外交代,直接畫出适合展現數據的圖表,還有一些自己的見解,有智能體 Agent 那味兒了。
這些還都隻是單點的 AI 模型能力産品化,更值得一試的還是自定義工作流。
可能很多用戶不太理解什麽是工作流,其實字節扣子的 workflow 方式也是這一邏輯。
這是一種執行編排方式,給 AI 提供靈活可組合的節點,甚至支持自定義代碼,來實現複雜且可控的 AI 任務流需求。當任務場景包含較多的執行步驟,或者對輸出的準确性或者格式有明确要求時,可以規劃 AI 助理的工作流,來更好地保證輸出符合期望的結果。
簡單講,本質上是把過去的 RPA 自動化執行流程,應用到了 AI 上,一定程度上人工做了 AI 的推理,一來讓大模型有指向、有選擇的執行任務,更準确,解決現在全球 AI 面臨的意圖識别問題;二來讓大模型可以在工作流中,插入更豐富的行動能力。
一句話總結,就是讓 AI 執行任務更準确,行動也更豐富了。
先看最終效果:隻需提供一個話題,AI 自動生成小紅書文案不說,連發布都代勞了。
要制作這樣一個自定義 AI 助理也非常簡單,不會編程沒關系,隻需要點點鼠标,輸入你的需求。
并且在釘釘 AI 助理市場,已經有不少制作好的現成助理,一般常見需求都覆蓋了。
如果有更進階的需求,也可以把他們當成示例模闆,學習其中的提示詞和流程編排技巧。
就這樣,除了好用、實用之外,在釘釘上用 AI 還有一種特别的體驗:順滑。
特别是對于本來就在釘釘上辦公的朋友來說,不用切換窗口到各路複雜的 AI 工具,複制粘貼文檔了。
無論是同事、合作夥伴發來的文件還是釘釘文檔裏的内容,都可以一件轉發給 AI 助理。
而 AI 的輸出結果也可以再次轉發給其他聯系人,甚至傳送到釘釘文檔,借助 " 斜杠 " 的 AI 能力進一步加工處理。
甚至,隻要你有開放 API,不管是讓釘釘 AI 用微信、Notion、騰訊會議,還是讓 AI 打通公司原有的生産、銷售、選題各類系統,都成!
總之,在已經成熟的辦公平台使用 AI 能力,信息的流轉更順暢了。
大模型下一戰場:實際落地、實用價值
2024 年,AI 戰事轉爲應用爆發,瞄準百業千行進行落地,産生實際效益。
對于渴望 AI 進入工作、進入生活的普通人來說,親手用上 AI Native 的應用比在新聞上見證技術的變革更有趣,體感上也好得多。
人們期待的不再是高大上的概念,而是切切實實的上手用起來。
在萬衆期待下,AI 應用發展趨勢愈發明顯。
一方面,大模型的技術愈發完善,湧現出驚人的強大能力,尤其是多模态能力方面。
放眼當下,以 GPT-4、Gemini、Claude 3 爲代表的大模型,不再局限于處理單一類型的數據或執行單一類型的任務,而是能夠整合多種模态的數據,如文本、圖像、聲音等,提供更加豐富和深入的分析和理解。
搭建在這樣日漸強大模型基礎上的 AI 應用,也愈發着重多模态功能。
另一方面,那些以 " 皇帝的金鋤頭 " 爲目标場景的 AI 應用,逐步被市場需求證僞,淹沒在時代的浪潮裏。
被沖刷留下的,都是那些更貼近實際需求、有應用場景的 AI 應用。
這些應用的共同特點,就是不僅僅是将大模型能力作爲一項新穎的展示技術,而是以模型技術爲基礎,開始狂卷處理複雜任務的能力。
工作場景,大模型能力被用于編寫代碼、建立自定義工作流,省時提效,作爲處理工作事宜的幫手;醫療領域,大模型能力被用于輔助診斷、制定個性化治療方案、研發藥物;金融行業,大模型能力被用于幫助分析市場趨勢、管理風險、提供個性化的投資建議;而在制造業,AI 大模型能力參與了從産品設計、供應鏈管理、預測性維護等關鍵環節。
類似的例子不勝枚舉。
總而言之,AI 應用展現的處理複雜任務方面的能力正在逐步得到認可和應用,已成爲明顯的行業趨勢。
既然是行業趨勢,大家都看得到,爲什麽釘釘在速度上又領先一步?
量子位調研總結,釘釘至少手裏有三張王牌。
第一張,堅實的技術功底。
作爲阿裏巴巴的重要産品,釘釘能直接用上阿裏在大模型領域的最新成果——通義千問。據介紹,通義千問不僅是國内首個千億級中文大模型,在多模态理解、長文本處理等方面已是國内大模型佼佼者。
在圖片理解上,釘釘 AI 助理基于通義千問 Qwen-VL-Max 視覺理解模型,在多個權威測評中獲得佳績,比肩 OpenAI 的 GPT-4V 和谷歌的 Gemini Ultra。
而且釘釘對通義千問不是簡單套用,反而是進一步打造了一套完整的 AI 框架,其 AI 助理構建在 3 個系統之上:
感知系統:負責感知,進行 prompt 的輸入。特點是釘釘這個工作場景的上下文,如會議紀要、工作任務,授權後也可以被感知,而不隻是對話的上下文。;
行動系統:低代碼、釘釘的各個功能、SaaS 應用,将成爲 Agent 核心系統的手和腳,完成生成、問答、調用、分析等系列行爲;
思考系統:接入通義千問模型,讓 Agent 擁有快思考和慢思考的能力。
這種全棧式的技術架構,保證了釘釘 AI 從需求理解到任務完成的端到端閉環。
第二張,在大模型元年早期就洞察趨勢,搶先入局,積累經驗。
基于對 AI 發展趨勢的精準判斷,釘釘早在 23 年 4 月就率先推出 AI 産品 " 釘釘魔法棒 "。
在國内辦公平台之中動作最快,成爲首個走向智能化的生産力工具。
搶先入局讓釘釘積累了寶貴的實戰經驗,這次 AI 大升級很多功能設計其實就是不斷叠代改進的結果。
如當初還需要使用文檔資料提前訓練的 " 問答機器人 ",就進化成了随時把文檔、網頁鏈接丢到任何一個聊天或群聊,就能随時、随地調動 AI 能力。
這些功能還被放到 AI Agent 裏,與行動能力相協同,相當于有了知識之後,又有了手和腳。
第三張,場景積累在我,過去還積累了無代碼低代碼平台。
據數據統計,釘釘在全球範圍内已服務了 2500 萬組織。
這意味着,各行各業海量的辦公協同場景被釘釘收入囊中,爲其 AI 應用提供了極其豐富的應用土壤。
而在平台能力上,釘釘此前發力的智能化 OA、RPA、宜搭等産品,也都成爲此次 AI 助手的有力補充。
所以在自定義 AI 工作流剛上線,不僅有官方預先制作好的常用模闆,熱心用戶也能迅速把自己的個性化工作流搬上來,突出一個輕車熟路。
可以說,釘釘多年的戰略性投入,借着 AI 這波 AI 新浪潮又開花結果了。
一年前這個時候,所謂 AI 應用還大多是 " 大模型技術演示 ",遠遠稱不上産品。
當時我們曾預言,隻有準确把握 AI 時代的交互模式,應用于大量的應用場景,才能讓 AI 能力在反饋中不斷提升、應用層不斷創新,形成新的增長飛輪。
如今看來,釘釘 AI 一年多來的實踐正是沿這個方向給大家趟出一條更具體、更容易摸着走下去的路。
"AIGC 一天,人間一年 ",我們離真正的第一個 AI 超級應用,已經不遠了。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~