智東西(公衆号:zhidxcom)
作者 | 香草
編輯 | 李水青
智東西 3 月 27 日報道,今日,國内 "AI+ 制造 " 解決方案供應商創新奇智宣布其 " 奇智孔明 AInnoGC" 工業大模型産品矩陣升級。
創新奇智 CTO 張發恩發布了升級後的工業大模型AInno-75B,以及三款全新 ChatX 系列生成式 AI 應用:包括生成式企業私域視覺洞察應用ChatVision、生成式輔助工業設計應用ChatCAD、基于非侵入式腦機接口的工業機器人任務編排應用ChatRobot Pro。
▲奇智孔明工業大模型升級發布
此次發布是創新奇智工業大模型矩陣時隔半年以來的重要升級。
創新奇智于去年 9 月發布了自研工業大模型 AInno-15B,基于該模型的大模型服務引擎,以及三款生成式 AI 應用産品:ChatRobot、企業私域數據分析應用 ChatBI、企業私域知識問答應用 ChatDoc。本次發布,大模型服務引擎和 ChatX 系列應用也基于 750 億參數的模型進行了升級。
現場,創新奇智副總裁郭江亮、創新奇智高級技術總監溫哲立、創新奇智高級研究員高達輝分别演示了 ChatVision、ChatCAD 和 ChatRobot Pro,其中,腦機接口 " 意念取物 " 的演示令人印象深刻。
▲工作人員在現場通過外接式腦機接口 " 意念 " 操作機器人
一、750億參數、多模态輸入輸出,ChatX系列産品全線升級
張發恩首先發布了 750 億參數的工業大模型 AInno-75B,相比半年前發布的 Ainno-15B,參數提升至 5 倍,模型性能也相對升級。
AInno-75B 還新增了多模态處理能力,支持輸入文本、圖像、視頻、EEG(腦電波)以及工業場景中的特定模态,如 CAD(計算機輔助設計)等。
輸出方面,AInno-75B 支持輸出文本、圖像、視頻、CAD,以及工業領域特色的 Action(行爲)模态。
▲工業大模型 AInno-75B 技術特色
在能力指标方面,AInnoGC 工業大模型已獲得中國信通院可信 AI 工業評測的最高等級 4+ 級,也是截至今天唯一通過該等級評測的工業大模型。
在去年 12 月麻省理工科技評論發布的 15 個 " 中國 AI 大模型先進應用案例 " 中,AInnoGC 榜上有名。SuperCLUE 工業大模型第一名。
3 月 21 日,中文語言理解測評基準 SuperCLUEC 發布首個中文原生的工業大模型測評基準 SC-Industry,奇智孔明 AInno-15B 僅次于 GPT-4 Turbo 和 GPT-4,在國内工業領域大模型中位列第一。
▲奇智孔明工業大模型獲得成就
基于 AInno-75B,創新奇智 ChatX 系列産品也進行了重要升級。
生成式企業私域知識問答應用 ChatDoc 針對性優化了知識構建、問答、溯源和推薦能力,整體問答效果提升 28.8%;生成式企業私域數據分析應用 ChatBI 新增支持 Excel、CSV 等數據格式,生成 SQL 語句和分析報告的準确率提升 15%。
▲創新奇智工業大模型産品矩陣升級
大模型服務引擎 Engine 則新增支持交互式生成 Agent 應用,其 RAG(檢索增強生成)能力引擎也增加内置針對性優化策略,模型服務新增内置大模型推理加速引擎。
二、三大ChatX新品發布,針對視覺、CAD和 " 意念控制 "
會上,張發恩還發布了三款新的 ChatX 系列産品,分别是生成式企業私域視覺洞察應用 ChatVision、生成式輔助工業設計應用 ChatCAD,以及基于非侵入式腦機接口的工業機器人任務編排應用 ChatRobot Pro。
1、生成式企業私域視覺洞察應用ChatVision
據介紹,ChatVision 以自然語言交互形式,對視頻 / 圖片進行交互式智能分析,并且基于 Agent 能力自主進行任務規劃和技能編排。
▲生成式企業私域視覺洞察應用 ChatVision
創新奇智副總裁郭江亮現場演示了 ChatVision 的場景洞察能力,其能夠進行實時視頻流分析、理解用戶的複雜任務指令,也能離線進行視頻長文件分析。
▲ ChatVision 能力及工作流程
首先,兩位工作人員在現場扮演工人的角色,通過攝像頭拍攝實時視頻流輸入 ChatVision 後,郭江亮通過語音輸入指令 " 觀察當前畫面,告訴我這可能是什麽地方 "。随後,ChatVision 迅速給出答案,通過分析場景中的人物和穿着,判斷這可能是一個建築工地、車間或倉庫。
▲ ChatVision 判斷畫面是什麽場景
随後郭江亮追問,讓 ChatVision 找出畫面中的電源插座和白色安全帽,它也很快就完成并進行了實時跟蹤。
▲ ChatVision 識别出白色安全帽并實時跟蹤
郭江亮又提出分析畫面中有什麽潛在的危險行爲并發送給管理員,ChatVision 在畫面中标出了玩手機等 3 項違規操作,并截圖發送了警告郵件。
▲ ChatVision 識别危險行爲
除了在線分析視頻流,ChatVision 也能離線分析視頻長文件。郭江亮上傳了一個車間實拍視頻,并詢問 ChatVision 這是什麽場景,很快就得到了正确的回答。
▲ ChatVision 離線識别視頻流
随後郭江亮輸入指令 " 識别是否有人吃飯 ",ChatVision 通過分析,指出在視頻 0-15 秒有工人在車間吃飯的行爲,還詳細描述了 " 用筷子 "" 喝湯 " 等具體動作。
▲ ChatVision 識别吃飯行爲
最後,郭江亮輸入 " 退出 " 回到視頻流模式,并将攝像頭轉向現場的觀衆,讓 ChatVision 識别出正在微笑的人,ChatVision 很快在畫面中畫出一個個紅框圈出目标。
▲ ChatVision 識别現場微笑的人
2、生成式輔助工業設計應用ChatCAD
接觸過工業制造的讀者應該知道,CAD 幾乎是整個工業的基礎。面向 CAD 設計場景,創新奇智退出 ChatCAD,支持以語言交互的方式生成機械、電氣設計,變革了設計方式并提升設計效率。
▲生成式輔助工業設計應用 ChatCAD
創新奇智高級技術總監溫哲立現場演示了 ChatCAD,通過簡單的自然語言輸入就能得到複雜的工業設計模型,還能進一步提出提出修改要求,生成模型兼容多種主流 CAD 格式。
▲ ChatCAD 功能和流程
ChatCAD 界面基于 AI 原生原理打造,沒有複雜的菜單,其左邊是設計區,右邊是對話區。
溫哲立首先讓 ChatCAD 生成一個工業滑輪,給出了具體的參數。不出一分鍾 ChatCAD 就生成了相應的模型。
▲ ChatCAD 生成工業滑輪
随後溫哲立接連提出兩個要求,讓 ChatCAD 修改滑輪中心軸半徑、邊緣凸出部分長度,很快便得到了滿足要求的生成結果。
▲ ChatCAD 根據追加要求修改模型
溫哲立又讓 ChatCAD 設計了一個直流電機,并再次提出 2 個追加要求,ChatCAD 均正确生成。
▲ ChatCAD 設計直流電機
第三個演示中,溫哲立提出了一個極爲複雜的需求,要求 ChatCAD 生成一個渦輪機,對其扇葉數量、渦輪軸直徑、旋轉軸軸帽長度等多項參數都進行了具體數據要求。
▲ ChatCAD 生成渦輪機
在此基礎上溫哲立又要求 ChatCAD 将扇葉改爲 8 個,修改引擎罩長度等。
▲ ChatCAD 将扇葉改爲 8 個
最後溫哲立選擇 STEP 格式下載了該模型,它可以在相應 CAD 軟件中完美兼容。
▲在 CAD 軟件中打開生成的模型
3、工業機器人任務編排應用ChatRobot Pro
ChatRobot Pro 在 ChatRobot 的基礎上,采用非侵入式腦電采集,對人腦電波進行解碼,實現通過意念控制機器人完成多樣化任務。
▲工業機器人任務編排應用 ChatRobot Pro
創新奇智高級研究員高達輝演示了 ChatRobot Pro,由一位現場工作人員連接外接腦機接口裝置,抓取目标商品并由機器人完成任務設定。
▲ ChatRobot Pro 功能和工作流程
在 ChatRobot Pro 工作界面中,左邊顯示腦電信号實時狀态,右邊是交互頁面。
▲ ChatRobot Pro 交互界面
據介紹,該任務的主要難點在于非侵入式腦機接口反映的是整體腦電波,無法直接反映局部意念,大模型需要從中解碼用戶的具體意圖。
首先,工作人員通過大腦 " 意念 " 控制光标移動,選擇了一種飲料,系統将命令下發給機器人。
▲工作人員 " 意念 " 選擇飲料
得到指令後,ChatRobot Pro 自動完成了任務解析和步驟編排,并驅動機器人前往貨架選擇飲料。
▲機器人拿取飲料
随後,機器人在 ChatRobot Pro 的控制下,通過視覺解析找到目标位置,前往高達輝面前,将飲料交到他手裏。
▲機器人将飲料交給高達輝
完成任務後,高達輝向 ChatRobot Pro 輸入 " 讓機器人歸位 " 的指令,ChatRobot Pro 便規劃了任務規劃并驅動機器人回到初始位置。
▲ ChatRobot Pro 規劃機器人行動
結語:響應 " 人工智能+" 行動,創新奇智推動AI解放制造業
就在昨天,工信部在國新辦新聞發布會上提到,加快推動以大模型爲代表的 AI 賦能制造業發展。今年将開展 " 人工智能 +" 行動,促進 AI 與實體經濟深度融合,推動 AI 賦能新型工業化。
創新奇智堅持深耕 "AI+ 制造 " 領域,着眼于 AI 解放制造業,其工業大模型産品矩陣的行業價值正在逐步展現,爲企業實現數字化轉型提供了有力支撐。可以預見到,此次發布的模型升級與三款新産品,将在工業領域産生更多創新場景,爲制造行業提供豐富的生成式 AI 解決方案。