阿裏雲進軍大模型一年，現在是開源第一名，CTO：閉源要超過所有開源模型才有機會參與讨論

阿裏雲正式發布通義千問 2.5 大模型，同時宣布性能全面趕超 GPT-4 Turbo。

此時，距離阿裏雲通義大模型發布，恰好過去一周年；距離 GPT-4 發布，也已經過去一年有餘。

同時，阿裏雲也正式宣布了 " 通義千問 App" 更名爲 "通義 App"，爲所有用戶提供免費服務。

通義意爲 " 通情，達義 "，該 App 以最新通義基礎大模型爲底座，并把通義實驗室的文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力 "All in one"。

阿裏雲 CTO 周靖人表示：

大模型這麽多家，大家都說的是同樣的故事，但最後比拼的就是能力差異。包括最後比拼的是怎麽融合生态，尤其是開發者的生态。

怎麽把它落地運用起來，才是最大的差異。

通義千問 2.5 發布

先來看看最新發布的通義千問 2.5版本。

周靖人介紹，相比通義千問 2.1（去年 12 月 1 日發布），2.5 版本的理解能力、邏輯推理、指令遵循、代碼能力分别提升 9%、16%、19%、10%，中文能力尤其突出。

在權威基準 OpenCompass（上海 AI Lab 出品）上，通義千問 2.5 得分追平 GPT-4Turbo。這是該基準首次錄得國産大模型取得此等成績。

會上介紹，通義 2.5 加強了文檔處理能力。

可單次可處理多達 1000 萬字的長文檔，還能同時解析 100 份不同格式的文檔，支持多文件類型、多數據格式解析、多場景優化，便于用戶使用和繼承。

同時，通義的音視頻理解能力也有叠代升級。

發布會上，周靖人着重介紹了專業提供智能編碼能力的通義靈碼，現在它不隻支持個人程序員，也推出通義靈碼企業版本。

在技術能力叠代的基礎上，上述能力都集成在剛剛改名的通義 App 内，用戶可以通過 App 和 Web 端進行使用。

百煉升級 2.0 版本

除了通義 2.5 模型以外，阿裏雲的百煉大模型平台最新進展也進行了展示。

去年 10 月，阿裏雲發布了百煉大模型平台，主要功能就是讓開發者通過簡單的拖拉拽，在 5 分鍾開發一款大模型應用，幾小時煉出一個專屬模型。

現在升級後，百煉有了 2.0 版本，成爲阿裏雲承載雲 +AI 能力的重要平台，提供一站式、全托管的大模型定制與應用服務。

" 當下企業應用大模型存在三種範式：一是對大模型開箱即用，二是對大模型進行微調和持續訓練，三是基于模型開發應用，其中最典型的需求是 RAG，以企業數據對大模型進行知識增強。" 周靖人展開介紹，" 圍繞這些需求，百煉打造了模型中心和應用中心，提供最豐富的模型和最易用的工具箱。"

目前，百煉聯動魔搭開源社區，集成了上百款大模型 API，除了通義、Llama 等系列，還有智譜 ChatGLM、百川、月之暗面等系列模型。

對需進一步訓練模型的用戶，百煉提供從數據管理、模型調優、評測到部署的模型服務，用戶可對算力按需調用，無需因底層架構費腦筋。

此外，百煉還支持基于 prompt 定制和優化、支持 Assistant API 開發模式，實現智能應用的編排，結合自身需求做定制化開發。

持續開源

去年 8 月，通義宣布加入開源行列，随之沿着 " 全模态、全尺寸 " 路線，陸續推出十多款模型。

其中較爲矚目的是參數規模橫跨 5 億到 1100 億的八款大語言模型。

小尺寸開源模型：0.5B、1.8B、4B、7B、14B，可便捷地在手機、PC 等端側設備部署；

中等尺寸開源模型：32B 試圖在性能、效率和内存占用之間找到最具性價比的平衡點。

大尺寸模型：如 72B、110B 能支持企業級和科研級的應用。

此外，通義還開源了視覺理解模型 Qwen-VL、音頻理解模型 Qwen-Audio、代碼模型 CodeQwen1.5-7B、混合專家模型 Qwen1.5-MoE。

阿裏雲表示，自己是全球唯一持續開發模型、堅持開源的公司。

此次發布會上，通義也發布了最新款開源模型：1100 億參數的 Qwen1.5-110B。

該模型在 MMLU、TheoremQA、GPQA 等基準測評中，超越了 Meta 的 Llama-3-70B 模型；在 HuggingFace 推出的開源大模型排行榜 OpenLLMLeaderboard 上，Qwen1.5-110B 沖上榜首。

最後，在談及開源技術時，周靖人表示，開源對全球技術的貢獻毋庸置疑，閉源模型至少要超過所有開源模型才有機會參與讨論。

— 聯系作者 —

— 完 —

點這裏關注我，記得标星哦～

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~