阿裏雲正式發布通義千問 2.5 大模型,同時宣布性能全面趕超 GPT-4 Turbo。
此時,距離阿裏雲通義大模型發布,恰好過去一周年;距離 GPT-4 發布,也已經過去一年有餘。
同時,阿裏雲也正式宣布了 " 通義千問 App" 更名爲 "通義 App",爲所有用戶提供免費服務。
通義意爲 " 通情,達義 ",該 App 以最新通義基礎大模型爲底座,并把通義實驗室的文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力 "All in one"。
阿裏雲 CTO 周靖人表示:
大模型這麽多家,大家都說的是同樣的故事,但最後比拼的就是能力差異。包括最後比拼的是怎麽融合生态,尤其是開發者的生态。
怎麽把它落地運用起來,才是最大的差異。
通義千問 2.5 發布
先來看看最新發布的通義千問 2.5版本。
周靖人介紹,相比通義千問 2.1(去年 12 月 1 日發布),2.5 版本的理解能力、邏輯推理、指令遵循、代碼能力分别提升 9%、16%、19%、10%,中文能力尤其突出。
在權威基準 OpenCompass(上海 AI Lab 出品)上,通義千問 2.5 得分追平 GPT-4Turbo。這是該基準首次錄得國産大模型取得此等成績。
會上介紹,通義 2.5 加強了文檔處理能力。
可單次可處理多達 1000 萬字的長文檔,還能同時解析 100 份不同格式的文檔,支持多文件類型、多數據格式解析、多場景優化,便于用戶使用和繼承。
同時,通義的音視頻理解能力也有叠代升級。
發布會上,周靖人着重介紹了專業提供智能編碼能力的通義靈碼,現在它不隻支持個人程序員,也推出通義靈碼企業版本。
在技術能力叠代的基礎上,上述能力都集成在剛剛改名的通義 App 内,用戶可以通過 App 和 Web 端進行使用。
百煉升級 2.0 版本
除了通義 2.5 模型以外,阿裏雲的百煉大模型平台最新進展也進行了展示。
去年 10 月,阿裏雲發布了百煉大模型平台,主要功能就是讓開發者通過簡單的拖拉拽,在 5 分鍾開發一款大模型應用,幾小時煉出一個專屬模型。
現在升級後,百煉有了 2.0 版本,成爲阿裏雲承載雲 +AI 能力的重要平台,提供一站式、全托管的大模型定制與應用服務。
" 當下企業應用大模型存在三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基于模型開發應用,其中最典型的需求是 RAG,以企業數據對大模型進行知識增強。" 周靖人展開介紹," 圍繞這些需求,百煉打造了模型中心和應用中心,提供最豐富的模型和最易用的工具箱。"
目前,百煉聯動魔搭開源社區,集成了上百款大模型 API,除了通義、Llama 等系列,還有智譜 ChatGLM、百川、月之暗面等系列模型。
對需進一步訓練模型的用戶,百煉提供從數據管理、模型調優、評測到部署的模型服務,用戶可對算力按需調用,無需因底層架構費腦筋。
此外,百煉還支持基于 prompt 定制和優化、支持 Assistant API 開發模式,實現智能應用的編排,結合自身需求做定制化開發。
持續開源
去年 8 月,通義宣布加入開源行列,随之沿着 " 全模态、全尺寸 " 路線,陸續推出十多款模型。
其中較爲矚目的是參數規模橫跨 5 億到 1100 億的八款大語言模型。
小尺寸開源模型:0.5B、1.8B、4B、7B、14B,可便捷地在手機、PC 等端側設備部署;
中等尺寸開源模型:32B 試圖在性能、效率和内存占用之間找到最具性價比的平衡點。
大尺寸模型:如 72B、110B 能支持企業級和科研級的應用。
此外,通義還開源了視覺理解模型 Qwen-VL、音頻理解模型 Qwen-Audio、代碼模型 CodeQwen1.5-7B、混合專家模型 Qwen1.5-MoE。
阿裏雲表示,自己是全球唯一持續開發模型、堅持開源的公司。
此次發布會上,通義也發布了最新款開源模型:1100 億參數的 Qwen1.5-110B。
該模型在 MMLU、TheoremQA、GPQA 等基準測評中,超越了 Meta 的 Llama-3-70B 模型;在 HuggingFace 推出的開源大模型排行榜 OpenLLMLeaderboard 上,Qwen1.5-110B 沖上榜首。
最後,在談及開源技術時,周靖人表示,開源對全球技術的貢獻毋庸置疑,閉源模型至少要超過所有開源模型才有機會參與讨論。
— 聯系作者 —
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~