「雷峰網消息」9 月 25 日,阿裏雲開源通義千問 140 億參數模型 Qwen-14B 及其對話模型 Qwen-14B-Chat, 免費可商用。Qwen-14B 在多個權威評測中超越同等規模模型,部分指标甚至接近 Llama2-70B。阿裏雲此前開源了 70 億參數模型 Qwen-7B 等,一個多月下載量破 100 萬,成爲開源社區的口碑之作。
Qwen-14B 是一款支持多種語言的高性能開源模型,相比同類模型使用了更多的高質量數據,整體訓練數據超過 3 萬億 Token,使得模型具備更強大的推理、認知、規劃和記憶能力。Qwen-14B 最大支持 8k 的上下文窗口長度。
圖 1:Qwen-14B 在十二個權威測評中全方位超越同規模 SOTA 大模型
Qwen-14B-Chat 是在基座模型上經過精細 SFT 得到的對話模型。借助基座模型強大性能,Qwen-14B-Chat 生成内容的準确度大幅提升,也更符合人類偏好,内容創作上的想象力和豐富度也有顯著擴展。
Qwen 擁有出色的工具調用能力,能讓開發者更快地構建基于 Qwen 的 Agent(智能體)。開發者可用簡單指令教會 Qwen 使用複雜工具,比如使用 Code Interpreter 工具執行 Python 代碼以進行複雜的數學計算、數據分析、圖表繪制等;還能開發具有多文檔問答、長文寫作等能力的 " 高級數字助理 "。
百億以内參數級别大語言模型是目前開發者進行應用開發和叠代的主流選擇, Qwen-14B 進一步提高了小尺寸模型的性能上限,從衆多同尺寸模型中沖出重圍,在 MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench 等 12 個權威測評中取得最優成績,超越所有測評中的 SOTA(State-Of-The-Art)大模型,也全面超越 Llama-2-13B,比起 Llama 2 的 34B、70B 模型也并不遜色。與此同時,Qwen-7B 也全新升級,核心指标最高提升 22.5%。
圖 2:Qwen-14B 性能超越同尺寸模型
用戶可從魔搭社區直接下載模型,也可通過阿裏雲靈積平台訪問和調用 Qwen-14B 和 Qwen-14B-Chat。阿裏雲爲用戶提供包括模型訓練、推理、部署、精調等在内的全方位服務。
8 月,阿裏雲開源通義千問 70 億參數基座模型 Qwen-7B,先後沖上 HuggingFace、Github 的 trending 榜單。短短一個多月,累計下載量突破 100 萬。開源社區出現了 50 多個基于 Qwen 的模型,社區多個知名的工具和框架都集成了 Qwen。
通義千問是落地最深、應用最廣的中國大模型,國内已有多個月活過億的應用接入通義千問,大量中小企業、科研機構和個人開發者都在基于通義千問開發專屬大模型或應用産品,如阿裏系的淘寶、釘釘、未來精靈,以及外部的科研機構、創業企業。
浙江大學聯合高等教育出版社基于 Qwen-7B 開發了智海 - 三樂教育垂直大模型,已在全國 12 所高校應用,可提供智能問答、試題生成、學習導航、教學評估等能力,模型已在阿裏雲靈積平台對外提供服務,一行代碼即可調用;浙江有鹿機器人科技有限公司在路面清潔機器人中集成了 Qwen-7B,使機器人能以自然語言與用戶進行實時交互,理解用戶提出的需求,将用戶的高層指令進行分析和拆解,做高層的邏輯分析和任務規劃,完成清潔任務。
阿裏雲 CTO 周靖人表示,阿裏雲将持續擁抱開源開放,推動中國大模型生态建設。阿裏雲笃信開源開放的力量,率先開源自研大模型,希望讓大模型技術更快觸達中小企業和個人開發者。
阿裏雲還牽頭建設了中國最大的 AI 模型開源社區魔搭 ModelScope,團結全行業的力量,共同推動大模型技術普惠和應用落地。過去兩個月内,魔搭社區的模型下載量從 4500 萬飙升到 8500 萬,增幅接近 100%。
附:
魔搭社區模型地址:
· https://www.modelscope.cn/models/qwen/Qwen-14B-Chat/summary
· https://www.modelscope.cn/models/qwen/Qwen-14B/summary
魔搭社區模型體驗:
· https://modelscope.cn/studios/qwen/Qwen-14B-Chat-Demo/summary
阿裏雲靈積平台地址:
· https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-7b-14b-api-detailes
· https://dashscope.console.aliyun.com/model
Qwen 論文地址:
https://qianwen-res.oss-cn-beijing.aliyuncs.com/QWEN_TECHNICAL_REPORT.pdf
Github:
· https://github.com/QwenLM/Qwen
HuggingFace:
· https://huggingface.co/Qwen/Qwen-14B
· https://huggingface.co/Qwen/Qwen-14B-Chat