Cerebras 推出全球最快AI推理解決方案，速度是英偉達方案的20倍 - 青年圖摘

IT 之家 8 月 28 日消息，Cerebras Systems 今日宣布推出 Cerebras Inference，官方稱這是全球最快的 AI 推理解決方案。該新解決方案爲 Llama 3.1 8B 提供每秒 1800 個 token，爲 Llama 3.1 70B 提供每秒 450 個 token，速度是微軟 Azure 等超大規模雲中提供的基于英偉達 GPU 的 AI 推理解決方案的 20 倍。

除了令人難以置信的性能之外，這款新型推理解決方案的定價也比流行的 GPU 雲低得多，起價僅爲每百萬個 token 10 美分，從而爲 AI 工作負載提供 100 倍更高的性價比。

該方案将允許 AI 應用程序開發人員構建下一代 AI 應用程序，而不會影響速度或成本。該方案使用了 Cerebras CS-3 系統及其 Wafer Scale Engine 3（WSE-3）AI 處理器，其中 CS-3 的内存帶寬是 Nvidia H100 的 7000 倍，解決了生成式 AI 的内存帶寬技術挑戰。

據 IT 之家了解，Cerebras Inference 提供以下三個層級：

免費層爲登錄的任何人提供免費的 API 訪問和慷慨的使用限制。

開發者層專爲靈活的無服務器部署而設計，爲用戶提供一個 API 端點，其成本隻是市場上替代方案的一小部分，Llama 3.1 8B 和 70B 模型的定價分别爲每百萬 token 10 美分和 60 美分。

企業層提供微調模型、定制服務級别協議和專門支持。企業可以通過 Cerebras 管理的私有雲或客戶場所訪問 Cerebras Inference，非常适合持續的工作負載。

Cerebras 團隊稱：" 憑借創紀錄的性能、業界領先的定價和開放的 API 訪問，Cerebras Inference 爲開放的 LLM 開發和部署設定了新标準。作爲唯一能夠同時提供高速訓練和推理的解決方案，Cerebras 爲 AI 開辟了全新的可能性。"

AI 領域正在迅速發展，雖然英偉達目前在 AI 市場占據主導地位，但 Cerebras 和 Groq 等公司的出現預示着行業動态可能發生變化。随着對更快、更具成本效益的 AI 推理解決方案需求的不斷增加，這些挑戰者在颠覆英偉達的霸主地位，尤其是在推理領域方面。

熱門排行

感染新冠後亂吃藥，女子被送進ICU！這麼吃藥，無效又傷身！繁綺文 | 4天前
《孤島驚魂6：異界迷失》DLC試玩報告：一次性的解謎闖關體驗佼昌翰 | 4天前
iPhone出現大bug：未開專注模式也會靜音通知漏接大量電話衛青柏 | 3天前
王思聰能接班王健林麼？二代接班的謎之困局甄正浩 | 1天前
ChatGPT死活不認27能被3整除，網友：不是說AI要統治世界了嗎？幸聽楓 | 5天前
張蘭首回應更改國籍！曝有不得已原因，居國内無退休金醫保？佼昌翰 | 6天前
《阿凡達2》票價再創新高，但電影仍然不是個人人賺大錢的行業幸聽楓 | 2天前
年度期待大翻車，顔值再高也救不了郟君昊 | 2天前
完美日記淪為國貨反面教材衛青柏 | 8天前
普京：俄羅斯絕不會走自我封閉的道路繁綺文 | 3天前
秋瓷炫回中國随丈夫聚餐，于曉光摟着異性熱聊，秋瓷炫神情嚴肅集玲琳 | 3天前
謝娜大變樣快認不出！五官怪異臉變男相幸聽楓 | 9天前
國務院聯防聯控機制倡導互聯網醫療服務，多家互聯網平台提供7x24免費在線防疫咨詢郟君昊 | 7天前
人際關系再重要，也要學會翻臉，做到這五點，不吃啞巴虧集玲琳 | 5天前
老人家中陽台上常有鳥類停栖感染鹦鹉熱：可通過接觸疫鳥或吸入疫鳥排洩物氣溶膠感染袁曼雁 | 8天前
這陣容有點怪，怪期待的繁綺文 | 4天前
從大企業到了小公司，要改變生存策略衛青柏 | 4天前
深圳首個不限購“住宅”産品入市，剩44年産權嬴覓晴 | 2天前
美财長耶倫：明年通脹料大幅下降衰退并非必然結果習又夏 | 7天前
田亮森碟現身活動與賭王四太合照網友：長大了甄正浩 | 2天前
小米首款車型2024年量産！目标超比亞迪大衆但計劃可能有變？惠惠君 | 1天前
今年車市大局已定！還要不要“拯救”燃油車？嬴覓晴 | 8天前
暴雪元老克裡斯·梅森回歸《魔獸争霸》項目組，擔任創意顧問郜萌運 | 7天前
拍成這樣，就别再糟蹋經典了幸聽楓 | 6天前
漲價潮前，傳統車企轉型冰火兩重天惠惠君 | 9天前
少兒體育訓練品牌尋找有意做體育素質項目的合作夥伴郟君昊 | 3天前
小米迷你主機拆解：長江存儲SSD加持郜萌運 | 1天前
劉嘉玲曬家中巨型聖誕樹，堆滿奢侈品，罕見穿百元衣服郟君昊 | 7天前
飛凡汽車攜手謝晖呈現《追回來》，緻敬每一個“非凡的開始” 郟君昊 | 5天前
從馬蘇、楊幂到秦岚，魏大勳一手串起泰迪姐妹團的十年更叠衛青柏 | 8天前
江西：《關于發展科技金融支持創新創業的若幹措施》繁綺文 | 5天前
瘋搶黃桃罐頭郜萌運 | 2天前
退燒藥大賣，醫藥股又爆發，這隻新龍頭6天漲68%！繁綺文 | 3天前
黃桃剛囤完，電解質水又賣斷貨！專家提醒惠惠君 | 6天前
香港金管局：基準利率上調至4.75% 嬴覓晴 | 5天前
到底要多喪心病狂，才會想着把“傑尼龜”做成海龜湯？幸聽楓 | 9天前
蘋果為iCloud引入端到端加密實現高級數據保護寸飛蘭 | 4天前
昨天6.5，今天逆襲華語十佳繁綺文 | 7天前
宋仲基新劇引爆韓國！暗諷三星，撕開韓國财閥黑暗内幕寸飛蘭 | 3天前
1000TOPS算力時代來臨賁芳蕤 | 2天前