隻要一句話,就能讓 DeepSeek 陷入無限思考,根本停不下來?北大團隊發現,輸入一段看上去人畜無害的文字,R1 就無法輸出中止推理标記,然後一直輸出不停。強行打斷後觀察已有的思考過程,還會發現 R1 在不斷重複相同的話。而且這種現象還能随着蒸餾被傳遞,在用 R1 蒸餾的 Qwen 模型上也發現了…
隻要一句話,就能讓 DeepSeek 陷入無限思考,根本停不下來?北大團隊發現,輸入一段看上去人畜無害的文字,R1 就無法輸出中止推理标記,然後一直輸出不停。強行打斷後觀察已有的思考過程,還會發現 R1 在不斷重複相同的話。而且這種現象還能随着蒸餾被傳遞,在用 R1 蒸餾的 Qwen 模型上也發現了…
近日,國際相關熱點中頻頻提到了 " 稀土 " 這種資源。圖源:網絡截圖這确實是一種重要的資源。在生活中它離咱們并不遙遠。當你打開手機,屏幕背光中的铕元素正發出柔和紅光;當你乘坐新能源車出行時,電機裏的钕鐵硼磁體正将電能轉化爲動能;午休網購時,爲數據精準傳輸保駕護航的光纖,其核心摻雜着铒元素——這些都…
單目深度估計新成果來了!西湖大學 AGI 實驗室等提出了一種創新性的蒸餾算法,成功整合了多個開源單目深度估計模型的優勢。在僅使用 2 萬張無标簽數據的情況下,該方法顯著提升了估計精度,并刷新了單目深度估計的最新 SOTA 性能。這一技術突破不僅提升了單目深度估計的魯棒性,還大幅降低了對标注數據的依賴…
© Harvard Gazette-Harvard Universit利維坦按:作爲社會性群體生物,孤獨一直是我們人類自古以來就在探讨的話題。孤獨常常被定義爲一個人與他人的聯系,或者更具體地說,是"當一個人的社會關系網絡在某些重要方面存在缺陷時産生的不愉快的感受"。這種孤獨的感受,在近十幾年智能手機…
都說成年人的世界沒有"容易"二字,但所長我卻忍不住反駁:我們很"容易胖"啊!管住嘴,邁開腿的道理都懂,但就是完不成實踐與理論的結合……尤其遇見自己愛吃的,就更控制不住了,不過,當你把手伸向高油高糖食物的時候,有沒有想過,其實可能不是你想吃,而是你的腸道菌群想讓你吃?沒錯,最近幾年的研究發現,肥胖與腸…
對于愛喝精品咖啡的都市青年來說,今年開年以來,最震驚的消息莫過于咖啡期貨價格漲到了有史以來的最高位。在過去一年裏,咖啡期貨價格暴漲 100%,終于在 2025 年 2 月初達到了頂峰的将近 440 美分 / 磅;而在此之前,咖啡期貨價格的曆史最高點是 1977 年 4 月的 339.86 美分 /…
春天萬物複蘇,各種野菜也争相萌發。荠菜、香椿、槐花、馬齒苋,這些野菜大家肯定不陌生,但是,你聽說過面條菜嗎?這個曾讓農民頭疼的 " 麥田釘子戶 ",居然是春天裏的極品野菜。每到此時,不少人都會去田間地頭挖面條菜,但需要強調的是:真的不建議你這麽幹!因爲萬一認錯采摘到了形似但卻有毒的雜草,誤食可能會有…
DeepSeek 開源周,今日正式收官!内容依舊驚喜且重磅,直接公開了 V3 和 R1 訓練推理過程中用到的文件系統。具體來說,包括以下兩項内容:Fire-Flyer 文件系統(簡稱3FS,第三個 F 代表 File),一種利用現代 SSD 和 RDMA 網絡的全部帶寬的并行文件系統;Smallpo…
Diffusion Transformer 模型模型通過 token 粒度的緩存方法,實現了圖像和視頻生成模型上無需訓練的兩倍以上的加速。上海交通大學等團隊提出 Toca(Token-wise Caching),相關論文已被 ICLR 2025 接收。Diffusion Transformer 在圖…
拿起手機打開 AI 就能看病?!目前,已經有很多人開始用 AI 工具進行醫療方面的咨詢,醫學領域的研究人員也早就開始使用 AI 工具進行高效的學習和證據的梳理。那麽,AI 真的能代替醫生給人看病嗎?最近,網上關于 "AI 看病 " 的讨論熱度非常之高,仿佛 AI 一夜之間就要代替醫生了。圖源:網絡今…
近日來," 七星連珠 " 成爲熱門話題。網上不少傳聞稱 2025 年 2 月 28 日将現此天象,一些自媒體更是引申爲百年一遇、千年一遇的奇觀,引發大衆好奇,電影《哪吒 2:魔童鬧海》中的 " 六星連珠 " 情節更是推波助瀾。那麽," 七星連珠 " 到底是咋回事?真的能預示吉和兇嗎?2025 年 2…
《環太平洋》名場面之" 用真人操縱機甲 ",如今照進現實了。話不多說,請看 VCR:原來,這是上海 AI Lab 最新推出的人形機器人 " 駕駛艙 " ——HOMIE(Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit) 。一…
DeepSeek 火爆出圈,各大第三方緊趕慢趕紛紛接入,已經成爲現象級議題。但當話題最熱點過去,回歸到實際落地這個關鍵上,新的問題正在進入到一線從業者的視野之中——怎樣才能簡單、高效用好 DeepSeek?核心在于,對于企業用戶,尤其是更多來自傳統行業的企業而言,在自身業務中引入推理模型,不是簡簡單…
伴随着 AI 的崛起,基礎軟件體系正在迎來大幅度更新,從操作系統到軟件開發工具,都在迎來面向智能時代的全面升級。其中,編程語言被譽爲軟件的血液,是一切軟件工程的根基。在 AI 的晨曦中,編程語言與操作系統的變革如期而至。進入移動時代,C/C++ 語言長期擔任編程語言的首選,但其固有的安全問題也飽受诟…
給大模型排名這事兒,現在有了新玩法——任意輸入一個 Prompt,就能給大模型們實時排名,精準找到最适合做這個 Prompt 的大模型!這就是競技場(lmarena.ai)最新推出的排名方式,叫做Prompt-to-leaderboard(P2L)。主打的就是找到最能直擊你 Prompt" 靈魂 "…
俗話說得好,人老先老腿,膝關節是人體最主要的承重關節之一,結構複雜靈活,因此也是全身各關節中最容易 " 生病 " 的關節。據統計,60 歲以上男性中 60%~70% 的人都患有骨關節炎,女性患病比例則更高。膝關節骨關節炎可以導緻關節疼痛,尤其在活動時更明顯,嚴重時可出現關節功能障礙,甚至緻殘,給日常…
近日,一則令人生氣的消息,在各個平台熱傳。大意是,一位博主因爲覺得土撥鼠可愛,不知道通過什麽渠道網購了一隻活土撥鼠回家,最後迫于壓力,疑似放生。圖片截自微博,左滑查看更多這件事也引起了大衆對鼠疫的擔心,好在目前有新消息稱,該博主表示已經意識到了自己的錯誤,道了歉并已将旱獺寄回,并不存在私下放生的行爲…
GPT-4.5正式發布,号稱 OpenAI最大和最好的聊天模型。但很意外啊,這麽大的事奧特曼都不來。這次 OpenAI 也不打算秀炫酷的解題,也不打算曬各種榜單的排名,反而強調起了情商。第一個現場演示:" 我又被朋友鴿了,幫我寫個短信告訴他們我恨他們。"o1 意識到這樣會 " 友盡 ",但也隻是很忠…
嚯,萬衆期待的GPT-4.5,本周就要空降發布?!部分用戶的 ChatGPT 安卓版本(1.2025.056 測試版)上,已經出現了 "GPT-4.5 研究預覽(GPT-4.5 research preview)" 的字樣。下面緊跟着一段注釋:Pro 訂閱用戶現在可以訪問我們最新、最大的模型。網友們…
無編碼器多模态大模型被拓展到 3D 領域——3D 編碼器的功能被融入 LLM 本身,無編碼器 3D LMM 适應不同的點雲分辨率,擺脫預訓練編碼器的依賴。來自上海 AI Lab、西北工業大學、香港中文大學、清華大學等提出ENEL,在預訓練階段探索了如何使用自監督損失将 3D 編碼器的功能整合到 LL…
按時整活!DeepSeek 開源周第四天,直接痛快「1 日 3 連發」,且全都圍繞一個主題:優化并行策略。DualPipe:一種創新的雙向流水線并行算法,能夠完全重疊前向和後向計算 - 通信階段,并減少 " 流水線氣泡 "。它通過對稱的微批次調度,優化了并行計算效率。Expert Paralleli…
活久見,太乙真人給講論文了噻!咳咳,諸位道友且聽我一番唠叨。老道我閉關數日,所得一篇妙訣,便是此Llasa之法。此術上個月一出,海外仙長們無不瞠目結舌,直呼 "HOLY SHIT"!熱度最高時,曾在 huggingface 上的 " 丹藥熱度榜 " 上排第六。咳咳,書回正傳。如上引發圍觀的成果由香港…
公認的編程開發能力第一!Claude 3.7 Sonnet剛剛登頂 WebDev 競技場榜首。大幅甩第二名 100 多分,在榜單前十的其它相鄰模型分差僅爲幾分、幾十分的情況下。那第二名是誰呢?還是 Claude 自己—— Claude 3.5 Sonnet。WebDev 榜單與我們所熟知 Chatb…
好家夥!機器人已入廠打工分揀快遞,手法娴熟和人類一模一樣。前幾天,Figure 推出了端到端通用控制模型——Helix,能讓機器人像人一樣感知、理解和行動。現在,是時候檢驗最新成果了。視頻中,一批Figure 02走上生産一線,秩序井然地分揀快遞,還能正确調整條形碼位置以供機器掃描……最重要的是,按…
傳統的大語言模型訓練需要依賴 " 純淨數據 " ——那些經過仔細篩選、符合标準語法且邏輯嚴密的文本。但如果這種嚴格的數據過濾,并不像我們想象中那般重要呢?這就像教孩子學語言:傳統觀點認爲他們應該隻聽語法完美的标準發音。但現實情況是,孩童恰恰是在接觸俚語、語法錯誤和背景噪音的過程中,依然能夠掌握語言能…