DeepSeek-R1 背後關鍵——多頭潛在注意力機制(MLA),現在也能輕松移植到其他模型了!而且隻需原始數據的 0.3%~0.6%。這項研究由複旦大學、華東師範大學、上海 AI Lab 等聯合提出,複旦教授邱錫鵬(Moss 大模型項目負責人)也在作者名單之列。他們提出了MHA2MLA這種數據高效…
DeepSeek-R1 背後關鍵——多頭潛在注意力機制(MLA),現在也能輕松移植到其他模型了!而且隻需原始數據的 0.3%~0.6%。這項研究由複旦大學、華東師範大學、上海 AI Lab 等聯合提出,複旦教授邱錫鵬(Moss 大模型項目負責人)也在作者名單之列。他們提出了MHA2MLA這種數據高效…
從古老的蒸汽烹饪到現代的高壓鍋,人類一直在探索更高效的烹饪方式。如今,高壓鍋已經成爲廚房的 " 時間魔術師 ",它讓我們在快節奏的現代生活裏,高效便捷地享受美味。這個看似普通的鍋具,不僅能大幅縮短烹饪時間,還能保留食物的營養和風味,讓食物更軟爛易熟。然而,關于它的使用技巧、營養保留效果以及安全性,許…
Claude 深夜重磅發布新模型——Claude 3.7 Sonnet,首個混合推理模型問世,在編碼和前端 Web 開發方面顯著提升,實現了全面領先。與 o3-mini 實際對比,相同的提示詞下,Claude 3.7 Sonnet 的表現。o3-mini:Claude 3.7 Sonnet:(提示詞…
理解物體的物理屬性,對機器人執行操作十分重要,但是應該如何實現呢?光輪智能與清華 AIR、同濟大學等機構聯合提出了一種基于 3D 高斯濺射的方法——PUGS(Zero-shot Physical Understandingwith Gaussian Splatting)無需訓練、零樣本,它就能夠從多…
DeepSeek 徹底引爆大模型應用落地。國民級 APP 争相接入,手機、汽車、甚至掃地機器人都來湊熱鬧,借着 DeepSeek 的東風,不斷刷新自身 "AI 濃度 "。當然,還有普通人的主動擁抱。醫生、老師等來自各個行業的個體也都在嘗試 AI 能給自己的工作、生活帶來怎樣的改變。一場波及全社會範圍…
2 月 22 日,中科聞歌 2025 AI 新産品線上發布會成功舉辦,升級發布 " 智川 " 企業智能體平台 1.0 與 " 優雅 " 音視頻大模型平台 1.5,助力政企極速落地 AI 應用與創意靈感,讓 AI 技術精細化滿足真實業務場景,加速 AI 普惠落地。一站式企業智能體開發平台,個性化 AI…
算力需求比 AdamW 直降 48%,OpenAI 技術人員提出的訓練優化算法 Muon,被月之暗面團隊又推進了一步!團隊發現了 Muon 方法的 Scaling Law,做出改進并證明了 Muon 對更大的模型同樣适用。在參數量最高 1.5B 的不同 Llama 架構模型上,改進後的 Muon 算…
卷赢大模型訓練成本之後,DeepSeek 正在重塑全球 AI 競争格局。微信、飛書、百度等上百家企業一個賽一個地宣布接入 DeepSeek,表面喧騰之下,實則是更多應用場景的進一步落地。随着各行各業的領導者全面擁抱 AI,整個社會以及我們每個人其實都正在接入 AI。不過,作爲 AI 領域最被看好,且…
OpenAI o1 和 DeepSeek-R1 靠鏈式思維(Chain-of-Thought, CoT)展示了超強的推理能力,但這一能力能多大程度地幫助視覺推理,又應該如何細粒度地評估視覺推理呢?爲此,來自港中文 MMLab 的研究者們提出了 MME-CoT。這是一個全面且專門用于評估 LMMs 中…
DeepSeek 啥都開源了,就是沒有開源訓練代碼和數據。現在,開源 RL 訓練方法隻需要用 1/30 的訓練步驟就能趕上相同尺寸的 DeepSeek-R1-Zero 蒸餾 Qwen。國内大模型六小強之一的階躍星辰聯與清華聯合發布 Open Reasoner Zero(ORZ),由 AI 大拿沈向洋…
現在寫代碼,最 fashion 的 " 姿勢 " 應該是什麽?答案或許就是:截圖。沒錯,就像這樣,先随便找個網頁,截取想要的那部分界面,然後 " 喂 " 給 AI,并附上一句 Prompt:參考這個頁面,生成一個類似的 HTML 頁面。隻是一張圖和一句話,AI 就 " 唰唰唰 " 的把代碼給寫出來了…
米飯是餐桌上少不了的主食,大多數人都是做好了就趁熱吃,可有一部分人偏偏喜歡吃冷米飯,因爲聽說吃冷米飯,可以降血脂血糖,甚至還有助于脂肪肝的恢複。真的是這樣嗎?吃冷米飯有這麽多好處嗎?先說結論:之所以有人吃冷米飯血脂血糖降了,其實是冷米飯中的抗性澱粉起了作用。不過,抗性澱粉這種成分很多食物都有,多吃點…
2025 年初的汽車行業,正在被比亞迪掀起的全民智駕席卷:買菜車、豪華車、性能車…一視同仁标配高階智駕。于是普通用戶中開始流行起 " 買車沒智駕,就像諾基亞 " 的觀點;各個車企也在加班加點跟進智駕戰略,一大波發布會正在路上。甚至還有消息傳出,某車企老闆帶着紅包連夜慰問智駕團隊,加油打氣穩定軍心…行…
現在電動牙刷已經非常常見了,甚至一說起牙刷,很多人腦海中浮現的已經是電動牙刷的形象了。市面上的電動牙刷更是琳琅滿目,價格差異也非常大,下到十幾元上至五六千元。電動牙刷真的比手動牙刷刷得更幹淨嗎?價格相差近百倍的電動牙刷,它們的功能真的有那麽大的差别嗎?挑選電動牙刷時該着重看哪些參數?今天我們就扒一扒…
水果蔬菜富含多種維生素、礦物質,還有豐富的植物抗氧化物質,多吃蔬菜水果有益健康。但是很多人也擔心水果蔬菜中的農藥殘留有害健康,苦苦尋覓各種去農殘的方法。然而,我們真的需要這麽焦慮嗎?我國的農藥使用情況目前我國允許使用的農藥種類有幾百種。按照溶解性能來分,農藥可以分爲水溶性和脂溶性兩種。水溶性農藥主要…
擡眼看日曆,馬上就要到三八婦女節啦!新的一年,新的形象!每次選節日禮物就頭疼,買花太普通了,買貴的又上不封頂太貴重了,那合适的就是——平價好看又有設計的首飾。除了日常各種護膚保養之外,戴首飾——比如珍珠耳釘,也是一個快捷變美的方法。一枚胸針優雅矜貴,加上耳飾項鏈的點睛之筆,不管是正式場合,還是朋友家…
以下文章來源于中科院古脊椎所 ,作者王敏億年飛躍,生命演化新啓示中國科學院古脊椎動物與古人類研究所制作鳥類化石新發現2 月 13 日,《自然》(Nature)發表了中國科學院古脊椎動物與古人類研究所王敏團隊(以下稱 " 古脊椎所 ")和福建省地質調查研究院(以下稱 " 福建地調院 ")合作完成的福建…
一個眼神鎖定你!多模态視覺定位能力升級——由單張圖像拓展至多圖像應用場景。比如,在複雜的相冊中自動識别出 Luigi 并在第二張圖中找到他,或是根據鋼鐵俠劇照自動在合影中找到對應的演員唐尼。Q:Image-1 is the photo album of someone in Image-2, ple…
Grok-3 才發布 3 天,就陷入作弊風波。隔壁 OpenAI 應用主管火速掀桌:每次評估中 o3-mini 都要比 Grok-3 好,看到 Grok 團隊作弊真是令人失望。咋回事?在 Grok-3 的 Blog 中有一張 AIME 2025 評估圖令人印象深刻,兩個新版本模型都超過 o3-min…
處理數百小時超長視頻,單張 3090 就夠了?!這是來自香港大學黃超教授實驗室發布的最新研究成果——VideoRAG。具體而言,VideoRAG 可以在單張 RTX 3090 GPU ( 24GB)上高效處理長達數百小時的超長視頻内容。這意味着隻需要一張普通的顯卡,就能一口氣完整觀看一部《黑悟空》…
" 我喜歡新衣服。要是人們天天都能穿上新衣服,這世上就再也不會有煩惱了。" 2009 年上映的電影《一個購物狂的自白》中,由 Isla Fisher 飾演的女主角瑞貝卡,這樣說道。從科技的視角看,2009 和 2025 有什麽不同?最大的不同,是人們花在線上世界和數字身份上的時間,已經遠超物理世界,…
日常生活中,一提到婚姻關系,不少人調侃雙方像是 " 合租舍友 ",另一半的存在隻是占據了家裏的一個空間而已,就連兩人晚上睡覺也是獨自睡在不同的房間裏。有人認爲,夫妻分房睡其實是在提升相處時的關系質量,讓兩人都能有一定的獨立空間,但也有人認爲這甚至都算不上是親密關系了,長期分房睡肯定會讓雙方的感情日趨…
扳指頭一算,DeepSeek" 哪吒鬧海 " 到現在,居然才剛剛 1 個月整?!這場春節暴擊的餘波未平,就在今天,國内大模型六小強之一的階躍星辰,用一場 Step UP 生态開放日來回應被攪動的風雲——卷技術,更要卷落地。" 要期待明年春節的 AI 可能更強。" 生态開放日上,階躍星辰創始人兼 CE…
請問大家一個問題:" 睡不着的時候,什麽東西看一眼就會犯困?"相信很多人看到這個問題,腦海裏首先想到的就是 " 書 ",尤其是教科書,催眠效果簡直就是立竿見影,隻要翻開一本專業書,就像陷入了某種催眠術一樣,要不了多久就呼呼大睡。奇怪的是,好像也不是所有的書都很催眠,比如很多人看網絡小說,甚至都能通宵…
《哪吒 2》火了,電影裏蠢萌蠢萌的土撥鼠也火了。在一些平台上,網友們曬出自己跟土撥鼠的合影,甚至學哪吒戳起了土撥鼠的鼻子——媽呀,這是不要命了嗎?!土撥鼠可是鼠疫杆菌的重要宿主!土撥鼠是旱獺的俗稱,幾年前就因爲 " 土撥鼠叫 " 的視頻走…