如果試題太簡單,學霸和學渣都能考 90 分,拉不開差距……随着 Claude 3、Llama 3 甚至之後 GPT-5 等更強模型發布,業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織 LMSYS 推出下一代基準測試Arena-Hard,引起廣泛關注。Llama 3 的兩個指令微調版本實…
如果試題太簡單,學霸和學渣都能考 90 分,拉不開差距……随着 Claude 3、Llama 3 甚至之後 GPT-5 等更強模型發布,業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織 LMSYS 推出下一代基準測試Arena-Hard,引起廣泛關注。Llama 3 的兩個指令微調版本實…
百模大戰之後,大夥兒或許有個共識:現在不缺大模型,缺的是怎麽更好地把大模型用起來的方法。有個現成的例子是,印象筆記一直被很多知識工作者當成自己的 " 第二大腦 " 來用,在 AIGC 時代,用戶看到了它更智能的改變。其實早在 2018 年,印象筆記就在 AIGC 的領域裏開啓了自己的摸爬滾打,幾年下…
不知道你有沒有遇到過類似的奇妙瞬間:某天隻是随手翻開了一本書卻發現困擾了自己很久的問題豁然開朗今天是世界讀書日科普中國爲大家準備了一本 " 答案之書 " 關于 5 個你肯定想知道答案的 " 人生問題 "如圖文未加載,請刷新後重試如圖文未加載,請刷新後重試如圖文未加載,請刷新後重試如圖文未加載,請刷…
在一次例行的年度體檢中,張女士收到了讓她略感意外的結果。體檢報告顯示,在她一直認爲平平無奇的頸動脈裏,竟然悄悄埋藏着幾個小小的斑塊。剛拿到報告時,張女士還以爲自己看錯了,因爲除了偶爾的工作壓力,她覺得自己的生活方式還算健康。相信不少人都有過和張女士類似的經曆,體檢中突然就發現了頸動脈斑塊的存在。在我…
作爲一名科技寫作者,我平時會接觸到不少内容創意行業的人,能感覺到這兩年來,大家普遍都有一種情緒:轉型焦慮。不少創作者經曆過互聯網和移動互聯網時代,知識創業如火如荼的迅猛發展階段,建立了自己的 IP 或内容品牌。然而随着近年來流量觸頂、創作門檻日益下沉、内容數量激增,很多創作者都開始感受到了轉型的必要…
馬上喜提五一小長假,很多小夥伴的的旅行計劃都提上了日程。但是出去玩,累了一天回來還要手洗内褲,真的很痛苦!攢起來回家再洗,又擔心細菌微生物會大量繁殖。所以很多小夥伴會選擇一次性内褲,用完就扔非常方便。可是一次性内褲真的安全嗎?有網友表示,自己在穿了不合格的一次性内褲後,不僅沒有更幹淨衛生,反而引發了…
© TED Ideas利維坦按:在聽音樂或閱讀中獲得的這種麻酥酥、渾身過電、起雞皮疙瘩的知覺體驗——我個人更喜歡納博科夫 " 尋找肩胛骨之間的激蕩 " 這一表述,很多年前我也在一首詩中,用 " 後背湧起的海浪 " 來表達這種神奇的感受,算是向納博科夫的一種緻敬吧。在網易雲音樂搜索【利維坦歌單】,跟上…
19 世紀的消防員外套,一隻巨大的蜘蛛懸停在圍棋棋盤上方。這個場景來自于武士英雄源賴光(948 – 1021)的故事。有一次,當他生病時,一位僞裝成大蜘蛛的惡僧前來探訪,源賴光識破了他的僞裝,與蜘蛛僧人纏鬥了起來,而源賴光的四名侍從(當時正在下圍棋)也一躍而起,追蹤侵入者到他的巢穴。© wikime…
( ⊙ _ ⊙ ) 每天一篇全球人文與地理微信公衆号:地球知識局與沙共存文字:林間草木聲校稿:朝乾 / 編輯:果栗乘甘肅蘭州,城關區。實驗室裏,研究人員正在調試參數。" 風洞準備!"" 模型就位!"" 開始了嗎?"" 面對疾風吧!"這并非戰鬥機的測試現場,而是在用專業風洞進行沙漠治理模拟實驗。洞中…
今天是第 55 個世界地球日。今年地球日的主題是" 全球戰塑 "( Planet vs. Plastics),呼籲爲終結塑料污染以确保人類和地球健康,爲地球和人創建一個無塑料的未來。而就在明天,一項全球 " 限塑令 " 即将迎來重要的第四次談判。一百年前,塑料還是偉大發明,如今卻因爲破壞環境、危害人…
這幾天的高溫實在讓人摸不着頭腦,無時無刻都在提醒着我,該準備夏天的衣服啦 ~背心、吊帶,現在穿還早?nonono!春天用它來做内搭可不要太合适。能把衣櫥裏邊無數無聊的外套盤活,内搭換成明豔活潑的背心吊帶,時髦值瞬間翻倍,夏天套上立馬就能出門,時髦不費心 ~考慮到防曬需求," 防曬衣 + 背心 "這個…
自古以來,戰争是人類曆史的重要組成部分,也是很多人關注的主題。在漫長的曆史長河中,人類出現過無數次戰争,一些關鍵戰役直接改變了世界曆史進程。這些戰役不僅是曆史上的重大時刻,也被文學作品生動描繪,爲讀者帶來激動人心的閱讀體驗。許多世界名著都以戰場爲背景,描繪了各種激烈的戰役。在這些經典作品中,戰争不僅…
加班是當代人不想觸碰但又無法完全回避的問題,近日,一項發表在《公共科學圖書館:綜合》( Plos One )上的研究又帶來了一個壞消息,如果你需要加班,經常不規律下班,可能會對身心健康産生不利影響。圖庫版權圖片,轉載使用可能引發版權糾紛一項爲期近 30 年的調查我們常說的 " 朝九晚五 ",其實屬于…
( ⊙ _ ⊙ ) 每天一篇全球人文與地理微信公衆号:地球知識局大海,越來越酸了文字:于婷玮校稿:朝乾 / 編輯:果栗乘2000 年,在墨西哥的一次學術研讨會上,會議的主席不斷提到 " 全新世 " 這個詞。全新世,根據傳統的地質學觀點,是指地質時代的最新階段,開始于最後一次冰川期結束的時候,也就是…
AI 手機、AI PC 硬件新物種正嶄露頭角。高通作爲技術及芯片廠商,所提供的産品和解決方案正在推動 AIGC 相關産業的規模化擴展。在本次 AIGC 産業峰會上,高通公司 Al 産品技術中國區負責人萬衛星分享了這樣的觀點:2024 年,高通會重點支持多模态模型以及更高參數量的大語言模型在端側的部署…
91 行代碼、1056 個 token,GPT-4 化身黑客搞破壞!測試成功率達 87%,單次成本僅8.8 美元 (折合人民币約 63 元)。這就是來自伊利諾伊大學香槟分校研究團隊的最新研究。他們設計了一個黑客智能體框架,研究了包括 GPT-4、GPT-3.5 和衆多開源模型在内的 10 個模型。結…
随着健康觀念的普及,人們已經開始有意識地避開一些含有添加糖的食物了,比如配料表中有白砂糖、蔗糖的食物。有些人以爲這樣就能健康地享受美食了,可殊不知,在不知不覺中又踩了另一個雷,那就是配料表中帶有 "果葡糖漿" 的食物。我們平常喝的碳酸飲料,吃的糖果、巧克力、蛋糕、餅幹、面包等食物裏,都能看到果葡糖漿…
近年來,人工智能(AI)的崛起引起了廣泛的讨論和擔憂,很多人擔心 AI 會造成失業率飙升,而有些樂觀的朋友則戲稱" 隻要電費貴過饅頭,AI 就永遠不能完全代替人 "。雖然這是句玩笑話,但背後則是實實在在的 AI 能耗問題,越來越多的人擔憂高能耗将成爲制約 AI 發展的瓶頸。就在不久前,技術創業者、前…
一個可以自動分析 PDF、網頁、海報、Excel 圖表内容的大模型,對于打工人來說簡直不要太方便。上海 AI Lab,香港中文大學等研究機構提出的 InternLM-XComposer2-4KHD(簡寫爲 IXC2-4KHD)模型讓這成爲了現實。相比于其他多模态大模型不超過 1500x1500 的分…
在 AIGC 時代之下,一家算法公司到底該如何盈利?這,或許就是當下大模型大浪潮推至應用爲王階段,每一個 " 玩家 " 應該思考的最直接的問題。針對這一問題,小冰公司 COO 徐元春在中國 AIGC 産業峰會中,結合自身的數字人與大模型技術,帶來了小冰公司在實踐中所總結的最新思考。爲了完整體現徐元春…
真正高情商的人是什麽樣子的?" 會說話、能來事、朋友多、夠圓滑 " 在人際交往的紛繁世界中,我們常常把這些人視作高情商的典範。他們的存在似乎總能給周圍帶來一股舒适的氣流,讓人在不知不覺中被其吸引,願意進一步深交。然而,我們必須清醒地認識到,表象往往隻是冰山一角,一個人的外在表現與内在情感并非總是一緻…
空間計算的 ChatGPT 時刻還有多遠?這是行業代表玩家最新動作引發的思考。剛剛,Rokid 發布新一代産品Rokid AR Lite,一種空間計算的新範式應運而生—— AR 主機單手操作觸摸屏,在三維空間沿用 " 觸摸 ",零門檻進入 XR 空間。隻需像操控電腦觸控闆一樣,即可和虛拟大屏交互,完…
近日,小龍蝦降價相關信息多次登上網絡熱搜。不少小龍蝦愛好者在評論區直呼 " 高興了 "" 這樣我每天吃兩頓小龍蝦 " ……然而也有一些網友表示擔憂,因爲他們曾聽說:" 小龍蝦生長在臭水溝,喜歡污水,重金屬超标,不能吃 "。那麽,小龍蝦真有這麽髒嗎?圖片截自網絡小龍蝦喜歡污水通常重金屬超标?很多人都聽…
認知科學和哲學的巨人、塔夫茨大學名譽教授丹尼爾 · 丹尼特(Daniel Dennett)逝世了,享年 82 歲。丹尼特在哲學領域做出了重大的貢獻,被稱爲" 進化論四騎士 "之一,是近二十年來西方新無神論運動的領軍人物。他的巨作《意識的解釋》被認爲是心智哲學甚至當代哲學中最重要的著作之一,全方位地對…