機器之心報道
機器之心編輯部
「殺死」OpenAI,小紮這波穩了嗎?
今天淩晨,一年一度的 Meta Connect 大會上發布了一系列以 AI 爲重點的公告。
不隻有最新的 MR 耳機、與 Ray-Ban 合作打造的智能眼鏡,最重要的是,Meta 将在自身的所有通訊類 App、Meta Quest 3 和未來的 Ray-Ban Meta 智能眼鏡中内置生成式 AI 技術驅動的新功能,從多輪對話的 AI 助手到圖像編輯等一應俱全。
所有這些發布涉及的 AI 技術均基于 Llama 2 —— 迄今爲止最強大的開源大模型。不過 Meta 也提前透露了,更強大的 Llama 3 将于 2024 年推出。
Meta 還在 Connect 大會上宣布了全新的圖像生成器 Emu,它将用于爲 AI 貼紙和圖像編輯等功能提供支持。
Meta 版聊天機器人「Meta AI」問世
大模型出現後,科技公司都在推出一系列新的人工智能機器人,引領開源一方的 Meta 也不例外,其正在其消息應用程序中推出一系列新的人工智能機器人,包括 WhatsApp、Messenger 和 Instagram。從本周三起,全新上線的大模型能力可供美國的部分測試版用戶使用。
紮克伯格展示 Meta 版 ChatGPT
這個名爲 Meta AI 的人工智能助手,看起來與 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 2 等聊天機器人非常相似。
紮克伯格表示,用戶現在已經可以通過群聊接受大模型的幫助,與朋友計劃旅行、收獲知識問題回答,并通過微軟的 Bing 搜索互聯網以提供實時網絡結果。
與此前 Facebook 的虛拟助手 M 不同,定制的 Meta AI 助手面向更廣大的用戶群體,而且是完全自動化的,其模型可以參考之前的對話,經過調整可以給出「非常簡潔」的答案。
這意味着最新的 AI 助手需要擁有強大的上下文學習能力。關于如何實現,Meta 也在一篇新論文中介紹了背後的技術:
論文地址:https://ai.meta.com/research/publications/effective-long-context-scaling-of-foundation-models/
在上面這篇論文中,Meta 通過持續預訓練 LLAMA 2 checkpoints 來構建模型,并使用了額外的 4000 億個 token 作爲長訓練序列。在該系列模型中,較小規模的 7B/13B 變體使用了 32768 個 token 序列進行訓練,而 34B/70B 變體則使用了 16,384 個 token 序列。
與現有研究進行的有限評估不同,Meta 使用語言建模、合成任務以及涵蓋長短語境任務的各種實際基準對我們的模型進行了廣泛評估。在語言建模方面,Meta 的模型在上下文長度方面表現出明顯的幂律縮放行爲。這種縮放行爲不僅表明該模型能夠持續從更多語境中獲益,還表明語境長度是縮放 LLM 的另一個重要軸心。在研究基準上将新模型與 LLAMA 2 進行比較時,我們不僅能觀察到在長語境任務上的顯著改進,而且還觀察到在标準短語境任務上的适度改進,尤其是在編碼、數學和知識基準上。
研究人員探索了一種簡單而經濟有效的方法,在沒有任何人工标注數據的情況下,對持續預訓練的長模型進行指導性微調。最終的結果是,在一系列長語境基準測試中,聊天模型的整體性能超過了 gpt-3.5-turbo-16k,這些基準測試包括問題解答、摘要和多文檔聚合任務。
目前,Meta AI 可以在任何聊天中調用。與 ChatGPT 接入 DALLE・3 能力類似,Meta AI 可以利用自家的圖像生成模型 Emu 來生成帶水印的圖像。
除了 Meta AI 之外,Meta 今天還推出了一系列「AI 角色」—— 大模型可以模仿某些名人的個性,包括 Kendall Jenner、德維恩・韋德、MrBeast、帕麗斯希爾頓、Charli D'Amelio 和 Snoop Dogg,其他機器人,包括貝爾・格裏爾斯(Bear Grylls)、Chloe Kim 和 Josh Richards 正在路上。與 Meta AI 一樣,聊天機器人也存在于 Meta 的消息應用程序中,它們有個人資料圖像和時間線,就像真人一樣。當你與他們聊天時,化身會根據對話巧妙地産生動畫。
Meta 表示,爲了保證安全性,其在發布模型之前花費了 6000 個小時尋找有問題的用例并招募員工在内部與模型進行交互。它還聲稱已經開發了新技術來捕獲違反其政策的内容并對其采取行動,阻止 Meta AI 以外的聊天機器人搜索網絡。
圖像生成領域又一選手:Emu
在大會上,紮克伯格還介紹了全新的圖像生成模型「Emu」。
Emu(鸸鹋)的命名方式延續了 Meta 的動物主題。這是 Meta 對 DALL-E 和 MidJourney 等爆火應用程序的正式回應,同時推出的還有「生成式 AI 表情」和「圖像編輯」兩個重點新功能。
由 Emu 提供支持的新功能将允許用戶在幾秒鍾内創建獨一無二的 AI 表情,不久後就将登陸 WhatsApp、Messenger、Instagram 甚至 Facebook Stories 等 Meta 旗下的應用程序。
紮克伯格表示:「人們每天都會發送數以億計的表情來表達聊天内容。每一次聊天都是不同的,人們想表達的情緒也有微妙的不同,但現在我們隻有固定數量的表情。有了 Emu,你就可以随意輸入想要的東西了。」
具體來說,想使用這一功能,用戶可以在文本框中輸入想看到的圖片:
Meta 表示,生成多個即時分享選項平均需要三秒鍾。
此外,Meta 還即将在 Instagram 應用程序中推出「圖像編輯」功能。用戶可以改造自己的圖片,或與朋友共同創建 AI 生成的圖片,同樣由 Emu 的技術提供支持。
以「風格重塑」(Restyle)選項爲例,通過輸入「水彩」或更詳細的提示詞,用戶可以改造圖片的視覺風格:
現場,紮克伯格演示了對自己的狗狗「Beast」照片的編輯,将其變成了折紙和十字繡的風格:
再比如,利用「背景」(Backdrop)選項,用戶可以通過提示詞來改變圖像的場景或背景:
在最新公布的論文中,Meta 也介紹了 Emu 背後的技術細節:
論文地址:https://ai.meta.com/research/publications/emu-enhancing-image-generation-models-using-photogenic-needles-in-a-haystack/
具體來說,Meta 在 11 億的圖像 - 文本對上預訓練了一個潛在擴散模型 ( LDM ) ,并在從大量圖像語料庫中手工挑選出的幾千張高質量圖像上對模型進行了質量調整。鑒于圖像選擇的标準具有主觀性和文化依賴性。Meta 在此過程遵循了一些常見的攝影原則,包括但不限于構圖、照明、色彩、有效分辨率、焦點和故事性。
通過對潛在擴散架構進行一些優化,Meta 建立了一個強大的預訓練模型,并通過質量調整大大提高了生成圖像的視覺吸引力,也就是 Emu。在視覺吸引力方面,Emu 的表現明顯優于當前的開源 SOTA 模型 SDXL v1.0 ,如下圖所示。
此外,Meta 還驗證了質量調整是一種通用方法,對像素擴散和遮罩生成 Transformer 模型同樣有效。
Meta AI 接入微軟必應網絡搜索
我們知道,自 AI 大模型火爆以來,OpenAI 與微軟的合作可稱得上是迅速、緊密且全面,從搜索引擎到辦公軟件,不一而足。
此次,Meta 也尋求自身與微軟的進一步合作,在 Meta AI 聊天體驗中接入了微軟必應網絡搜索。此前 7 月,Meta 和微軟就曾宣布在 Windows 和 Azure 上支持 Llama 2 系列大語言模型。
微軟 CEO 納德拉分享微軟與 Meta 合作的消息
微軟副總裁兼消費者首席營銷官 Yusuf Mehdi 介紹了雙方的合作。他表示,微軟與 Meta 合作,将必應集成到 Meta AI 的聊天體驗中,通過訪問實時搜索信息來提供更即時、最新的答案。我們來看紮克伯格在現場的演示。
除了 Meta AI 聊天機器人,必應還将集成到 Meta 的其他産品,比如在 WhatsApp、Messenger 和 Instagram 中發送消息。
圖源:推特 @AmadeusSVX
雙方的合作将加速 AI 時代的創新,未來将持續拓展合作關系,爲人們常用的産品提供更強大、有用的 AI 體驗。
對于 Meta 與微軟的合作,有網友做了一些有趣的梗圖,比如「殺死 OpenAI」。
圖源:推特 @B0wr1ng
你覺得小紮這波穩了嗎?
參考鏈接:
https://about.fb.com/news/2023/09/introducing-ai-powered-assistants-characters-and-creative-tools/
https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565