現在,所有的目光都聚焦在 OpenAI 身上,大家都翹首以待,看他們在發布會活動的最後一天将會帶來怎樣的驚喜。
12 月 20 日,OpenAI 爲期 12 天的發布會已步入第 11 天,即倒數第二天,該公司發布了 MacOS 桌面應用程序及其與各類應用程序的互操作性功能。這将爲 " 代理式人工智能 "(Agentic AI,或稱智能體)的未來奠定基礎,使 ChatGPT 變得更加強大,并無縫集成到用戶的日常工作流程中。
在第 11 天的發布會上,OpenAI 首席産品官凱文 · 韋爾(Kevin Weil)攜手兩位身着聖誕主題西裝的同事,共同探讨了公司最新推出的 MacOS 桌面應用程序。他們着重強調了 ChatGPT 從單純的會話助手向更爲強大的代理工具的轉變,這意味着 ChatGPT 現在能夠代表用戶執行更多任務,爲用戶帶來前所未有的便捷體驗。
1 首推三大功能
目前,用戶已能通過 MacOS 桌面應用程序來查看和自動化他們的 ChatGPT 工作。盡管 2025 年還将有更多類似版本問世,但在此之前,OpenAI 已率先推出了以下三大功能:
第一,借助 "Work with Apps" 功能,用戶現在能夠将 ChatGPT 接入更多編碼應用程序,涵蓋 BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio、AppCode、CLion、DataGrip、GoLand、IntelliJ IDEA、PHPStorm、PyCharm、RubyMine、RustRover、WebStorm、Prompt 以及 Warp 等。
在 MacOS 桌面應用的演示中,OpenAI 展示了人工智能如何深入一個應用程序,獲取并理解其上下文信息。一旦用戶通過 "Work with Apps" 功能選定某個應用,ChatGPT 便能立即接入,洞察應用内部,提供即時幫助。
當然,ChatGPT 不僅僅是一個簡單的查看工具,它依托強大的人工智能模型,能夠執行多種功能。在 Warp 的演示中,ChatGPT 不僅能捕捉用戶屏幕上的内容,還能深入應用内部,浏覽更多信息。例如,在處理長串代碼時,ChatGPT 能夠實現無滾動浏覽,極大地提升了工作效率。
與 Windows Recall 功能相比,ChatGPT 更注重與應用程序的實時協同工作,而非僅僅記錄和構建回憶庫。在另一場演示中,OpenAI 團隊将 ChatGPT 與 XCode 緊密結合,使得它可以在蘋果的開發應用程序中工作。用戶隻需簡單提出請求,ChatGPT 便能生成代碼或解決編程難題。
值得注意的是,OpenAI 還展示了 ChatGPT 的一項新技能:它能夠将生成的代碼直接嵌入 XCode 中,這一功能有望極大地簡化工作流程。盡管在實時演示中,ChatGPT 的代碼嘗試遭遇了兩次失敗,但在第三次嘗試時,OpenAI 團隊成功讓代碼運行起來。
第二,對于利用 ChatGPT 進行寫作的用戶,OpenAI 宣布 MacOS 桌面應用程序現已實現對 Apple Notes、Quip 和 Notion 的支持。在現場演示中,OpenAI 團隊正浏覽一份文檔,該文檔旨在爲 Notion 中的徒步旅行活動制定指南。
有了這個新功能,ChatGPT 得以與 Notion 無縫協作。現場演示聚焦于文檔中的特定文本段落,并設定任務爲 " 補充這些對話要點 "。此外,用戶還可利用 ChatGPT 的搜索功能來生成回應。例如,在演示中,它根據所選文本生成了關于 " 諾頓皇帝(諾頓一世)" 的對話要點,并附上引用及來源。
第三,除了文本選擇、複制粘貼的傳統操作外,MacOS 桌面應用支持高級語音模式,同時能與其他應用程序協同工作。在此模式下,用戶可在 Apple Notes 中設定 " 節日派對歌單 ",并通過 ChatGPT 征詢聖誕老人對候選歌曲的意見。ChatGPT 甚至能指出用戶的錯誤,如将聖誕歌曲《Frosty the Snowman》誤寫爲《Freezy the Snowman》。
這些功能現已正式發布,用戶隻需确保擁有最新版本的 MacOS 應用程序,并訂閱了 ChatGPT Plus、ChatGPT Pro、ChatGPT Team、ChatGPT Enterprise 或 ChatGPT Edu 中的任一服務,即可立即體驗。
在隐私保護方面,OpenAI 特别強調,ChatGPT 僅會在用戶手動觸發的情況下與應用程序進行交互。一旦該功能被激活,用戶将明确知曉哪些内容将被附加到消息中,從而有效緩解隐私方面的擔憂。
2 又曝 AGI 彩蛋
自美國當地時間 12 月 5 日起,OpenAI 開啓了一個密集的新功能發布周期,計劃在接下來的 12 天内通過 12 場直播活動陸續推出新産品和功能。在此之前,OpenAI 已經陸續發布了多項創新,包括 ChatGPT Pro 計劃、強化微調技術、Sora、交互界面 Canvas,高級語音視覺功能、Projects 功能、ChatGPT 搜索、滿血版 o1 模型、通過 API 向第三方開發者開放大模型 o1 系列以及通過電話和 WhatsApp 與 ChatGPT 互動等。
随着發布會接近尾聲,人們對于 AGI(通用人工智能)的關注也愈發高漲。OpenAI 在第 11 天發布會最後表示:" 在第 12 天,我們準備了極其特别的内容,千萬不要錯過哦!"
在演示屏幕的一角,可以看到名爲 "AGI_Interface.swift" 的文件夾。這已經不是過去 12 天裏首次出現此類驚喜了。幾天前,OpenAI 還揭曉了一個名爲 " 超級秘密 AGI" 的日曆活動彩蛋,這無疑進一步提升了人們對這 12 天系列公告的期待,大家紛紛猜測這些公告是否在共同描繪一幅通往通用智能的宏偉藍圖。
OpenAI 還透露,ChatGPT 的 Windows 應用程序也将很快發布。但更令人震驚的消息是,他們确認了一個新智能體的存在,并預計将于 2025 年發布。OpenAI 表示:" 随着我們的模型變得越來越強大,ChatGPT 将展現出越來越強的自主性。"
幾周前,有傳聞稱 OpenAI 正在研發一款名爲 "Operator" 的代理式人工智能,而該公司在第 11 天的發布活動上僅對這一計劃進行了确認。或許,這一舉動背後有着來自競争對手的壓力影響。
近期,谷歌宣布了 Project Mariner 項目,該智能體能夠代表用戶在網頁浏覽器選項卡上進行導航并執行操作。同樣,微軟也推出了 Copilot Vision 功能,它能在用戶的網絡浏覽器中查看内容并提供相關信息。當然,Anthropic 更早之前發布了 Computer Use 功能,它在時間上領先于其他同類工具。
現在,OpenAI 的 12 天系列活動僅剩最後一天,而他們似乎将最精彩的部分留到了最後——一個全新且強大的前沿模型即将亮相。我們将拭目以待,看看 OpenAI 究竟帶來了什麽新産品,以及這個新模型與之前的 o1 模型有何不同。
值得一提的是,一些基準測試已經表明,o1 模型是迄今爲止最強大的人工智能模型之一,甚至在編碼任務方面超越了 Claude 3.5。近日,X 平台的一位用戶據稱發現了 GPT-4.5 模型,盡管該模型目前僅提供有限的預覽功能。
現在,所有的目光都聚焦在 OpenAI 身上,大家都翹首以待,看他們在發布會活動的最後一天将會帶來怎樣的驚喜。