以下文章來源于非凡油條 ,作者小白菜
重要通知
一個好消息,我們在知識星球開辟了第二戰場【非凡油條】,有很多在公衆号不方便說的東西、一些相對私密的個人見解(涉及經濟、投資等)、一些财經方面的重要資料,我們都會發在知識星球的非凡油條專欄上,供大家學習交流。
此外,我們也會在知識星球【非凡油條】不定時開設一些重要的自學課程,比如下周即将開始的 AI 辦公工具學習課程。
具體的加入方式,以及更詳細的介紹在文末二維碼,大家可以到文末查看。
2023 年春季,ChatGPT 無疑是整個互聯網世界的 " 頂流 ",其驚人的語言對話能力給 AI 領域帶來的沖擊更甚于七年前與世界冠軍李世石對戰圍棋的 AlphaGo。3 月下旬,OpenAI 宣布 ChatGPT 接入第三方插件,這意味着它開始從聊天機器人蛻變成開發者平台。國外的 AI 技術不斷叠代,國内各大巨頭雖有布局,卻仍有差距。同時,熱度之外,ChatGPT 也因其安全隐患遭多方禁用,人們對新技術的狂熱追逐還未退潮,對 AI 可能引發的各種風險的擔憂卻持續升級。
ChatGPT 火遍全網,卻因其缺陷備受質疑
功能單一、數據過時
2022 年 11 月 30 日,美國矽谷初創公司人工智能研究實驗室 OpenAI 發布了 ChatGPT(全稱爲 "Chat Generative Pre-trained Transformer")并開放試用。
短短幾天,就吸引了超過 100 萬用戶注冊,僅僅過了 2 個月,月活躍用戶就已經過億,打破了此前 Tik Tok 用九個月時間将用戶數累計到 1 億的速度。
互聯網上對 ChatGPT 的讨論熱火朝天。無論是傳統的 NLP(自然語言處理)任務,如抽取、分類,還是寫代碼、作詩等,ChatGPT 都可以通過多輪對話的方式給出流暢的結果。
熱烈的讨論聲中,很多人驚呼:"《流浪地球 2》裏那個不斷自我學習,最終演化出自主思維的‘ MOSS ’,或許離我們已經不遠。"
人工智能現有的基本模型是以邏輯推理爲核心的符号主義 AI、以數據驅動爲核心的連接主義 AI(深度學習)、以反饋控制爲核心的行爲主義 AI(強化學習)。而 Chat-GPT 正是對現有人工智能方法和技術的創新性整合。
在 " 數據是燃料、模型是引擎、算力是加速器 " 的驅動下,以深度學習爲核心的人工智能正猶如水和電一樣賦能人類社會。
ChatGPT 恰如其分地體現了 " 數據、模型和算力 " 的特點:ChatGPT 的訓練使用了 45TB 的數據、近 1 萬億個單詞(大概是 1351 萬本牛津詞典所包含的單詞數量);使用了深度神經網絡、自監督學習、強化學習和提示學習等人工智能模型。
訓練 ChatGPT 所耗費的算力大概是 3640 PetaFLOPs/ 天,即用每秒能夠運算 1000 萬億次的算力對模型進行訓練,需要 3640 天才能完成。
在大數據、大模型和大算力的工程性結合下,ChatGPT 展現出強大的統計關聯能力,可洞悉海量數據中單詞 - 單詞、句子 - 句子等之間的關聯性,體現了語言對話的能力。
因此,在不少計算機領域業内人士看來,ChatGPT 的橫空出世,給 AI 領域帶來的沖擊,更甚于七年前的 AlphaGo 戰勝圍棋世界冠軍、職業九段棋手李世石的那場圍棋人機大戰。
不過,在 3 月之前," 頂流 "ChatGPT 仍然因爲一些缺陷和限制而受到質疑:
首先,此階段的 ChatGPT 本質上更像是一個基于語義模型和預訓練的聊天機器人,功能比較單一。
其次,其數據庫隻更新至 2021 年 9 月,它所具備的參數和數據都是過去的數據,這些數據難以被更新,意味着我們無法通過它獲得新聞或最新的數據。
這也是爲什麽一旦用戶提出的問題涉及到該時間點以後的内容,ChatGPT 不是回複 " 不支持 ",就是直接向用戶返回編造的錯誤信息。
第三,ChatGPT 并不具備 " 記憶功能 " 和 " 理解功能 ",這意味着你先前所詢問的一些問題,GPT 無法記住,當你重複詢問同樣一個問題,會獲得截然不同的甚至是随機的答案,因爲它不 " 理解 " 你的問題。
最後,ChatGPT 會生成甚至僞造許多的參考文獻、不存在的網址或者生成大量 " 不負責任 " 甚至極其随機的回答。
比如,随着全球的用戶參與訓練,很多種族主義的詞彙或者是一些奇怪的異國概念進入數據庫中,當這些對話被作爲參數參與訓練 AI 很可能得到完全無法理解的結果。
ChatGPT 接入插件,不再隻能 "Chat"
聊天機器人變開發者平台
面對數據過時、功能單一、随機性回答等缺陷,OpenAI 終于要做出改變了。
當地時間 3 月 23 日,OpenAI 宣布 ChatGPT 能夠支持第三方插件接入,這些插件是專門爲 " 以安全爲核心原則的語言模型設計的工具 ",可幫助 ChatGPT 訪問最新信息、運行計算或使用第三方服務。
本次接入的插件包含兩大類:
ChatGPT 直接從互聯網上實時獲取内容之後,在體驗上已經與微軟的 New Bing 不相上下。
其次是來自其他公司的第三方插件,首批參與插件創建的廠商包括 Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram 和 Zapier。
除了聯網,這些插件使得 ChatGPT 能連接到第三方應用程序,之後 ChatGPT 便能夠與開發人員定義的 API 進行交互,從而增強 ChatGPT 的功能并允許其執行範圍廣泛的操作:
舉例來看,上述名單中,Wolfram 開發的 Wolfram Alpha 是一套十分強大的科學問答系統,其數據來自各大學術網站、出版刊物與科學機構,用戶可以從 ChatGPT 中選擇并安裝 Wolfram 插件,從而提高其計算智能。
Open Table 插件允許聊天機器人搜索可預訂餐廳;Instacart 插件允許 ChatGPT 在本地商店購物;Zapier 可以與谷歌表格、Trello 和 Gmail 等應用程序連接,适用于辦公場景。
爲了促進新插件的創建,OpenAI 已經開源了知識庫檢索插件的代碼,開發者可以在其中創建并分享自己的插件,以造福用戶。
如果說 ChatGPT 是人工智能的 iPhone 時刻,那麽加入了第三方插件,就是 ChatGPT 的 App Store 時刻了。
這使得 ChatGPT 不再隻是一個聊天機器人,而成爲一個開發者平台,從而進一步鞏固其主導地位。
在商業層面,先前單純的 AI 聊天機器人其實并沒有太大的盈利想象空間,畢竟如今大衆對于 ChatGPT 的熱衷主要是新鮮感在驅動,單純靠 ChatGPT Plus 這一付費訂閱無法負擔其驚人的算力成本。
但當 ChatGPT 實現接入第三方插件之後,相當于是 Chrome 有了 Chrome 應用商店,從而有了更廣闊的盈利空間。
目前,OpenAI 優先考慮少數開發者以及 ChatGPT Plus 的付費用戶能夠使用測試版插件,未來會更大規模地向更多用戶開放。
值得注意的是,ChatGPT 的聯網可能也會帶來一些風險:聯網之後它可能會執行惡意指令,例如發送欺詐性和垃圾郵件、繞過安全限制誤導用戶或濫用他人信息。
不過 OpenAI 表示,已經在内部和外部實施多項保障措施以防止上述情況發生。他們仍在不斷學習,希望能打造出既有用又安全的 AI。
巨頭們紛紛出手,中國 GPT 時刻來臨
"BAT",華爲,京東都在布局
美國的 ChatGPT 不斷叠代進化,壓力給到中國的大廠這邊。
當 ChatGPT 橫掃中國輿論場時,國人無比期盼自己人能開發出同類産品,并與之同台競技。而過去 10 年在 AI 領域投入超過 1100 億元研發費用的百度,自然成爲被關注的對象。
在外界的翹首以盼中,文心一言的新聞發布會如期而至。
3 月 16 日下午,百度開啓新一代大語言模型、生成式 AI 産品文心一言測試,從而成爲第一家加入該賽道競争的中國企業。
在發布會現場,百度創始人、董事長兼首席執行官李彥宏通過問答的形式,展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模态生成等五個使用場景。
除了百度推出中國版 ChatGPT,騰訊、阿裏、華爲、京東等巨頭都有布局大模型的研發,而且也有相應的産品推出。
2022 年 4 月,騰訊對外披露混元大模型。
今年 3 月 22 日,騰訊科技發布 2022 年年度報告,表示在 AI 大模型(預訓練大模型)領域,騰訊混元 AI 大模型覆蓋 NLP(自然語言處理)、CV(計算機視覺)、多模态等基礎模型和衆多行業與領域模型,未來騰訊将繼續投入大模型技術以促進産品創新及運營效率。
阿裏也不甘落後,2022 年 9 月,阿裏發布通義大模型系列。
同年 11 月,阿裏推出 AI 開源社區 " 魔搭 "(ModelScope),旨在打造下一代開源的模型即服務共享平台,緻力降低 AI 應用門檻。
2023 年 3 月,阿裏在 " 魔搭 " 上線了 " 文本到視頻生成擴散模型 ",隻需要在該模型中輸入文本,即可返回符合文本描述的視頻,并且該模型能夠基于文本描述進行推理,。
據官方介紹,該整體模型參數約 17 億,目前僅支持英文輸入。
華爲的盤古系列也深受市場關注。
據悉,華爲在 2020 年就開始布局大模型,2021 年 4 月的華爲開發者大會 2021(Cloud)上,華爲雲便發布了盤古系列超大規模預訓練模型,其中鵬城盤古大模型是業界當時首個千億級生成和理解中文自然語言處理大模型。
在産業化方面,華爲已發起了智能遙感開源生态聯合體、多模态人工智能産業聯合體,智能流體力學産業聯合體等。
2 月 10 日,京東雲旗下言犀人工智能應用平台宣布将整合過往産業實踐和技術積累,推出産業版 ChatGPT:ChatJD,其參數量預計爲千億級别,并公布了 ChatJD 的落地應用路線圖 "125" 計劃。
"125" 計劃包含一個平台、兩個領域(零售和金融)、五個應用(内容生成、人機對話、用戶意圖理解、信息抽取、情感分類)。
國内大廠紛紛官宣各自國産版 ChatGPT 的規劃及進度,人工智能産業的發展看起來一片繁榮,但我們不得不承認的是:迄今爲止,國内尚未有任何一家公司或者科研機構能夠做出與 ChatGPT 同等效果的成果。
俗話說,萬事開頭難。從樂觀的角度看,國内 GPT 百家争鳴的現狀總還是一個好兆頭,這預示着一個正在進步的人工智能市場。隻有不斷優化産品和完善技術,推進行業内的合作和交流,才能夠推動人工智能技術的發展和普及,更好地滿足用戶的需求和創新。
多次涉嫌洩密,ChatGPT 遭多方禁用
該何去何從?
ChatGPT 的風險遠不止聯網帶來的執行惡意指令風險,更重要的是安全隐患。
前不久,據 SBS 等韓媒報道:三星剛引入 ChatGPT 還不到 20 天,就發生了 3 起機密數據洩漏事件,涉及三星半導體設備測量資料、産品良率等信息。
實際上,最初三星因擔心内部機密外洩,一直禁止員工在工作中使用 ChatGPT。
然而,随着 ChatGPT 進入各個企業的步伐加速,越來越多員工認爲技術需要叠代變化,加之半導體本身就是構建 " 生成式 AI" 的核心要素,于是三星決定:3 月 11 日起,半導體設備解決方案(DS)部門可開始使用 ChatGPT。
一般來說,企業在引入新技術時,都會對員工進行相關的培訓和教育,讓員工了解新技術的使用方法和注意事項,避免因爲員工的不當操作而導緻機密洩漏等安全問題。所以,三星向員工發出了提醒:" 注意公司内部信息安全,不要輸入私人内容。"
但現實是,三星剛允許員工使用 ChatGPT 不到 20 天,已掌握到的數據洩露事件就有 3 起—— 2 起設備信息洩露和 1 起會議内容洩露。
此外,Cyberhaven 的一項統計結果告訴我們,ChatGPT 提高工作效率是真的,但它會把對話内容作爲訓練數據也是真的。
近 160 萬名打工人中,有 8.2% 的員工在工作場所使用過它——許多人稱,因爲使用 ChatGPT,他們的工作效率 " 提高了 10 倍 "。同時,有 6.5% 的員工表示會将公司數據複制到 ChatGPT 中,更有 3.1% 的員工表示曾将公司的機密數據放入 ChatGPT。
與之相對應的,越來越多企業因擔心機密數據外洩,禁止員工訪問 ChatGPT。
除了上文的三星,還有摩根大通、美國銀行、花旗集團、高盛、德意志銀行等。近期,軟銀也向全體員工通報了禁止向 Chat-GPT 輸入機密信息等注意事項。
除了會把對話内容作爲訓練數據,從而洩露企業機密,ChatGPT 還曾洩露用戶隐私。
3 月 20 日,多名 ChatGPT 用戶表示在自己的曆史對話中看到了他人的對話記錄。還有不少 ChatGPT Plus 用戶在 Reddit 和 Twitter 等平台發出截圖,表示在他們的訂閱頁面上看到了其他人的電子郵件地址。
3 月 25 日,OpenAI 發布聲明承認,由于開源代碼庫中存在一個漏洞,部分用戶能夠看到另一個用戶的聊天标題記錄,此前已将 ChatGPT 短暫下線并緊急修補此漏洞。
此外,OpenAI 表示,在特定的 9 小時窗口期内,1.2% 的付費版用戶的個人支付信息可能被洩露。部分用戶可能會看到另一名活躍用戶的姓名、電郵、支付地址、信用卡後 4 碼、信用卡到期時間等信息。
爲此,意大利個人數據保護局 ( DPA ) 以 " 非法收集個人資料;未成年人年齡核實系統缺失 " 之名宣布禁用 ChatGPT。DPA 聲稱,對 ChatGPT 可能侵犯隐私以及未能按要求驗證用戶年齡爲 13 歲或以上表示擔憂,并将開始立案調查。
這成爲第一起政府禁止使用聊天機器人的案例。
海量數據的積累确實可以帶來人工智能的生産力質變,同時,從互聯網誕生起就始終萦繞左右的數據安全、隐私保護等問題,也成爲了人工智能大模型無法回避的伴生難題。
如何确保數據授權、界定數據安全的責任與科技公司的義務,規避隐私洩露、知識産權等風險,這些都将是人工智能在大規模介入公共領域後,必須首先解決的問題。
在全球大賽跑的背景下,既要提前設定紅線和規則以保護公民數據安全,同時,又要防止監管過度帶來的創新不足問題,這是各國共同面對的政策難題,隻有找到兩者之間的平衡,才能既能享受新技術發展帶來的便利,又能保護信息安全。
于是昨天國家互聯網信息辦公室就《生成式人工智能服務管理辦法(征求意見稿)》公開征求意見,其中就提到了提供生成式人工智能産品或服務應當遵守法律法規的要求,尊重社會公德、公序良俗。
AI 還是要 " 管 " 起來。
在知識星球【非凡油條】裏,你可以獲得的:
1
重大财經新聞的分析,主要針對它對我們普通人的影響,以及可能的對 A 股大盤形勢的影響。
2
免費提問,随時可以向我提出财經或是生活上的問題,在不涉個人隐私的情況下我盡量解答。
一些公衆号上不方便談的話題,都會在知識星球裏發布。
3
财經方面的資料分享,比如行業研報,相關論文,都會發在裏面。
4
不定時開設一些自學課程,比如下周開始的 AI 辦公工具學習課程,我會帶着大家一起學習前沿新知識,提高工作能力
" 非凡油條 " 目前年費爲 100 元,非常優惠,以後會逐漸提價。這個價錢很值,能讓你避免幾十倍、幾百倍的損失。