最近,OpenAI 發布了免費機器人對話模型 ChatGPT,一時間火爆全球,成為科技圈第一大熱潮,短短一周吸粉便超過百萬。ChatGPT 也稱為科技圈的必聊話題。如此智能的機器人對話模型,仿佛與我們今天君濤文要和大家分享的是ChatGPT火遍全球,AIGC要統治人類知識圈了嗎? ,歡迎閱讀~
最近,OpenAI 發布了免費機器人對話模型 ChatGPT,一時間火爆全球,成為科技圈第一大熱潮,短短一周吸粉便超過百萬。ChatGPT 也稱為科技圈的必聊話題。
如此智能的機器人對話模型,仿佛與我們記憶中略顯 " 笨拙 " 的機械式 AI 對話已經完全不同。在這些年裡,人工智能創作内容(AIGC)已經飛速成長,甚至在很多領域大大超越了專家學者的精準性和博識水準。
圖:與 ChatGPT 對話
同樣在 2022 年,AIGC 已經出圈過一次。
AI 繪畫憑借其獨特的創意與便捷的創作工具迅速走紅,甚至出現使用 AI 作畫參賽獲獎的新聞;同時,許多 AIGC 方面的公司正在飛速的成長,獲取一筆筆的融資,成為獨角獸公司。
但是,在如火如荼的 AIGC 技術發展中,有一個問題卻始終沒有得到明确的解答,那就是 AIGC 雖然這麼新穎、好玩,但是它的商業化價值到底如何,又能應用于哪些具體的場景呢?
本文就 AIGC 相關信息、落地應用與目前行業面臨的問題進行解讀,為那些對 AIGC 感興趣的讀者與投資人展現目前人工智能生成内容的發展圖景。
1 2022: AIGC 元年
2022 年,深度學習模型 Diffusion 擴散化模型的出現,直接推動了 AIGC 技術的突破性發展,許多基于 StableDiffusion 模型的應用紛紛入局。也正因如此,2022 年被稱為 AIGC 元年。
但在各類使用 AIGC 技術的應用大規模 " 井噴 " 之前,AIGC 也曾經曆了幾十年的發展。
1950 年,圖靈提出了著名的 " 圖靈測試 ",給出了判定機器是否具有 " 智能 " 的方法,即機器是否能夠模仿人類的思維方式來 " 生成 " 内容繼而與人交互。
經過半個多世紀的發展,今天的人工智能不僅能夠與人類進行互動,還可以進行寫作、編曲、繪畫、視頻制作等創意工作。随着人工智能越來越多地被應用于内容創作,人工智能生成内容悄然興起。
目前,對于 AIGC 這一概念的界定,尚無統一規範的定義。而國内産學研各界對于 AIGC 的理解是" 繼專業生成内容和用戶生成内容之後,利用人工智能技術自動生成内容的新型生産方式 "。
而結合人工智能的演進沿革,AIGC 的發展曆程大緻可以分為三個階段:
早期萌芽階段(1950s-1990s),受限于當時的科技水平,AIGC 僅限于小範圍實驗。1957 年,萊傑倫 · 希勒和倫納德 · 艾薩克森完成曆史第一支由計算機創作的弦樂四重奏《伊利亞克組曲》。1966 年,約瑟夫 · 魏岑鮑姆和肯尼斯 · 科爾比開發了世界第一款可人機對話的機器人 Eliza。80 年代中期,IBM 創造了語音控制打字機 Tangora。
沉澱積累階段(1990s-2010s),AIGC 從實驗性向實用性逐漸轉變。2006 年,深度學習算法、圖形處理器、張量處理器等都取得了重大突破。2007 年,世界第一部完全由人工智能創作的小說《1 The Road》問世。2012 年,微軟公開展示了一個全自動同聲傳譯系統,可以自動将英文演講者的内容通過語音識别、語言翻譯、語音合成等技術生成中文語音。
快速發展階段(2010s 至今),深度學習模型不斷叠代,AIGC 突破性發展。2014 年,對抗生産網絡 GAN 出現。2021 年,CLIP 模型出現;OpenAI 推出 DALL-E,主要應用于文本與圖像交互生成内容。2022 年,深度學習模型 Diffusion 擴散化模型的出現。
2 新模型下的 AIGC 所向披靡
過去,互聯網的内容都是由用戶生成、上傳,AI 隻能協助人類完成一部分最簡單、最基礎的工作,無法獨立生成内容,更不用提優質内容了。
但這一狀況也因 Diffusion 擴散化模型的開源應用而被打破,AIGC 成為了繼 UGC 之後的又一大内容生成方式。
相較于 UGC,AIGC 的最大不同是新技術驅動了機器智能創作内容,這使得 AIGC 具有獨特的技術特征,包括數據據量化、内容創造力、跨模态融合、認知交互力等,也正是這些獨有的技術能力,讓 AIGC 成為 " 不可替代 " 的新一代内容生成方式。
(1)數據巨量化:
AIGC 豐富的 " 想象力 " 和驚為天人的 " 創作能力 ",是在海量數據的基礎上由計算機學習和模拟生成的,每一幅 AI 畫作的背後都是無數的标注數據與訓練。卷積神經網絡和 Transformer 大模型的流行成功使深度學習模型參數量躍升至億級,由此帶來的數據巨量化推動了 AIGC 發展的進程。
如知名的計算機視覺項目 ImageNet 在衆包任務中有超過 25000 人參與,标準圖片超過 1400 萬張;而 OpenAI 更是收集了 4 億個文本圖像配對數據進行預訓練。在零樣本學習成熟之前,AIGC 通過巨量數據實現内容創作的發展路線仍難以撼動。
(2)内容創造力:
正是有了海量數據的加成,AIGC 在創作方面有着無限的 " 靈感 ",也成為了 AIGC 最吸引用戶的特色。借助海量的語料庫,AI 工具仿佛超級畫手或作曲家一樣生成指定風格的圖像、音樂或視頻。
同時,例如神經風格遷移算法利用卷積神經網絡識别圖像内容表征和風格表征并在特定神經網絡層對圖像進行重構,也使得 AI 畫作能夠模仿特定風格的藝術作品。
與人類創作過程相比,AI 創作擁有時間短、規模大、風格多等特點,在藝術創作、插畫、影視編輯等領域正在産生變革效應,人們甚至開始擔心 AIGC 會不會沖擊傳統藝術創作者的工作崗位。
(3)跨模态融合:
跨模态融合是 AIGC 區别于傳統 UGC 和 PGC 的顯著特征。AI 能夠分别提取文本特征和圖片特征進行相似度對比,通過特征相似度計算文本與圖像的匹配關系,從而實現跨模态的相互理解。
2022 年 9 月,百度發布 "2022 十大科技前沿發明 ",位列第一的就是 " 跨模态通用可控 AIGC",跨模态生成的本質是文本、視覺、聽覺乃至腦電等不同模态的知識融合,覆蓋圖文、視頻、數字人、機器人等更多場景。
在未來,随着國内外多家科技公司發布多模态 AI 大模型,AIGC 的跨模态融合趨勢将進一步加強。
(4)認知交互力:
擁有一定程度的認知和交互能力,是 AIGC 發展的重要趨勢。
對于開發者而言,代碼的輸入輸出是人與計算機交互的底層邏輯;對于用戶而言,人們使用智能終端和網絡平台實現人機交互和互聯通信。在人工智能場景中,通常利用自動問答、視覺識别、姿态識别等實現人機交互,而 AIGC 的出現則為人與機器的溝通帶來了更多可能,擁有人與人類溝通的媒介,在感知和交互上具備其獨有的特色。
3 AIGC 既是畫家又是主播還是翻譯
在不知不覺中,AIGC 已經滲入了我們的生活中的每個角落,從導航軟件中的 " 人聲 " 指路,到直播賣貨中的 " 虛拟主播 ",都隐藏着它的身影。目前,AIGC 技術已經率先在傳媒、電商、娛樂等領域實現大規模落地。
在最簡單直接的落地領域裡,傳媒行業首當其沖。人機協同,能大幅提高傳媒行業一些基礎工作效率。
AIGC 作為當前最新的内容生産方式,與傳媒工作者協作,為媒體内容生産全面賦能。寫稿機器人、采訪助手、字幕生成、語音播報等相關應用不斷湧現,深刻地改變了媒體生産内容的方式,大大提升了行業生産效率。
在采編環節中,語音轉寫技術大大提升了傳媒人的工作效率。借助語音識别技術,可以将一段采訪稿快速以文字的形式進行輸出,同時兼顧了準确性與時效性。2022 年冬奧會期間,科大訊飛的智能錄音筆便可完成跨語種的語音轉寫,助力記者快速出稿。
科大訊飛智能錄音筆
智能視頻的剪輯,提升了視頻内容的價值。通過使用視頻字幕生成、視頻錦集等視頻智能化剪輯工具,可高效節省人力時間成本,最大化版權價值。2022 年冬奧會期間,央視視頻通過使用 AI 智能内容生産剪輯系統,高效生産與發布冬奧冰雪項目的視頻集錦内容,為深度開發體育媒體版權内容價值,創造了更多的可能性。
在傳播環節,AIGC 技術為社區生态注入了新的活力。以百度為例," 創作者 AI 助理團 " 已在百家号平台上線,作為百度移動生态 AIGC 應用的 " 先遣部隊 ",除 AI 作畫、圖文轉視頻技術外,還推出了數字主持人,為創作者實現更多場景的應用體驗,給予用戶全新的浏覽體驗。
中國青年報和中國青年網官方短視頻品牌 " 青蜂俠 ",就依托百家号平台推出了數字主持人 " 青小霞 ",率先實現了 " 數字主持人自由 "。" 青小霞 " 能高度複刻真人主播的聲音及表情動作,實現高質多量的内容生産和播報,降低媒體運作和内容生産成本,為内容傳播形式注入科技創新力。
在當前,AIGC 已經在電商行業中成熟落地,尤其是虛拟主播等應用産品,已經為不少消費者提供實時服務。
随着數字技術的不斷發展與消費的升級,良好的購物體驗成為消費者越來越看重的地方。而利用 AIGC 技術,可通過快速、準确響應消費者需求與構建沉浸式購物場景的方式來提升消費者的購物體驗。
在構建沉浸式購物場景中,打造虛拟主播是必不可少的環節。這裡的虛拟主播并非是過去我們認為的 " 皮套人 ",而是可以為觀衆提供 24 小時不間斷貨品推薦介紹的 " 數字人 "。虛拟主播有着以下三大優勢:
一是可以代替真人直播,為用戶提供更靈活的觀看時間和更方便的購物體驗,也在為合作商家節省成本的同時創造更大的流量。如歐萊雅、飛利浦等品牌的虛拟主播會在 0 點到 9 點之間進行直播,與真人主播相互配合,提供 24 小時無縫對接的直播服務。
二是虛拟主播可塑造店鋪形象,拉近與年輕消費者的距離。如彩妝品牌 " 卡姿蘭 " 推出自己的品牌虛拟形象,并将其引入直播間作為其天貓旗艦店日常的虛拟主播導購。
三是虛拟主播穩定可控,不會出現 " 人設崩塌 " 的情況。虛拟主播人設、言行舉止等均可由品牌方掌握,對于真人帶貨安全性、可控性更強。品牌方無需擔心虛拟形象人設崩塌,為品牌帶來負面新聞。
目前,由 AI 驅動的虛拟主播擁有多變的形象、媲美真人的聲音和多種直播場景。以京東雲言犀為例,通過自研的 3DNeuralRender 神經渲染器,可以高保真地合成主播面部細節,在互動中,2D 及超寫實、高精度 3D 數字員工驅動方案,實現了音唇精準同步。目前言犀擁有 100+ 的數字人形象,在 2022 年雙 11 期間,在近 200 百家付費品牌店鋪中開播,累計帶來數百萬 GMV 的轉化。
京東數字人:靈小播
對話式 AI 技術主導的智能服務,助力品牌快速響應消費者需求。每年購物節期間,店鋪中的客服數量在面對消費者的海量問題時總會顯得 " 捉襟見肘 ",而任務型對話 AI 則可以扮演客服的角色。
對話式 AI 産品可替代人類對話完成重複性、規則性對話任務,優化重構對話服務的工作流與職能重點,還可為對話服務提供智能調度、坐席助手、對話洞察等輔助功能,與人工坐席并肩作戰,構建輔助培訓、運營管理、指導洞察的良性循環。
在京東言犀平台,依靠領域性大模型 K-PLUG,實現了短文本和長文本的自動生成。目前已經覆蓋了京東的 3000 多個三級品類,累計生成文案 30 億字,應用于京東發現好貨頻道、搭配購、AI 直播帶貨等,累計帶來超過 3 億元 GMV。
在今年雙 11 期間,智能客服累計接待了超 4.5 億次的咨詢服務,迎接了年終最大的流量洪峰,并完成任務。
此外,AIGC 也已經娛樂行業落地開花,拓展了娛樂邊界。
在數字時代,娛樂不僅僅再是遊戲,更是與樂趣的尋找與現代人對歸屬感的渴望。借助 AIGC 技術,通過趣味性圖像、音視頻、虛拟偶像等方式,娛樂行業快速擴展邊界,以另一種面貌獲得全新的發展動能。
趣味性圖像、音視頻生成,激發用戶使用熱情。在圖像生成方面,AI 換臉、一鍵構圖等應用極大地滿足了用戶獵奇地需求。在國外,FaceAPP 一經推出,就立刻病毒式在網絡上引發熱潮,登上 App Store 下載榜首。而在國内,百度文心一格也一度帶起了 AI 作畫的熱潮,以使用便捷、畫作精美、善于東方元素等多個特點,受到了用戶的一緻好評。
文心一格作圖——聖墟
在音視頻生成方面,語音模仿、變聲器等功能,增加了互動娛樂性。騰訊旗下多款遊戲均已集成變聲、語音模仿、自動生産短視頻等功能,讓溝通本身也成為了一種樂此不疲的遊戲。
打造虛拟偶像,釋放 IP 價值。在娛樂賽道中最經典的虛拟偶像群體非初音、洛天依為代表的 " 虛拟歌姬 " 莫屬,而其都是基于 VOCALOID 語音合成引擎軟件為基礎創造出來的虛拟人物,由真人提供聲源,再由軟件合成人聲。
自 2012 年 7 月 12 日洛天依出道,在十年的時間内,音樂人以及粉絲已為洛天依創作了超過一萬首作品,洛天依在為用戶提供更多想象和創作空間的同時,也與粉絲建立了更深刻聯系。
除與粉絲共同創作外,AI 合成視頻、音頻,也幫助虛拟偶像快速出圈,實現變現場景的多元化,目前可通過演唱會、音樂專輯、廣告代言、直播、周邊衍生産品等方式進行變現。
同時随着虛拟偶像商業價值被不斷發掘,品牌方與虛拟 IP 的聯動意願随之提升。如由魔琺科技與次世文化共同打造的網紅翎 Ling 于 2020 年 5 月出道至現在已先後與 VOGUE、特斯拉、GUCCI 等品牌展開合作。
除傳媒、電商、娛樂行業外,金融、工業、醫療等各行各業的 AIGC 技術也都在蓬勃發展、加速落地。從整體來看,AIGC 技術已經開始深入融合到我們生活中的每個角落,其相關應用正加速滲透到經濟社會的方方面面。
4 AI 無所不能了嗎?
在相關應用大量落地,AIGC 技術快速發展的當下,仿佛未來一切都很美好。但我們需要認清的是,目前 AIGC 還處在發展的初期。關鍵技術、企業核心能力和相關法律法規都尚未完善,圍繞着公平、安全、責任的争議日益增多,也引發了一系列亟待解決的問題。
當前,AIGC 關鍵技術不夠成熟,大規模落地仍存在痛點。
随着 AIGC 技術不斷升級,進一步釋放内容生産力,但其在人工智能關鍵技術方面尚存在局限,掣肘産業發展進程。
具體來看,一是人工智能算法方面仍有缺陷,在透明度、魯棒性、偏見與歧視方面仍存在尚未克服的及數據線,導緻算法應用問題重重。二是 AIGC 内容編輯與創作技術不夠完善,人工智能技術加持的内容編輯與創作技術仍然受短闆制約,導緻産業發展存在技術門檻。
大量 AIGC 企業噴湧而出,但是核心能力參差不齊,威脅網絡内容生态健康安全發展。
随着數字技術的開源開放,AIGC 技術研發門檻、制作成本等不斷降低,緻使市場上的平台企業泥沙俱下,企業核心能力不足對良好網絡生态構建造成嚴重障礙。
具體來看,一是内容審核能力有待提升,目前基本審核方式為 " 機審 + 人審 ",機審誤報率偏高,而人審也沒有形成統一标準。審核能力的缺失導緻了包含虛假、不良信息的違法違規内容流出,影響産業甚至整個網絡生态環境。
二是是企業技術管理能力建設不足。由于 AIGC 技術複雜,且具有高動态性等特點,便要求企業具備相應的技術管理能力。但企業具有商業屬性,決定了在資源有限的情況下其往往傾向于自身利益,而對技術安全和制度保障投入不足。
三是是企業風險治理能力尚未完善。當前 AIGC 技術仍處于發展初期,其風險具有未知性和複雜性等特點,很多企業對于對風險的預測、防範和應急處置能力均尚未完善,風險治理理念也未落實到工程技術實踐中。
當前,有關 AIGC 相關規範指引尚需完善,發展與治理之間存在匹配問題。
近年來,人工智能産業規範指引不斷推出,治理體系初顯格局,但随着科技進步加快,制度建設亦步亦趨也未必嚴絲合縫,這又引發了技術創新發展與政策支持、法律規制的匹配問題。
具體來看,一是産業發展需落實支持政策。未來,各地、各部門政策的支持力度、推進落實和動态調整情況将決定着技術與社會的相互建構程度,将對 AIGC 技術在社會情境中的落地與發展起到重要作用。
二是 AIGC 可版權性有待厘清。法律概念的模糊引發司法裁判的不确定,導緻 AIGC 作品存在着著作權歸屬不清的現實困境。這一問題阻礙人工智能技術發揮其創作價值,還有可能稀釋作品權利人的獨創性,威脅他人的合法權益。
三是新技術增加監管難度。是由于互聯網相關技術的發展,造假内容具有分散性、流動性、大規模性和隐蔽性的特點,導緻追蹤難度和複雜性與日俱增,再加上規範指引的模糊和滞後,對内容監管行動造成了嚴重阻礙。
5 寫在最後
AIGC 作為 UGC 後新一類創作方式,是數智時代的典型應用創新,它的快速發展不僅正在革新數字文化創作的生産範式,也在改變用戶與人工智能的交互模式。目前,已經滲透到了傳媒、電商、娛樂等各個行業之中。
但在展望 AIGC 如此美好的未來之前,我們需要明确,現在其仍處于發展的初期,還是存在許多尚未觸達、解決的難題。面對生活中越來越多的人工智能生成内容,如何安全、健康地使用,也将為人類帶來新的難題。
但無論如何,AIGC 作為新一代創作方式,在技術進步的推動下,正處于萬億賽道的新起點。在未來通用人工智能時代中,AIGC 也将拓展出更多應用方式,更好地服務人們的生活。
如 ChatGPT 一樣的 AIGC 産品,終将越來越頻繁地出現在我們的社會場景之中,成為常态。
參考資料:
1.《人工智能生成内容(AIGC)白皮書》,中國信息通信研究院和京東 2. 探索研究院;
3.《AIGC ——打開元宇宙大門的新魔法棒》,招商證券;
4.《AIGC/AI 生成内容産業展望報告》,量子位科技;
5.《人工智能發生了方向性改變,重點關注 AIGC》,中信建投;
6.《人工智能生成内容 ( AIGC ) 的技術特征與形态演進》,李白楊,白雲,詹希旎,李綱。
本文來自微信公衆号 " 奇偶派 "(ID:jioupai),作者:葉子,編輯:钊
關于ChatGPT火遍全球,AIGC要統治人類知識圈了嗎? 就介紹完了,您有什麼想法可以聯系君濤文。