背後是僅 4 人的華人團隊。
華人團隊、估值過億、OpenAI 聯創參投,視頻 AI 生成工具 Pika1.0 一誕生就疊滿 Buff,短短幾天火爆全網,社區用戶超 55 萬,被網友評價爲目前最好的視頻生成工具,俨然成了同類公司 Runway 創建的 Gen-2 的最強競品。
Pika1.0 背後的公司 Pika Labs 成立于今年 4 月,主打 " 讓每個人都成爲創意視頻導演和制作人 "。目前,Pika 1.0 能制作 3D 動畫、動漫或電影等各種類型的視頻,還支持畫布延展、局部修改、視頻時長拓展等編輯功能。網友實測,相比 Gen-2,Pika1.0 在生成電影鏡頭方面更勝一籌。
短短幾個月,Pika Labs 就已獲得 5500 萬美元的融資,估值超 2 億美元,該公司的投資人列表中淨是人工智能領域的熟臉,包括 OpenAI 的聯合創始人 Andrej Karpathy、Hugging Face 聯合創始人兼 CEO 的 Clem Delangue。
更值得一提的是,Pika Labs 是一個僅 4 人的華人團隊,創始人郭文景、聯合創始人兼 CTO Chenlin Meng 曾是斯坦福大學 AI Lab 博士生;第三位創始人 Karlin Chen 擁有 CMU 的 ML&CV 碩士學位,曾在商湯擔任工程師;4 号員工 Matan Cohen Grumi 是創意總監,他還是一位電視廣告導演。
有趣的是創始人郭文景和團隊創建 Pika1.0 的原因:Gen-2 不好用。
Pika1.0 擅長做電影
在文本生成視頻、圖像生成視頻的常規 AIGC 功能外,Pika 1.0 不僅能讓視頻風格實現轉換外,還可以直接完成内容編輯、更改畫幅等動作。這些功能讓 Pika 1.0 将 AI 對視頻的作用力真正從 " 生成 " 轉向了 " 制作 "。
Pika 官方的演示視頻顯示,輸入一段文字,給出人物、場景、風格等需求,這個工具就生成你需要的視頻畫面。例如,輸出 " 馬斯克穿着太空服,3D 動畫 ",一個動畫版本的馬斯克宇航員就出現了,背後還有已經發射成果的火箭,人物外形、動作、背景等元素都十分生動。
除了文字生成視頻,Pika 1.0 也支持圖片生成視頻,輸入圖片與提示詞,圖片畫面将在你的文字描述中動起來。
如果你想給原有視頻換個風格,盡管在文本框裏輸入風格提示,二次元、像素風都能搞定,将所有風格的視頻簡單融合,一個 " 瞬息全宇宙風 " 的視頻就成了。
Pika 1.0 還能夠進行視頻編輯:選定編輯區域輸入提示詞,它就能根據文本提示詞修改特定區域。比如,用鼠标框一下模特的衣服,就能更換衣服的款式和顔色,甚至給大猩猩一鍵戴上墨鏡。
此外,Pika 1.0 還能夠修改輕松修改視頻尺寸,這個技術已經 AI 生圖工具 Midjourney 上實現了,Pika 第一個将這一功能用在了視頻制作上。
有網友拿 " 生成同一婚禮現場 " 對比 Gen2 與 Pika1.0,結論是 Pika1.0 更擅長運用電影鏡頭來提升視頻的豐富度,而 Gen-2 雖然生成的視頻質感更好,但在人物行走的處理上出現了明顯瑕疵。
Hugging Face 的 CEO 在看完 Pika 宣傳片後感歎:"2024 年,某個主流媒體領域将會充斥 AI 生成的内容。"
目前,Pika1.0 支持用戶免費使用,但需要申請名額,有網友形象的形容了 Pika1.0 當前的火爆情況:
總而言之,支持免費試用的 Pika1.0 現在正處于使用名額難求的爆火狀态。
55 萬用戶每周産出百萬視頻
盡管 Pika1.0 更擅長做電影,但它并不是爲專業電影制作而生。" 我們開發的不是電影制作工具,而是爲日常消費者打造的産品。"Pika CEO 郭文景解釋," 雖然我們有創作力,但并不是專業人士,如果有 Pika 這樣的工具,那我們在 AI 電影節上,很可能會大放異彩。"
郭文景與 AI 電影節的故事可以追溯到去年冬天。當時,估值已達 5 億美元的初創公司 Runway 舉辦了首屆 AI 電影節,獎金高達 10,000 美元。郭文景和同幾位斯坦福的同學打算利用寒假時間,用生成式 AI 制作一部電影,而且對獲獎很有信心。
但由于團隊并非電影專業出身,即使有 Runway 的 AIGC 工具 Gen-2,他們做出來的視頻效果也并不理想,最終錯失大獎,這讓郭文景很沮喪。
遺憾正是 Pika 誕生的契機:既然工具不趁手,那就自己造一個。今年 4 月,郭文景和她的同學 Chenlin Meng 從斯坦福辍學,創辦 Pika,
郭文景( 左)和 Chenlin Meng
兩位 " 鐵娘子 " 說幹就幹,火速投入到事業中,3 個月後,Pika 推出了 Discord 服務器,與 Midjorney 的使用方式類似,需要用戶在服務器的聊天框中輸入文本或者圖像來生成簡短視頻,并與社區内的其他人共享。
很快,Discord 上聚集了上萬名 Pika1.0 的用戶,如今,這裏已經有 55 萬人,而且還在快速增長,每周産生數百萬個新視頻。
這家隻有 4 人的初創公司也迅速完成了三輪融資,共計 5500 萬美元。前兩輪由 GitHub 的前任 CEO Nat Friedman 領投,最近一輪 3500 萬美元的 A 輪融資來自 Lightspeed Venture Partners。據福布斯報道,目前,Pika Labs 的估值在 2 億到 3 億美元之間。
Pika 投資人占據了矽谷 AI 領域的半壁江山,其中有 OpenAI 的聯合創始人 Andrej Karpathy、董事會成員 Adam D'Angelo,Hugging Face 聯合創始人兼 CEO Clem Delangue,Perplexity CEO Aravind Srinivas 等。
Lightspeed 的合夥人 Michael Mignano 在今年 9 月投資了 Pika,他曾對這個小團隊給予高度評價:" 對于初創公司來說,最大的優勢是速度,這個團隊的效率是我所見過的最快的。"
GitHub 前任 CEO Nat Friedman 作爲投資者之一,也感歎過 Pika 的高效。據稱,Friedman 在某一天的下午建議他們增加一個将文本嵌入視頻的功能,結果淩晨 3 點鍾,他就被告知,這個功能已經開發完成。
目前,Pika 尚未公布太多關于底層模型運作的技術細節,但 Pika 的效率和産品已經足夠讓風投們興奮。而站在聚光燈下的 Pika,接下來仍要面對更多競争。
就在上周,Runway 也推出了新功能 motion slider(動态筆刷),在圖片上一抹就能變成動态視頻。而 Runway 除了面向消費者外,還與電影制作公司展開了合作。
此外,最受大衆歡迎的文生圖工具 Midjourney 也正在開發視頻功能。
Stability.ai 已經發布了他們的 Stable Video Diffusion 的視頻模型,允許用戶調整各種參數,如叠代步數、重繪幅度等,以幫助創作者控制畫面生成的過程,包括風格、姿勢、線條等特征。SD 還支持物體的 3D 合成。
視頻類 AIGC 賽道大有百花齊放之勢,工具多了,就看創意夠不夠用。