圖片來源 @視覺中國
文 | 雷科技 Ieitech
原本小雷還以爲「2023 年是屬于元宇宙的一年」,實在沒想到以 ChatGPT 爲代表的 AI 技術能在這麽短的時間内搶走元宇宙的風頭,成爲 2023 年的技術關鍵詞。從 OpenAI 到搜索引擎、從繪圖工具到遊戲公司,幾乎所有「稍微出名點」軟件企業都在今年推出了自己的自然語音 AI 對話模型。
但可惜的是,本應「造福所有人」的 AI 技術,卻不是每個人都用得上。比如有的 AI 模型嚴格限制使用者的 IP 地址,有的 AI 模型動不動就會封禁某個區域的用戶賬号,相比之下那些「資源有限」要求排隊抽簽領取測試資格的 AI 模型都變得那麽的平易近人。
當然了,有使用門檻就意味着有信息差,也意味着有人可以用這個信息差「大賺一筆」:在 Google Play、App Store 甚至是微信小程序平台,我們可以找到各式各樣的 AI App。他們有些調用的是 OpenAI 給出的免費接口,有些則直接挂羊頭賣狗肉,用貨不對本的低級 AI 模型來糊弄用戶。但有一點這些 App 倒是表現出驚人的一緻性:他們要麽全是廣告,要麽向用戶收費。
不過這些 App 的好日子馬上就要結束了。
圖片來源:OpenAI
前段時間,推出了大量成功 AI 模型的 OpenAI 更新了招聘職位列表,開始尋找「移動工程師」,簡單來說就是正在組建移動平台上的 AI 團隊。沒錯,OpenAI 終于要對移動互聯網生态下手了。
姗姗來遲的 AI 移動端
盡管 OpenAI 這才開始組建移動團隊,其他幾大 AI 平台行業也都不約而同地選擇了浏覽器(網頁端)作爲自己的主要載體,但從 App Store、Google Play 等平台的搜索量以及第三方 App 的下載量來看,移動端 AI 顯然有着極爲廣闊的市場前景:
比如文心一言才發布沒多久,在 App Store 上就出現了很多「第三方文心一言」App。這些 App 從 LOGO 到文案介紹都和文心一言别無二緻,再配上有模有樣的圖片展示,讓很多網友們以爲,這就是百度官方推出的文心一言 App。小雷不久前也和大家分享過這些山寨 AI App 的事情,有興趣的話可以點擊(https://www.leikeji.com/article/56192)重溫。
雖然小雷不建議大家使用這一類「第三方 AI App」,但從下載量來看,确實有不少人對這種手機 AI App 有迫切的需求。不過話又說回來,爲何各大 AI 模型都還隻提供浏覽器的訪問入口?在移動平台上部署 AI,真就這麽難嗎?
從開發者的角度看,「将 AI 模型帶到移動平台」具體可以分爲兩種情況:隻在本地部署前端,模型放在遠端的「在線模型」以及将整個 AI 模型部署在移動設備上的本地模型。
我們先說第一種,所謂「隻有前端在本地」這個方案其實已經非常成熟,成熟到無數「第三方 AI App」都已經實現了這個需求。簡單來說,隻部署前端指的是用戶手機上安裝的 App 隻負責用戶界面等軟件交互,實際上所有的數據都通過 AI 模型的 API 發送到對應的遠端服務器中。舉個不太恰當的例子;用戶安裝在手機裏的 App 隻不過是一個外賣軟件,實際炒菜的是外面的餐廳。至于最終炒菜的餐廳是「麗晶飯店」還是「麗晶蒼蠅館」,用戶并不知悉。
在這裏小雷也必須澄清一點,這類隻提供前端的第三方 App 并非都是「偷蒙拐騙」的 App,有些 App 确實能解決 OpenAI 的 ChatGPT 在使用上的不便。如果大家有使用過 ChatGPT,應該對它複雜的訪問環境要求和煩瑣的登錄驗證流程有印象。即使小雷品是都是通過 Google 直接登錄,但反複的驗證确實也非常麻煩。
而有些第三方 App 就在本地重寫了 ChatGPT 的交互,優化了原本使用浏覽器時的不便。這類 App 通常需要用戶自己在 OpenAI 的控制闆中生成自己端口的 API(AI ID)并添加到 App 中。
可能有人覺得這類 App 技術技術含量低,但至少從 OpenAI 招聘啓事來看,他們正在組建的移動 App 團隊,采取的也是這種方案。對于采用這種方案的 App 來說,它的難點主要在于如何把一個有潛力成爲國民級 App 的交互界面設計得更人性化,而不是像某個真國民級 App 那樣讓全國人民教産品經理做軟件。
換句話說,這種 App 做起來并不難。但作爲對比,采用第二種方案開發的 App,它的工程難度高了可不止一點半點。
移動 AI 之難,難于上青天
從技術的角度看,完全在移動平台上部署 AI 模型背後的技術難點可以分爲五個部分:計算資源限制、網絡資源限制、電量限制、儲存空間限制和信息安全限制。
一般來說移動設備的計算資源通常有限,而深度學習模型需要大量的計算資源。因此在移動平台上使用 AI 的用戶一般會使用專門爲移動設備設計的硬件來提高計算速度,比如筆記本電腦就會配備更适合 AI 加速的專業顯卡。
但很顯然手機上沒有用來加速 AI 運算的專業 GPU,甚至在大多數手機移動平台上,和 AI 最沾邊的不是神經網絡單元 NPU 就是用來處理相機圖像信号的 ISP。當然了,開發者也可以調整 AI 模型的邏輯,讓 AI 主動适應移動平台上并不充裕的計算資源。隻不過出來的效果可能就隻有 Siri 的級别了。
網絡資源限制聽起來有些矛盾,畢竟我們讨論的是部署在移動設備本地的 AI 模型。但如果大家有試過在本體部署 AI 模型,應該明白不斷更新的網絡資源對 AI 模型的重要性。
電量限制和存儲空間無需多講——深度學習模型需要進行大量的計算,這會導緻移動設備的電量迅速耗盡,這對于本上就不以續航見長的智能手機來說則更是要命。另外在計算機科學領域有一句非常著名的話叫「空間換時間」,簡單來說就是算法的「空間複雜度」和「時間複雜度」通常無法兩全——想要在手機上部署并維持一個好用的 AI 模型?OpenAI 你問過手機裏那一個文件保存 5 份還會過期的國民級 App 了嗎?
信息安全限制聽起來很複雜,但是實際上非常簡單:在移動設備上運行 AI 模型需要使用大量的用戶數據,而手機這個載體記錄的個人數據已經遠遠超過了其他個人電子設備。我們該如何保證 AI 拿到所有信息都是我們「想讓 AI 知道」的呢?
我們需要怎樣的移動 AI?
雖然讓 AI 登陸手機背後有無數的難點,但作爲一個 AI 模型用戶,我不得不承認 AI 技術的加入将對整個手機行業帶來天翻地覆的變化,甚至有可能打破 iOS 與 Android 之間「一超多強」的格局。
一旦 AI 模型登陸手機平台,首先可以肯定的是上遊 SoC 供應商會積極改變産品策略,大幅提升 SoC 中用于 AI 運算的 NPU 數量和性能。AI 也不再是我們評判手機拍攝表現時的指标,而是成爲一個通用的綜合能力指标,甚至跑分軟件都會争相加入對 AI 算力的測試環節。
而在用戶層面,AI 技術的加入也将解決一些過去手機中那些有大量數據,但因算力不足而無法解決的問題。比如用 AI 學習用戶的臉部變化,從而提供更安全的口罩人臉解鎖或聲紋解鎖,或者利用 AI 學習用戶的使用習慣,從而在用戶橫着掏手機時精确判斷用戶意圖并打開相機自動拍攝。針對采用曲面屏的手機,AI 的加入可以根據用戶拿手機的方式提供更智能的邊緣防誤觸策略。
至于 AI 在相機領域的應用更是一絕:在 AI 的幫助下:某些手機品牌可以跳過拍照的步驟,直接「增強」一張月亮照片出來。實際上,對智能手機行業來說 "AI" 并不是陌生的詞彙,甚至早在七八年前,就已經有手機廠商宣布會借助 AI 能力對手機體驗進行優化,而發展至今 AI 也依然潛藏在我們的手機裏。
但我們需要認識到的是,ChatGPT 技術發展的速度、所展現的能力遠不是智能手機上那種 " 增強 AI" 可比的,如果類似的大模型 AI 真的深入到智能手機中,說不定直接會讓智能手機變成一個全新的品類。
但如果 OpenAI 隻想打造一個适用于移動端的 App,那麽手機廠商暫時還不用過多擔心,甚至可以嘗試和 OpenAI 合作說服他們開放接口,好讓這種 AI 能力接入到手機的各個應用層面之中。
當然了,AI 模型的加入也會爲手機帶來真正智能化的語音助手,而當大型 AI 模型真正在用戶手機上部署時,Siri 也應該擺脫「人工智障」的外号了吧。隻是又有多少 iPhone 存得下一個完整的 AI 模型呢?
但願 AI 時代沒有 64GB 的 iPhone。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App