大語言模型 LLM 是這幾個月熱度最高的全球明星。目前看來,AI 逐漸走向複雜專業的白領型崗位,已經是必然的趨勢。
OpenAI 剛剛發布的 35 頁論文中,提到了最容易受到 LLM 影響的職業中譯員和筆譯員排名第二。
以前機器翻譯就是出國旅遊時拍拍路标、看看菜譜,現在 GPT-4 連學術論文裏的複雜長難句、專業術語都能理解," 人肉翻譯 " 越來越沒優勢。
生成式 AI 能直接模拟已故的翻譯家,輸出大師風格的譯文,一般人做翻譯還有什麽前途?
調用 ChatGPT 翻譯一本中等部頭的英文書,隻需要花大概十個小時、四美元,人工翻譯卷到天際也達不到這樣的性價比……
這段時間,外語專業學生和翻譯從業者們有類似心情的人不在少數。
根據中國翻譯協會的調查,中國的翻譯人才的規模是 538 萬人,其中本科以上的中青年爲主,這些年輕、專業、高素質的人才如果離開了翻譯行業,豈不可惜?
所以,我們應該盡快回答這些問題:AI 時代,我們爲什麽還需要人工翻譯?翻譯人才要怎麽跨入 AI 的大門?譯者 + 機器的人機協作,有哪些必要條件?
幸好,翻譯行業的反應速度遠比我們想象得快。4 月 3 日至 4 日,2023 中國翻譯協會年會舉辦,百度翻譯聯合中國外文局翻譯院、中國翻譯協會翻譯技術委員會,共同發布了《2023 機器翻譯技術及産業應用藍皮書》。
《藍皮書》系統闡述了機器翻譯的發展曆程和方向,介紹了産業級機器翻譯系統和産品形式,并通過實際案例展示了機器翻譯産業應用現狀,對機器翻譯未來發展提出建議。爲推動機器翻譯技術與各行業的深度融合提供有益借鑒,爲機器翻譯技術的産業應用提供有力支持,其客觀、全面、權威的信息,也成爲翻譯人才把握當下趨勢的權威參考。
(《2023 機器翻譯技術及産業應用藍皮書》視頻簡介)
同時,在譯協年會上,由百度翻譯提供技術和平台支持的 " 首屆全國翻譯技術大賽 " 正式啓動,預計賽制持續到 8 月,也爲中國翻譯人才擁抱技術提供了競技舞台和窗口期。
沒有人會懷疑,我們正處在一個非常重要的曆史轉折點。面對大語言模型等最新 AI 技術帶來的無數可能性,中國翻譯人才可以不焦慮、不盲目、有底氣的進入人機共譯新階段。
不焦慮:
" 見識過‘珍妮紡紗機’,
我還是選擇當翻譯 "
在翻譯行業工作多年的小 A 表示:太陽底下無新事,翻譯人見過的 "AI 威脅論 " 并不少。
2016 年,翻譯領域就曾出現過類似的 " 珍妮紡紗機時刻 "。當時,一篇名爲《翻譯界的重大突破!作爲一個翻譯,此刻我理解了 18 世紀紡織工人看到蒸汽機時的憂慮和恐懼 !》的文章,傳遍了翻譯人的朋友圈。
不少譯員和外語系學生就像在手工棉紡織時代,看到了由蒸汽機帶動的珍妮紡紗機,能同時紡 8 卷線一樣,感到非常擔憂。
原來,百度于 2015 年發布了全球首個互聯網神經網絡機器翻譯系統。随後,谷歌、微軟相繼部署了以神經網絡作爲基礎的機器翻譯系統。這種機器翻譯技術,通過建立深度神經網絡模拟人類的翻譯過程,在語言表示、語義理解、譯文生成等方面有顯著進步,讓機器翻譯的質量大幅提升。結果呢?今天人類翻譯依然存在,而大衆使用翻譯服務的門檻則大大降低了。
更早一點,上世紀末的翻譯人,也曾遇到過 " 珍妮紡紗機 "。九十年代,統計機器翻譯方法的出現,可以基于大規模語料自動訓練模型參數,這種方式不需要人工專家來構建翻譯規則,比基于規則的機器翻譯效率更高、效果更好,彌補了當時國内高水平的專業翻譯人才匮乏、不能滿足實際需求的問題,讓更多高質量的譯著走出了國門,走進大衆視野。
作爲一種更古早的機器翻譯技術,基于規則的機器翻譯,其實也曾是人類眼中的 " 珍妮紡紗機 "。上世紀五十年代,哪怕窮盡全球翻譯家們一生的力量,也隻能掌握幾十種語言,譯著隻占人類作品總量的冰山一角,通過計算機自動完成翻譯,解決全球溝通和交流的問題,也帶來了翻譯業态的快速發展。
把時間拉回到當下,以 ChatGPT、文心一言爲代表的新一代預訓練模型技術,通過超大規模的數據和充分訓練實現了智能湧現效應,大幅提升了機器翻譯的魯棒性和容錯能力。
所以說,機器翻譯從來沒有真正消滅人工翻譯,這是曆史上被多次證明的,反而機器翻譯讓高質量翻譯人才的需求更加旺盛。
面對新的機器翻譯技術,翻譯人才對于 " 珍妮紡紗機 " 的恐懼,更多是源于對于自身發展的不确定。幸好,這種 " 不确定 " 正在被 " 國家隊 " 所改變。
在剛剛發布的《2023 機器翻譯技術及産業應用藍皮書》中,中國翻譯協會的調研數據顯示,有超過 85% 的受訪者認爲 " 機器翻譯 + 譯後編輯 " 的工作模式會在更大範圍内應用。
《藍皮書》認爲,機器翻譯成爲人類譯員的得力助手和有效補充,促使翻譯行業催生出更多如譯後編輯、機翻質量控制等新職業,正在多種場景中被應用。
簡單舉幾例:
1. 加速短視頻、網絡文學等中國優質内容出海。人人譯視界助力 B 站的海外達人項目,完成三百多個頻道的譯制工作;晉江文學城、米讀小說 APP 使用針對網絡文學垂直領域定制優化的機器翻譯系統,将大量本土網絡文學作品翻譯成英語、西班牙語、葡萄牙語等語種,獲得海外用戶的青睐。
2. 助力企業海外市場經營。中石化的企業智能翻譯平台,支撐境外财務票據核銷、重大項目審計、合規備案等翻譯工作;新華社的 " 新華絲路 ", 引入智能翻譯平台,輔助人工譯員提高翻譯效率。
3. 支撐各行各業數字化建設。譯馬網引入 "AI+ 人工 " 的譯後編輯模式,日均翻譯字數可提升近 4 倍,翻譯成本降低 34%;邁迪培爾開發的醫藥等垂直領域機器翻譯,爲科研人員的研究工作提供了極大便利。
總之,翻譯領域的新機會還有很多,更詳細的信息,大家可以在《藍皮書》中閱覽。
機器翻譯大有用武之地,高端翻譯人才也是時代所需。二者相輔相成,可以滿足不同層次的翻譯需求,在獲取全球信息、對外交流等方面将發揮越來越重要的作用。
作爲普通人,要做的是學習駕馭最新的 " 珍妮紡紗機 ",把機器翻譯用好,不是留戀做一個 " 手工紡紗人 "。
不盲目:
從朦胧到清晰的人機協作之路
那麽,"AI+ 人工 " 的譯後編輯工作模式下,究竟怎樣才算用好 AI 技術?人機共譯,需要具備哪些技能?
《藍皮書》提供了方法論,呼籲培養 " 翻譯 + 技術 +N" 的精翻譯、懂技術、能力強的新時代高端翻譯人才。首屆全國翻譯技術大賽,則提供了具體的實現路徑。
要将 AI 技術和機器翻譯作爲得力助手,人類譯員想要提高技能,也不能盲目。
" 首屆全國翻譯技術大賽 ",由中國外文局、全國翻譯專業學位研究生教育指導委員會指導,中國翻譯協會、中國外文局翻譯院、大連外國語大學主辦。百度翻譯作爲承辦單位之一,提供翻譯技術與比賽平台支持。
從陣容中不難看到,賽事爲推動行業各方對機器翻譯技術的了解和應用,提供了清晰的方向和路徑:
1. 清晰的培養方向。
舉辦方是百度翻譯,和翻譯行業的 " 國家隊 ",保證了比賽涉及内容的前沿性和權威性,同時,賽事向各類翻譯愛好者開放,高校學生、翻譯機構、企業單位等都可以參與,人才覆蓋面廣。
由此證明,複合型翻譯人才的培養,AI+ 翻譯融合學科的建設,離不開政産學研用多方形成合力,提供更充沛的實踐機會和更明确的方向引導。
2. 清晰的技能标準。
中國的翻譯人才要開啓 " 人機共譯 " 工作新範式,需要具備哪些核心能力?比賽考核點的設計,也給出了清晰的答案,讓人才能夠不再迷茫,提早培養自身的競争力。
比如以往的翻譯比賽,主要考察人類譯文的準确性、優美性,而此次比賽,還将對機器翻譯的掌握,納入了考核,包括對機器翻譯軟件内置功能是否熟悉,操作熟練度如何,是否充分運用了技術,做到真正以賽促學,幫助大家掌握先進的機器翻譯工具。
(譯後編輯能力考察:術語替換題)
3. 清晰的産業基石。
大賽由百度翻譯提供技術和平台支持,背後也有着深度的考量:中國翻譯綜合能力的提高,要建立在怎樣的機器翻譯底座上?
選擇百度翻譯,一是技術領先,百度于 2015 年自主研發的全球首個互聯網神經網絡翻譯系統,能夠快速提高翻譯産能,是較爲先進的機器翻譯工具。
二是平台能力,百度智能文檔翻譯平台的創新人機共譯模式,将機器翻譯 ( Machine Translation ) + 譯後編輯 ( post-editing ) + 模型自學習相結合,讓機器翻譯結果越用越準,效率不斷提升。
三是應用豐富。百度智能文檔翻譯平台,提供術語參考、翻譯記憶、智能糾錯等功能,内置權威術語,查證更省力,在工作中真正爲人類譯員減負。
從底層技術到上層應用的優勢,是百度智能文檔翻譯平台 " 被選擇 " 的原因,也爲翻譯行業和翻譯人才接下來的發展提供牢靠的支持。
翻譯人才如何跨入 AI 的大門,從首屆全國翻譯技術大賽開始,路徑正從朦胧走向清晰。
(産業級機器翻譯系統流程圖)
有底氣:
從一群人的比賽,
到全民的新可能
你可能會問:我又不當譯員,機器翻譯的發展跟我又有什麽關系呢?
當然有。
從基于規則的機器翻譯,到大語言模型驅動的機器翻譯,機器翻譯技術的每一次更叠,都會讓全社會、全世界廣泛受益。
你讀到的一部譯本,與海外朋友的一次對話,境外旅遊時的無礙溝通,前沿論文的快速傳播……翻譯成本不斷降低,以前需要請一個翻譯,現在手機 app/ 翻譯筆就能搞定;體驗越來越絲滑,原本要分段複制粘貼的學術論文,現在整個丢進百度智能文檔翻譯,就能直出全部譯文,還帶還原版式,閱讀效率也高多了。
對于個人來說,跨語言溝通、學習和交流,是成長和進步的基礎,通過百度翻譯這樣的智能産品獲得更高質量、更低成本的翻譯服務,減少了很多不必要的時間和操作,某種程度上來說,是一種人生的提速。
對于企業來說,産品出海或跨境貿易,需要在翻譯上投入高成本,有時還不能快速到位,一些翻譯相關業務場景需要定制化開發,缺乏相應的人才。
《藍皮書》中提到國内某世界 500 強企業,需要通過海外媒體報道和電商渠道的消費者評論等信息,進行海外市場經營決策,涵蓋近百種語言,每月翻譯需求超百億詞,涵蓋文本、文檔、圖片等多種形态,海量而冗雜的翻譯任務,全靠人工根本沒辦法及時跟進最新市場動向。
中國企業要 " 走出去 ",AI+ 機器翻譯,是必不可少的輔助。
百度翻譯從模型到應用的豐富能力,背靠百度生态,可與計算機視覺、語音處理等人工智能技術深度融合,全面、及時、深入響應不同行業不同場景的業務需求。
對國家來說,翻譯能力是國家軟實力的一部分。
中國外文局局長、中國翻譯協會會長杜占元指出,國家翻譯能力,是通過翻譯行爲建構對外話語、開展文化傳播、塑造國家形象的綜合能力,是文化軟實力和國際傳播能力的重要組成部分,也是發揮大國作用、提升國際話語權的重要保障。
從這個角度看,加強國家翻譯能力建設,除了傳統手段之外,機器翻譯的技術領先性、安全性、可用性愈發重要。
百度在大模型技術、大語言模型(LLM)、自然語言處理(NLP)方面深耕多年的技術儲備和領先實力,從芯片、深度學習框架到翻譯模型的核心模塊自研能力,讓百度翻譯有望成爲首屈一指的産業級機器翻譯系統,在翻譯行業智能化、數字經濟交流中發揮作用。
這些力量融合起來,才推動中國翻譯來到新的轉折點。而一個溝通無礙、高效的新世界,會讓一個人、一個企業、乃至一個國家,都獲得新的機會與可能。
1999 年,萬維網的發明者、互聯網之父 Tim Berners-Lee,就曾提出過一個概念:social machine(社會機器),即人與機器的協作體。人負責創造,而機器負責執行。當時,最熱的機器是家用電腦,全國都興起一股 " 電腦熱 ",各種電腦培訓班、電腦操作書籍紛紛問世,和今天的 "AI 熱 " 差不多。
如果你不會恐懼電腦、抗拒電腦,那當然也不應該恐懼 AI。AI 時代,我們仍然需要人類譯者,語言的通天塔一天沒有越過,翻譯的火種便會生生不息。
個人對機器翻譯的不同态度和選擇,将迎來不同的命運,但願你的選擇,映射的是你的希望,而非恐懼。