但凡偷懶一點,喜歡用浏覽器或者翻譯插件來看英語新聞的同學,估計都免不了在 AI 大模型火熱的當下,被滿篇的「法學碩士」晃得眼瞎不已。
并不是大語言模型 LLM(Large Language Model)真的和法學有強關聯,而隻是一個縮寫詞的歧義解釋而已。
爲什麽大模型掀起的新一波 AI 浪潮已如此洶湧,而浏覽器和翻譯軟件,還是堅持将 LLM 翻譯成「法學碩士」?大模型這「碩士帽」什麽時候能摘掉?
論「LLM 濃度」,大模型還是弟弟
首先需要說明的是,「LLM」這個縮寫,在英文中既可以指代現在火熱的「大語言模型 Large Language Model」;同時,在教育領域,它通常指的是「Legum Magister」或「Master of Laws」,即法學碩士。
而對于像 Google 浏覽器配備的機器翻譯功能,最常見的難題就是歧義和對上下文的理解。
機器翻譯通常依賴大量的文本數據來學習如何翻譯詞語和短語。如果大多數 「LLM」出現在與法律相關的上下文中,翻譯系統可能會學習到 「LLM」通常指的是 「法學碩士」。除非系統能夠識别出特定的技術上下文,否則它可能不會選擇 「大型語言模型」作爲翻譯。
即便現在大語言模型帶動的生成式 AI 如此火熱,但其實像 LLM 這類詞彙在非技術人群中的普及度不高,這意味着翻譯系統在其訓練數據中,可能沒有足夠的實例來學習這種特定的上下文使用。
也就是說,LLM 作爲「大語言模型」在機器翻譯中的重要程度,還沒有其作爲「法學碩士」的程度高。
有圖爲證。
過去一年 AI LLM 和 Law LLM 關鍵詞熱度對比|Google Trends
以「AI LLM」(人工智能,大語言模型)和「Law LLM」(法律,法學碩士)爲關鍵詞,截取兩個關鍵詞過去一年 Google Trends 的對比圖,可以輕易看出,AI LLM 這一詞從去年 11 月 ChatGPT 推出後才開始逐漸升溫,而此時代表真正的法學碩士的 Law LLM 熱度一直在「50 分」左右。
而在 2023 年 3 月中旬,AI LLM 迎來了自己的第一波熱度高潮,當時發生了什麽?答案是美國當地時間 3 月 14 日,OpenAI 正式推出了 ChatGPT-4,徹底引爆了 AI 市場。
到今年 5 月末,AI 在熱度上徹底戰勝 Law|Google Trends
可以看到此後,隻用了 2 個月時間,到 5 月末、 6 月初,代表 AI LLM 的曲線不斷上揚,徹底在搜索熱度上超過 Law LLM,并且趨勢一直延續到現在。
關于 AI 的關鍵詞都處于飙升的狀态|Google Trends
通過全球熱力圖可以看到,對于 AI LLM 的關注,中國網友是相當熱情的——生成式 AI 、 OpenAI 和 ChatGPT 等關鍵詞一直處于「飙升」狀态。
雖然在近期熱度上,AI 壓制了「法學高材生」,但由于「大語言模型」在絕對數量級上處于下風,依然是「弟弟」,所以機器翻譯中還是默認 LLM 爲「法學碩士」。
還能改嗎?怎麽改?
所以,LLM 大語言模型這個「法學碩士」的帽子,就沒辦法摘下來了?
那倒也未必,不過确實需要一些時日,其中一些關鍵因素,可能會加快澄清誤會的速度:
技術術語的普及度
如果「大型語言模型」(Large Language Model)這一術語在網頁、學術論文、新聞報道和社交媒體中的使用頻率顯著增加,搜索引擎更有可能學習到這一含義。
搜索引擎算法的改進
随着搜索引擎算法的不斷優化,它們在理解上下文和消除歧義方面的能力也在提高。這可能會加快正确翻譯「LLM」這一術語的過程。
用戶反饋和行爲
用戶在使用搜索引擎時的行爲和反饋也會影響算法。如果用戶經常搜索與大型語言模型相關的内容,并在搜索結果中選擇與之相關的鏈接,搜索引擎會逐漸學習并調整其算法。
技術領域的發展
随着大型語言模型在技術領域的應用越來越廣泛,與之相關的内容和讨論也會增加,這有助于提高搜索引擎對這一術語的識别能力。
Techmeme 上的贊助商廣告 LLM 被直接翻譯成法學碩士|Techmeme
以目前 AI 的熱度來看,LLM 被統一翻譯成「大語言模型」的未來,可能不會太久就會到來。而時間和進度,很可能就掌握在所有網友手中。
不過,這對于真正的法律界和教育界可能也是個小問題,如果 LLM 就是「AI 大語言模型」的觀念深入人心,那未來有人想憑借 LLM 來搜索當地「法學碩士」考試的同學,可能會在網上多繞一會兒了。而法律專業學校在做搜索引擎優化時候,也得多花點力氣了。
在這個信息爆炸的時代,術語的含義也在不斷演變。從「法學碩士」到「大語言模型」,LLM 的雙重身份讓我們見證了語言的多樣性和技術的進步。讓我們拭目以待,看看這個小小的縮寫将如何在我們的語言和技術中繼續演化。
頭圖來源:極客公園 /DALL-E