治理最大的難題,仍是在保障言論自由和維護秩序之間找到平衡
21 世紀經濟報道記者肖潇 北京報道
熱搜再次成爲目光焦點。
11 月 24 日,四部門聯合開展 " 清朗 · 網絡平台算法典型問題治理 " 專項行動,重點整治熱搜榜單、信息繭房、沉迷上瘾、大數據殺熟、算法侵蝕新就業形态勞動者權益五類問題。
在熱搜問題上,專項行動的《算法專項治理清單指引》明确提出了三點要求:第一,算法規則公示。平台需要公示榜單排序機制機理,包括基本原理和排序依據;第二,日志留存核驗。平台應留存榜單相關網絡日志,日志内容包括時間、榜單排名、熱度值等信息;第三,水軍賬号識别。平台應健全異常賬号監測機制,防範違規操縱榜單、控制熱搜等現象。
實際上,國内社交平台上線熱搜功能不過十年,已經經曆了兩次大型整改。微博公布過算法規則,引入了編輯人工審核,可信賬号的識别模型每年都在更新,但買榜單、流量造假、娛樂導向過重 …… 紛紛擾擾的争議始終未停。
熱搜是如何被算法塑造的,底層問題到底出在哪裏?當我們讨論熱搜時,還存在哪些誤解和盲區?
微博擁有熱搜功能,其實剛到十年。
2014 年,熱搜在微博手機端正式上線。當時熱搜的唯一指标就是 " 實時搜索次數 ",榜單每十分鍾更新一次。《微博搜索白皮書》顯示,熱搜上線的第二年,日均曝光量達到 2.5 億。
2018 年 1 月,熱搜被網信辦啓動爲期一周的下線整改。因 PG One 粉絲刷榜的 " 紫光閣地溝油 " 熱搜,微博相關負責人被北京市網信辦約談,被指 " 用戶發布違法違規信息未盡到審查義務,持續傳播炒作導向錯誤、低俗色情等違法違規有害信息。"
通過這次整改,熱搜算法迎來了第一次升級——一個話題要成爲熱搜,除了單純的搜索次數,還需考慮傳播熱度、互動率、話題率。
當時微博副總裁曹增輝還對界面 · 新聞表示,熱搜不再是純粹的算法排序,開始引入編輯人工幹預,整治虛假信息和謠言。
2020 年 6 月,熱搜再次被啓動爲期一周的下線整改。據國家網信辦對外發布的公告,微博被指在阿裏蔣凡輿論事件中,幹擾網上傳播秩序、傳播違法違規信息。當年開始實施的《網絡信息内容生态治理規定》将熱搜列爲網絡信息内容的重點展示環節,指出要應當防範和抵制不良信息。
熱搜算法因此有了第二次升級,并且進行了公開說明。這一大體規則此後沒有更新,其計算公式是:(搜索熱度 + 傳播熱度 + 讨論熱度 ) x 互動率。
在官方公式中,互動數是一個很重要的衡量指标,也就是通常所說的轉發、點贊、評論。不難看出,比起一次搜索,在熱搜頁面進行的一次互動能帶來的分數更高,話題因此登上熱搜的概率也更大。
鄭州大學新聞與傳播學院副教授王茜長期研究熱搜,她的論文《批判算法研究視角下微博 " 熱搜 " 的把關标準考察》被引用超過六千次。王茜在采訪中告訴 21 記者,2018 年算法升級後," 熱搜 " 仍然是原來的排行榜,但對 " 熱門 " 的定義發生了根本改變,互動性成爲更重要的價值因子,而且近年來在平台中的份量越來越重。
" 熱搜依據用戶的真實行爲産生,這麽說當然沒有錯。但哪些行爲更重要?是一次搜索更能說明用戶的關注度,還是一次評論?" 王茜說。
決定這一答案的,是算法公式。學者米歇爾 · 威爾森 ( Michele Willson ) 用一個更生動的例子說明了算法的權力,他把用戶的原始行爲、原始數據比喻爲食材,把算法比喻爲食譜,不同算法能烹饪出不一樣的菜肴,直接影響了最終呈現的内容。王茜表示,算法正是以這種不可見的、隐蔽的方式進行價值判斷。
在王茜看來,熱搜的 " 搜索 " 是一種私下的行爲,具有隐蔽性;而轉發點贊評論是公開互動,往往有公開表演的成分。公開 " 轉贊評 " 的内容和私下 " 搜索 " 的内容,其實可能有着很大不同。
從心理學的角度來看,人類爲了生存,有需要感知威脅、躲避危險的天性,這種 " 人性弱點 " 體現在社交平台上,便是暗含危險、憤怒的負性信息更容易獲得公開互動。不少社會研究已經證明了這一點,先進網絡分析研究小組(GANA)曾對約 7000 萬條微博數據進行情緒分析,結果表明,憤怒是網絡上相關性最強、最易傳播的情緒,遠超過喜悅和低落。
另一方面,強調互動數的熱搜算法,也放大了意見領袖(KOL)的影響力。" 如果把熱搜看成一個話題投票箱,原本大家是一人一票,普通人搜索一次和名人搜索一次貢獻是一樣的。現在擁有更多粉絲和資源的人,比普通個體的權重更高。"王茜解釋。
根據互動數劃分不同權重的邏輯,直觀體現在熱搜的頁面裏。點進熱搜詞條,除了熱搜主持人置頂的微博,用戶首先能看到的便是 10~20 條左右,互動量高,它們左右着用戶對熱搜内容的初印象。
有明星後援會的粉絲告訴 21 記者,這幾年算法機制變得越來越複雜,一條評論要在熱評區被優先展示,除了需要有高贊數和高評論數,賬号本身還需要大概 650 分的 " 信用分 ",上熱門轉發則需要 690 分左右的 " 信用分 "。決定信用分的,是賬号發微博的活躍度、社交關系、舉報扣分情況等一系列指标。
換句話說,不是所有微博用戶都會被納入熱搜考量範圍,算法會篩選出 " 可信用戶 "。" 普通賬号的信用比較低的話,怎麽評論都上不了熱門,微博也上不了熱搜廣場,甚至可能被屏蔽。所以平時就要多發原創微博,多帶話題跟大 V 互動,提高賬号的權重。" 前述粉絲說。
這也許能解釋爲什麽能吸引更多回複的,或者來自大 V 的評論總能被 " 頂 " 上前排,獲得更多曝光。
王茜說,微博最初發布這一規則時,出發點是識别水軍、确保熱搜的真實性。" 但大數據一定會抹除一些細節。如果要定義哪些是僵屍号水軍、哪些是活躍用戶,那些隻看不常發微博的人就會被判定不可信,篩選出來的就是一批最活躍用戶的想法。"
算法抹除的不止用戶痕迹。海外社交平台 X(前 Twitter)同樣具有熱搜功能,不過顯示的是詞語,而微博熱搜通常是由熱搜主持人提前設定好的一句主、謂、賓語完整的句子。王茜指出,雖然這樣看起來提供了更多事實,但仍然抹除了細節和語境,屬于一種印象式的消息,有時誤導性可能更強。
舉例來說,2021 年的一個熱搜 # 大學教授說娶到大才女李清照是倒八輩子黴 # 看起來在批評李清照,其實原視頻中大學教授是在戲谑對比,但如果不點進視頻,或者沒有點進完整的熱搜頁面,很可能就會先留下先入爲主的印象。
通過對内容和用戶的一系列篩選,熱搜能呈現的往往就是一部分活躍用戶的、青年群體的、更有争議性的内容。
如今各大互聯網平台都采用流量主導的熱搜算法,對商業發展而言是必然選擇。
蘇州大學傳媒學院執行院長陳龍認爲,Web2.0 技術的普及解決了社交媒體互動性問題。從 " 轉贊評 " 到 " 一鍵三連 ",本質都是流量優先的邏輯。通過增加用戶粘性,最終将注意力作爲商業化的基礎,實現自身的發展與擴張。
陳龍告訴 21 記者,在多個社交平台的競争下,争奪用戶有限的注意力是一場零和博弈。越來越多用戶流向短視頻平台,原本屬于微博的的時間被吞噬。從 2018 年初開始,新浪股價一路下行,當 2021 年新浪宣布退出美股時,市值已經萎縮了近五分之一。2023 年第三季度最新财報顯示,微博營收 32.07 億元人民币,同比下滑了 3%。如何保用戶、保營收是經營者不得不思考的問題。
與此同時,微博是爲數不多的公共讨論場地,在社會事件的傳播上有着難以替代的影響力。中國政法大學數據法治研究院教授張淩寒提醒,在缺乏監管的情況下,沖突性的内容泛濫是必然結果。而很多冷嘲熱諷、煽風點火、陰陽怪氣等言論一旦高強度聚集,會對社會事件的當事人造成極大的傷害。
比如,在此前的粉紅頭發女孩被網暴事件、收件人被快遞員造謠出軌事件中,一條評論單看也許隻是玩笑話,但海量的負面評論疊加,可能就會形成一場網暴。熱搜在網絡暴力的生成、傳播、聚合中,起着 " 放大鏡 " 的關鍵作用。
去年《關于依法懲治網絡暴力違法犯罪的指導意見(征求意見稿)》出台,嚴懲基于蹭炒熱度、推廣引流等目的,對于網暴信息不履行安全管理義務的行爲。2022 年《互聯網信息服務算法推薦管理規定》要求,要建立完善人工幹預和用戶自主選擇機制," 在首頁首屏、熱搜、精選、榜單類、彈窗等重點環節積極呈現符合主流價值導向的信息内容。"
盡管有了人工幹預,但難題仍然不少。張淩寒指出,治理最大的難題仍是在保障言論自由和維護秩序之間找到平衡。陰陽怪氣、冷嘲熱諷的互聯網信息難以根治,一禁了之既不利于實現有效的公共讨論,長遠而言也無益于和諧社會的建設。
張淩寒認爲,關鍵在于通過智能識别等技術對熱搜進行及時、全面、準确的分析研判,實現靈活有效的輿論治理。陳龍則建議,語言暴力的邊界難以界定,針對具體問題建立人工管理員或投票機制,也是一種方法。
多位受訪學者還不約而同地表示,平台熱搜的商業性和公共性存在悖論。當下亟需提高算法素養,剝除算法客觀性的光環。社會各界也不以熱搜當作傳播标準,并一味追求上熱搜的 KPI 指标。
" 需要認識到的是,盡管熱搜在大家心中扮演了民意風向标的角色,但事實上它沒法呈現完全的客觀性。每種算法都存在一定的缺陷和偏見,要理性看待熱搜的性質。"王茜說。