熱搜上線第十年，爲何算法争議仍不止不休？

治理最大的難題，仍是在保障言論自由和維護秩序之間找到平衡

21 世紀經濟報道記者肖潇北京報道

熱搜再次成爲目光焦點。

11 月 24 日，四部門聯合開展 " 清朗 · 網絡平台算法典型問題治理 " 專項行動，重點整治熱搜榜單、信息繭房、沉迷上瘾、大數據殺熟、算法侵蝕新就業形态勞動者權益五類問題。

在熱搜問題上，專項行動的《算法專項治理清單指引》明确提出了三點要求：第一，算法規則公示。平台需要公示榜單排序機制機理，包括基本原理和排序依據；第二，日志留存核驗。平台應留存榜單相關網絡日志，日志内容包括時間、榜單排名、熱度值等信息；第三，水軍賬号識别。平台應健全異常賬号監測機制，防範違規操縱榜單、控制熱搜等現象。

實際上，國内社交平台上線熱搜功能不過十年，已經經曆了兩次大型整改。微博公布過算法規則，引入了編輯人工審核，可信賬号的識别模型每年都在更新，但買榜單、流量造假、娛樂導向過重 …… 紛紛擾擾的争議始終未停。

熱搜是如何被算法塑造的，底層問題到底出在哪裏？當我們讨論熱搜時，還存在哪些誤解和盲區？

兩次下線，兩次升級

微博擁有熱搜功能，其實剛到十年。

2014 年，熱搜在微博手機端正式上線。當時熱搜的唯一指标就是 " 實時搜索次數 "，榜單每十分鍾更新一次。《微博搜索白皮書》顯示，熱搜上線的第二年，日均曝光量達到 2.5 億。

2018 年 1 月，熱搜被網信辦啓動爲期一周的下線整改。因 PG One 粉絲刷榜的 " 紫光閣地溝油 " 熱搜，微博相關負責人被北京市網信辦約談，被指 " 用戶發布違法違規信息未盡到審查義務，持續傳播炒作導向錯誤、低俗色情等違法違規有害信息。"

通過這次整改，熱搜算法迎來了第一次升級——一個話題要成爲熱搜，除了單純的搜索次數，還需考慮傳播熱度、互動率、話題率。

當時微博副總裁曹增輝還對界面 · 新聞表示，熱搜不再是純粹的算法排序，開始引入編輯人工幹預，整治虛假信息和謠言。

2020 年 6 月，熱搜再次被啓動爲期一周的下線整改。據國家網信辦對外發布的公告，微博被指在阿裏蔣凡輿論事件中，幹擾網上傳播秩序、傳播違法違規信息。當年開始實施的《網絡信息内容生态治理規定》将熱搜列爲網絡信息内容的重點展示環節，指出要應當防範和抵制不良信息。

熱搜算法因此有了第二次升級，并且進行了公開說明。這一大體規則此後沒有更新，其計算公式是：（搜索熱度 + 傳播熱度 + 讨論熱度 ) x 互動率。

在官方公式中，互動數是一個很重要的衡量指标，也就是通常所說的轉發、點贊、評論。不難看出，比起一次搜索，在熱搜頁面進行的一次互動能帶來的分數更高，話題因此登上熱搜的概率也更大。

鄭州大學新聞與傳播學院副教授王茜長期研究熱搜，她的論文《批判算法研究視角下微博 " 熱搜 " 的把關标準考察》被引用超過六千次。王茜在采訪中告訴 21 記者，2018 年算法升級後，" 熱搜 " 仍然是原來的排行榜，但對 " 熱門 " 的定義發生了根本改變，互動性成爲更重要的價值因子，而且近年來在平台中的份量越來越重。

" 熱搜依據用戶的真實行爲産生，這麽說當然沒有錯。但哪些行爲更重要？是一次搜索更能說明用戶的關注度，還是一次評論？" 王茜說。

決定這一答案的，是算法公式。學者米歇爾 · 威爾森 ( Michele Willson ) 用一個更生動的例子說明了算法的權力，他把用戶的原始行爲、原始數據比喻爲食材，把算法比喻爲食譜，不同算法能烹饪出不一樣的菜肴，直接影響了最終呈現的内容。王茜表示，算法正是以這種不可見的、隐蔽的方式進行價值判斷。

算法的設計和偏見

在王茜看來，熱搜的 " 搜索 " 是一種私下的行爲，具有隐蔽性；而轉發點贊評論是公開互動，往往有公開表演的成分。公開 " 轉贊評 " 的内容和私下 " 搜索 " 的内容，其實可能有着很大不同。

從心理學的角度來看，人類爲了生存，有需要感知威脅、躲避危險的天性，這種 " 人性弱點 " 體現在社交平台上，便是暗含危險、憤怒的負性信息更容易獲得公開互動。不少社會研究已經證明了這一點，先進網絡分析研究小組（GANA）曾對約 7000 萬條微博數據進行情緒分析，結果表明，憤怒是網絡上相關性最強、最易傳播的情緒，遠超過喜悅和低落。

另一方面，強調互動數的熱搜算法，也放大了意見領袖（KOL）的影響力。" 如果把熱搜看成一個話題投票箱，原本大家是一人一票，普通人搜索一次和名人搜索一次貢獻是一樣的。現在擁有更多粉絲和資源的人，比普通個體的權重更高。"王茜解釋。

根據互動數劃分不同權重的邏輯，直觀體現在熱搜的頁面裏。點進熱搜詞條，除了熱搜主持人置頂的微博，用戶首先能看到的便是 10～20 條左右，互動量高，它們左右着用戶對熱搜内容的初印象。

有明星後援會的粉絲告訴 21 記者，這幾年算法機制變得越來越複雜，一條評論要在熱評區被優先展示，除了需要有高贊數和高評論數，賬号本身還需要大概 650 分的 " 信用分 "，上熱門轉發則需要 690 分左右的 " 信用分 "。決定信用分的，是賬号發微博的活躍度、社交關系、舉報扣分情況等一系列指标。

換句話說，不是所有微博用戶都會被納入熱搜考量範圍，算法會篩選出 " 可信用戶 "。" 普通賬号的信用比較低的話，怎麽評論都上不了熱門，微博也上不了熱搜廣場，甚至可能被屏蔽。所以平時就要多發原創微博，多帶話題跟大 V 互動，提高賬号的權重。" 前述粉絲說。

這也許能解釋爲什麽能吸引更多回複的，或者來自大 V 的評論總能被 " 頂 " 上前排，獲得更多曝光。

王茜說，微博最初發布這一規則時，出發點是識别水軍、确保熱搜的真實性。" 但大數據一定會抹除一些細節。如果要定義哪些是僵屍号水軍、哪些是活躍用戶，那些隻看不常發微博的人就會被判定不可信，篩選出來的就是一批最活躍用戶的想法。"

算法抹除的不止用戶痕迹。海外社交平台 X（前 Twitter）同樣具有熱搜功能，不過顯示的是詞語，而微博熱搜通常是由熱搜主持人提前設定好的一句主、謂、賓語完整的句子。王茜指出，雖然這樣看起來提供了更多事實，但仍然抹除了細節和語境，屬于一種印象式的消息，有時誤導性可能更強。

舉例來說，2021 年的一個熱搜 # 大學教授說娶到大才女李清照是倒八輩子黴 # 看起來在批評李清照，其實原視頻中大學教授是在戲谑對比，但如果不點進視頻，或者沒有點進完整的熱搜頁面，很可能就會先留下先入爲主的印象。

通過對内容和用戶的一系列篩選，熱搜能呈現的往往就是一部分活躍用戶的、青年群體的、更有争議性的内容。

不應一味追求熱搜 KPI

如今各大互聯網平台都采用流量主導的熱搜算法，對商業發展而言是必然選擇。

蘇州大學傳媒學院執行院長陳龍認爲，Web2.0 技術的普及解決了社交媒體互動性問題。從 " 轉贊評 " 到 " 一鍵三連 "，本質都是流量優先的邏輯。通過增加用戶粘性，最終将注意力作爲商業化的基礎，實現自身的發展與擴張。

陳龍告訴 21 記者，在多個社交平台的競争下，争奪用戶有限的注意力是一場零和博弈。越來越多用戶流向短視頻平台，原本屬于微博的的時間被吞噬。從 2018 年初開始，新浪股價一路下行，當 2021 年新浪宣布退出美股時，市值已經萎縮了近五分之一。2023 年第三季度最新财報顯示，微博營收 32.07 億元人民币，同比下滑了 3%。如何保用戶、保營收是經營者不得不思考的問題。

與此同時，微博是爲數不多的公共讨論場地，在社會事件的傳播上有着難以替代的影響力。中國政法大學數據法治研究院教授張淩寒提醒，在缺乏監管的情況下，沖突性的内容泛濫是必然結果。而很多冷嘲熱諷、煽風點火、陰陽怪氣等言論一旦高強度聚集，會對社會事件的當事人造成極大的傷害。

比如，在此前的粉紅頭發女孩被網暴事件、收件人被快遞員造謠出軌事件中，一條評論單看也許隻是玩笑話，但海量的負面評論疊加，可能就會形成一場網暴。熱搜在網絡暴力的生成、傳播、聚合中，起着 " 放大鏡 " 的關鍵作用。

去年《關于依法懲治網絡暴力違法犯罪的指導意見（征求意見稿）》出台，嚴懲基于蹭炒熱度、推廣引流等目的，對于網暴信息不履行安全管理義務的行爲。2022 年《互聯網信息服務算法推薦管理規定》要求，要建立完善人工幹預和用戶自主選擇機制，" 在首頁首屏、熱搜、精選、榜單類、彈窗等重點環節積極呈現符合主流價值導向的信息内容。"

盡管有了人工幹預，但難題仍然不少。張淩寒指出，治理最大的難題仍是在保障言論自由和維護秩序之間找到平衡。陰陽怪氣、冷嘲熱諷的互聯網信息難以根治，一禁了之既不利于實現有效的公共讨論，長遠而言也無益于和諧社會的建設。

張淩寒認爲，關鍵在于通過智能識别等技術對熱搜進行及時、全面、準确的分析研判，實現靈活有效的輿論治理。陳龍則建議，語言暴力的邊界難以界定，針對具體問題建立人工管理員或投票機制，也是一種方法。

多位受訪學者還不約而同地表示，平台熱搜的商業性和公共性存在悖論。當下亟需提高算法素養，剝除算法客觀性的光環。社會各界也不以熱搜當作傳播标準，并一味追求上熱搜的 KPI 指标。

" 需要認識到的是，盡管熱搜在大家心中扮演了民意風向标的角色，但事實上它沒法呈現完全的客觀性。每種算法都存在一定的缺陷和偏見，要理性看待熱搜的性質。"王茜說。