熱搜再次成為目光焦點。熱搜仍
11月24日,上線算法四部門聯合開展“清朗·網絡平臺算法典型問題治理”專項行動,第年重點整治熱搜榜單、為何信息繭房、爭議止沉迷上癮、熱搜仍大數據殺熟、上線算法算法侵蝕新就業形態勞動者權益五類問題。第年
在熱搜問題上,為何專項行動的爭議止《算法專項治理清單指引》明確提出了三點要求:第一,算法規則公示。熱搜仍平臺需要公示榜單排序機制機理,上線算法包括基本原理和排序依據;第二,第年日志留存核驗。為何平臺應留存榜單相關網絡日志,爭議止日志內容包括時間、榜單排名、熱度值等信息;第三,水軍賬號識別。平臺應健全異常賬號監測機制,防范違規操縱榜單、控制熱搜等現象。
實際上,國內社交平臺上線熱搜功能不過十年,已經經歷了兩次大型整改。微博公布過算法規則,引入了編輯人工審核,可信賬號的識別模型每年都在更新,但買榜單、流量造假、娛樂導向過重……紛紛擾擾的爭議始終未停。
熱搜是如何被算法塑造的,底層問題到底出在哪里?當我們討論熱搜時,還存在哪些誤解和盲區?
微博擁有熱搜功能,其實剛到十年。
2014年,熱搜在微博手機端正式上線。當時熱搜的唯一指標就是“實時搜索次數”,榜單每十分鐘更新一次。《微博搜索白皮書》顯示,熱搜上線的第二年,日均曝光量達到2.5億。
2018年1月,熱搜被網信辦啟動為期一周的下線整改。因PG One粉絲刷榜的“紫光閣地溝油”熱搜,微博相關負責人被北京市網信辦約談,被指“用戶發布違法違規信息未盡到審查義務,持續傳播炒作導向錯誤、低俗色情等違法違規有害信息。”
通過這次整改,熱搜算法迎來了第一次升級——一個話題要成為熱搜,除了單純的搜索次數,還需考慮傳播熱度、互動率、話題率。
當時微博副總裁曹增輝還對界面新聞表示,熱搜不再是純粹的算法排序,開始引入編輯人工干預,整治虛假信息和謠言。
2020年6月,熱搜再次被啟動為期一周的下線整改。據國家網信辦對外發布的公告,微博被指在阿里蔣凡輿論事件中,干擾網上傳播秩序、傳播違法違規信息。當年開始實施的《網絡信息內容生態治理規定》將熱搜列為網絡信息內容的重點展示環節,指出要應當防范和抵制不良信息。
熱搜算法因此有了第二次升級,并且進行了公開說明。這一大體規則此后沒有更新,其計算公式是:(搜索熱度+傳播熱度 +討論熱度) x互動率。
在官方公式中,互動數是一個很重要的衡量指標,也就是通常所說的轉發、點贊、評論。不難看出,比起一次搜索,在熱搜頁面進行的一次互動能帶來的分數更高,話題因此登上熱搜的概率也更大。
鄭州大學新聞與傳播學院副教授王茜長期研究熱搜,她的論文《批判算法研究視角下微博“熱搜”的把關標準考察》被引用超過六千次。王茜在采訪中告訴21記者,2018年算法升級后,“熱搜”仍然是原來的排行榜,但對“熱門”的定義發生了根本改變,互動性成為更重要的價值因子,而且近年來在平臺中的份量越來越重。
“熱搜依據用戶的真實行為產生,這么說當然沒有錯。但哪些行為更重要?是一次搜索更能說明用戶的關注度,還是一次評論?”王茜說。
決定這一答案的,是算法公式。學者米歇爾·威爾森 (Michele Willson) 用一個更生動的例子說明了算法的權力,他把用戶的原始行為、原始數據比喻為食材,把算法比喻為食譜,不同算法能烹飪出不一樣的菜肴,直接影響了最終呈現的內容。王茜表示,算法正是以這種不可見的、隱蔽的方式進行價值判斷。
在王茜看來,熱搜的“搜索”是一種私下的行為,具有隱蔽性;而轉發點贊評論是公開互動,往往有公開表演的成分。公開“轉贊評”的內容和私下“搜索”的內容,其實可能有著很大不同。
從心理學的角度來看,人類為了生存,有需要感知威脅、躲避危險的天性,這種“人性弱點”體現在社交平臺上,便是暗含危險、憤怒的負性信息更容易獲得公開互動。不少社會研究已經證明了這一點,先進網絡分析研究小組(GANA)曾對約7000萬條微博數據進行情緒分析,結果表明,憤怒是網絡上相關性最強、最易傳播的情緒,遠超過喜悅和低落。
另一方面,強調互動數的熱搜算法,也放大了意見領袖(KOL)的影響力。“如果把熱搜看成一個話題投票箱,原本大家是一人一票,普通人搜索一次和名人搜索一次貢獻是一樣的。現在擁有更多粉絲和資源的人,比普通個體的權重更高。”王茜解釋。
根據互動數劃分不同權重的邏輯,直觀體現在熱搜的頁面里。點進熱搜詞條,除了熱搜主持人置頂的微博,用戶首先能看到的便是10~20條左右,互動量高,它們左右著用戶對熱搜內容的初印象。
有明星后援會的粉絲告訴21記者,這幾年算法機制變得越來越復雜,一條評論要在熱評區被優先展示,除了需要有高贊數和高評論數,賬號本身還需要大概650分的“信用分”,上熱門轉發則需要690分左右的“信用分”。決定信用分的,是賬號發微博的活躍度、社交關系、舉報扣分情況等一系列指標。
換句話說,不是所有微博用戶都會被納入熱搜考量范圍,算法會篩選出“可信用戶”。“普通賬號的信用比較低的話,怎么評論都上不了熱門,微博也上不了熱搜廣場,甚至可能被屏蔽。所以平時就要多發原創微博,多帶話題跟大V互動,提高賬號的權重。”前述粉絲說。
這也許能解釋為什么能吸引更多回復的,或者來自大V的評論總能被“頂”上前排,獲得更多曝光。
王茜說,微博最初發布這一規則時,出發點是識別水軍、確保熱搜的真實性。“但大數據一定會抹除一些細節。如果要定義哪些是僵尸號水軍、哪些是活躍用戶,那些只看不常發微博的人就會被判定不可信,篩選出來的就是一批最活躍用戶的想法。”
算法抹除的不止用戶痕跡。海外社交平臺X(前Twitter)同樣具有熱搜功能,不過顯示的是詞語,而微博熱搜通常是由熱搜主持人提前設定好的一句主、謂、賓語完整的句子。王茜指出,雖然這樣看起來提供了更多事實,但仍然抹除了細節和語境,屬于一種印象式的消息,有時誤導性可能更強。
舉例來說,2021年的一個熱搜#大學教授說娶到大才女李清照是倒八輩子霉#看起來在批評李清照,其實原視頻中大學教授是在戲謔對比,但如果不點進視頻,或者沒有點進完整的熱搜頁面,很可能就會先留下先入為主的印象。
通過對內容和用戶的一系列篩選,熱搜能呈現的往往就是一部分活躍用戶的、青年群體的、更有爭議性的內容。
如今各大互聯網平臺都采用流量主導的熱搜算法,對商業發展而言是必然選擇。
蘇州大學傳媒學院執行院長陳龍認為,Web2.0技術的普及解決了社交媒體互動性問題。從“轉贊評”到“一鍵三連”,本質都是流量優先的邏輯。通過增加用戶粘性,最終將注意力作為商業化的基礎,實現自身的發展與擴張。
陳龍告訴21記者,在多個社交平臺的競爭下,爭奪用戶有限的注意力是一場零和博弈。越來越多用戶流向短視頻平臺,原本屬于微博的的時間被吞噬。從2018年初開始,新浪股價一路下行,當2021年新浪宣布退出美股時,市值已經萎縮了近五分之一。2023年第三季度最新財報顯示,微博營收32.07億元人民幣,同比下滑了3%。如何保用戶、保營收是經營者不得不思考的問題。
與此同時,微博是為數不多的公共討論場地,在社會事件的傳播上有著難以替代的影響力。中國政法大學數據法治研究院教授張凌寒提醒,在缺乏監管的情況下,沖突性的內容泛濫是必然結果。而很多冷嘲熱諷、煽風點火、陰陽怪氣等言論一旦高強度聚集,會對社會事件的當事人造成極大的傷害。
比如,在此前的粉紅頭發女孩被網暴事件、收件人被快遞員造謠出軌事件中,一條評論單看也許只是玩笑話,但海量的負面評論疊加,可能就會形成一場網暴。熱搜在網絡暴力的生成、傳播、聚合中,起著“放大鏡”的關鍵作用。
去年《關于依法懲治網絡暴力違法犯罪的指導意見(征求意見稿)》出臺,嚴懲基于蹭炒熱度、推廣引流等目的,對于網暴信息不履行安全管理義務的行為。2022年《互聯網信息服務算法推薦管理規定》要求,要建立完善人工干預和用戶自主選擇機制,“在首頁首屏、熱搜、精選、榜單類、彈窗等重點環節積極呈現符合主流價值導向的信息內容。”
盡管有了人工干預,但難題仍然不少。張凌寒指出,治理最大的難題仍是在保障言論自由和維護秩序之間找到平衡。陰陽怪氣、冷嘲熱諷的互聯網信息難以根治,一禁了之既不利于實現有效的公共討論,長遠而言也無益于和諧社會的建設。
張凌寒認為,關鍵在于通過智能識別等技術對熱搜進行及時、全面、準確的分析研判,實現靈活有效的輿論治理。陳龍則建議,語言暴力的邊界難以界定,針對具體問題建立人工管理員或投票機制,也是一種方法。
多位受訪學者還不約而同地表示,平臺熱搜的商業性和公共性存在悖論。當下亟需提高算法素養,剝除算法客觀性的光環。社會各界也不以熱搜當作傳播標準,并一味追求上熱搜的KPI指標。
“需要認識到的是,盡管熱搜在大家心中扮演了民意風向標的角色,但事實上它沒法呈現完全的客觀性。每種算法都存在一定的缺陷和偏見,要理性看待熱搜的性質。”王茜說。