【Back Up 香港.2】後真相時代 Fact check 的技藝與堅持
先閱讀【Back Up 香港】專題前言,以及第一篇文章《維基百科編輯戰:誰在定義香港抗爭?》
國安法生效後的首個書展,本土政治社運書幾乎絕跡,取而代之是建制觀點的歷史、法制研究和中共黨政人物的著作。
中聯辦全資擁有、主導書市的「三中商」集團,門店仍在售的「反修例運動」書籍均傳遞官方論述,抽空脈絡地大量展示「黑暴」、遍地磚頭與火舌,讚揚「正義的警察」,批判「亂港政棍」,將整場運動定性為外國勢力資助的「本土恐怖主義」、「港獨」及「顏色革命」。
翻閱這類書籍,發現當中不少已洗脫傳統黨媒味道,由文筆、排版到敘事方式都接近專業報導水平。例如以溫情的人物特寫訪問拆路障的市民、受影響商戶、被批鬥的藝人、「正義」老師、前線警員等。其敘事更自成一套邏輯,故意略去對政權不利的部份;若非本已對事情前因後果非常清楚,很容易被說服。
2021 年書展一角。
以往要為歷史事件保存真相,需要收集的證據主要是文件檔案、相片、新聞剪報;但 2019 年發生的一切,很大部份在網絡上進行。Telegram channel、連登討論區和私人群組擔當著組織動員、實時報料、集資及善後支援等角色,亦有大量經修改剪接、或缺乏證據支持的假消息通過這些平台流傳。
若不熟諳這些網絡平台的運作和語境,即使在事件發生的當下都會跟運動脫節;要進一步保留整理網絡上發生過的事、讓後人都能立體地理解這場運動的實況,已牽涉到更專業的數據搜集和分析能力。
一直研究中港社交平台資訊戰的香港大學新聞及傳媒研究中心副教授傅景華觀察到,去年 7 月國安法生效後,大量活躍於反修例運動的 Telegram channel 追蹤人數大跌並陷入停運,相反立場偏向「藍絲」社群的 channel 則繼續活躍。此消彼長之下,這場記憶與遺忘的戰爭不容樂觀。
傅景華
* * *
在數據的海洋中重組事件
傅景華團隊建立的「反修例運動研究數據庫」,至今已發表了幾項由數碼資料整合的研究成果,包括整場反修例運動的時間軸、催淚彈地圖、各區的公眾活動地圖、文宣搜尋器及被捕者統計等。項目研究材料主要來自 2019 年 6 月起從逾千個 Telegram channel 收集到的訊息,包括文字、相片和影片等;亦搜集了 Facebook、YouTube 和 Twitter 的數據,並配合主要媒體的新聞報導作佐證。
歷史學者對實體檔案文獻已發展出專業的鑑別方法,但當大量資料僅有網上版本,在有圖未必有真相的時代,這些數碼材料將來是否可以成為歷史證據?備份時又有何「搜證」的基準?
傅景華解釋,核實數碼資料的工作有兩個層次。第一層是確認材料本身的來源、以及有否經過修改。目前團隊使用的軟件,在搜集材料的時候已紀錄了每則資料的來源、發佈日期和時間等;亦有電腦技術可以檢驗圖片及影片是否經過修改或剪接。
確認數碼材料並非偽造以外,要證明它跟真實發生的事件有關,就是第二個層次的 fact check。比如有人在某個時間點發佈一張顯示警察在黃大仙放催淚彈的照片,而照片被驗證是未經修改的,但事情是否一定在照片於 Telegram 發佈那刻發生?「這個就要再尋找多一個資料來源對證,」傅景華說,「可能是現場目擊者,或者同時有其他 channel 和報導都提及這件事,或在不同的角度都拍攝到這件事。」
研究團隊整理催淚彈地圖的初衷,是見到無論警方或傳媒,都只會報導當天發射催淚彈的總數,而沒有分區數字及使用地點;若有人想研究催淚彈使用方式及其地區性影響,會需要更詳盡的地理位置數據,這方面的資料基本上只能從多個實時報料 Telegram channel 搜集。團隊綜合 84 個全港性及地區報料群組、以及 8 條由傳媒經營的 Telegram 頻道,以電腦程式整合當中提到發射催淚彈地點及時間的訊息,亦要求有多於一個頻道同時報料,才採納為製作催淚彈地圖的數據。
傅景華表示,更仔細的 cross check 可再對照相片、影片及傳媒直播片段,「但這項工作非常艱鉅,須由人手去做,暫時無電腦技術可代替,我們目前仍未有資源去處理所有已備份的影像數據。」項目在搜集和儲存數據方面的成本有限,最昂貴的是做 cross check 的人力和時間。
催淚彈彈殼(資料圖片)
單以 Telegram 來說,研究團隊搜集到的資料仍只應用了一部份,有很多原始資料仍待分析和發掘。傅景華說,已採樣備份的逾千條頻道及群組其實有很多種類,有純粹為反修例運動而開設的,也有十八區的分區行動群組;有從事報料、文宣製作、甚至「起底組」,有一些是由政黨、議員或輿論領袖開設的個人頻道,或主流傳媒開設的頻道等;亦包括不少「藍絲」、建制陣營開設的頻道和群組。
至於反修例運動另一個活躍網絡平台連登討論區,團隊並沒有採用為數據分析的資料來源。傅景華解釋:「主要原因是很難判別一個連登發帖人背後的身份,Telegram 基本上會開宗名義講,這個 channel 目的是什麼,甚至很多時 disclose 了經營者的身份,那就可以做分類,是屬於媒體、政界、或者自發性組織。但連登沒辦法,它只有一個用戶名。」
知道身份和目的的重要性,在於 cross check 時需要對照獨立資料來源,「就算有多於一個人轉發,它的來源可以是來自同一個、而不是『獨立』的消息來源。兩個無關係的個人或者機構、或者黃絲同藍絲的群組在同一時間講到同一件事,你就可以核實了。但怎樣為之 independent source,每個 source 的背景、或者需要去找目擊者的時候,怎樣去 identify 某個人,這些都沒法單靠工具做到。」
* * *
局部的事實並非真相
真相的呈現,並不止在於事情有沒有發生,還包括事件之間的因果關係和比例。傅景華指出,目前建制陣營對反修例運動的說法,很多時是用了「以偏概全」的方式、高度簡化為「暴力」而不談背後的原因和脈絡。
以大公報出版的《哭泣的城市:香港修例風波實錄》為例,書中大量刊載黑衣示威者築路障、挖磚頭、手持棍棒或傘陣的新聞照片,並按金鐘、中環、旺角、黃大仙等分區去編排敘事,以呈現各區都有暴徒衝突和破壞的場面;開首一章的「時間線」亦略去不利於政府及建制陣營的重要事實,例如觸發 6.16 二百萬人遊行的梁凌杰墮樓、7.21 白衣人襲擊市民、8.31 太子站「警暴」、11 月警方主動圍困理工大學示威者等。
傅景華團隊在建立「反修例運動研究數據庫」時,就將完整而客觀公平的時序整理列為首要任務,並配合「動員地圖」去呈現「暴力」以外很多不同性質的公眾行動,例如和平悼念、人鏈、展覽、放映會等。「你從時間軸去睇就可以見到,第一,絕大部份、好長的時間裡,其實都是和平的示威和活動,所以政府官員純粹用『暴力』去形容整場運動、將所有參與的人都講成是『暴力』,是以偏概全。」
星光大道
「第二就是,有暴力事件而不去看它的起因是什麼,也是一種以偏概全。在時序上,是因為政府要推行一條法例,好多市民認為影響深遠而反對,而政府的處理上無辦法回應到公眾的要求,運動才不斷升溫,及至後期有暴力衝突出現。這是我覺得點解要整理返基本資料的原因,今日可能你同我都知道件事係咁;但過多十年八載,其他人去睇的時候,好可能就會用返香港政府的講法:『就係暴力啦』,但實際上唔係。」
任職於學術機構,傅景華自覺有更大責任去完成資料整理和保存的工作,「對於其他地區的人,要了解香港發生咩事,會好難判斷哪些消息來源是可信、傳媒報導也有很多不同角度。外國政府要決定對港的新政策時,好需要一些經核實的資料、尤其是大學提供的資料作參考。」團隊除了製作數據庫網站外,亦發表了刊於學術期刊的論文,讓研究成果比新聞或民間研究多一重學術標準的認可。
他舉例說,去年 9 月加拿大移民及難民部(Immigration and Refugee Board of Canada)就香港社會運動的情況發表評估報告,除參考媒體報導外,亦有引用「反修例運動研究數據庫」的資料,及後加拿大政府公佈放寬港人移民條件。
目前數據庫內容允許非商用轉載,亦開放了催淚彈地圖及動員地圖的 shp. file 下載,讓學界、媒體或民間機構可以結合其他空間數據作進一步的研究或工作;像〈彭博社〉今年初就採用了這些資料製作數據新聞,呈現香港各區在反修例運動時發生的事件及其後景觀變化。
「數碼資料要成為歷史可能是很多年後的事,我就相信這些資料將來會好有用的,所以一定要好好保存。」
* * *
憤怒下的「未睇先 share」
民間團體「事實查核實驗室」(Factcheck Lab)去年 5 月成立,其執行編輯鄭家榆從前擔任網媒編輯,一直關注網絡流傳的假消息及偽科學資訊,自反修例運動起亦有紀錄假新聞的流傳情況。他觀察到在緊張的社會氣氛下,無論黃藍陣營均有流傳不實消息。其中一種很常見的方式,是政界人物照被配上「設計對白」的圖片,由於訊息簡單直接,很容易被廣傳。
「這類 fact check〈求驗傳媒〉(FB 專頁)做很多,通常句 quote 都好離譜的,但因為佢夠爆,令人好嬲,無細心諗就會 share 咗先。但如果講過咁爆的說話,媒體一定會報導,若找不到,基本上都可判斷是假消息。」
鄭家榆就這類假圖做了些整理,發覺受害者主要是建制派,例如 2019 年 10 月《基本法》委員會副主任譚惠珠的照片被配上「香港境內土地及土地上人命都屬於國家,任何執法時人命傷亡不用向公眾交代」;同月警隊員佐級協會主席林志偉的照片亦被配上「必要時殺 20 萬人保 20 年繁榮穩定」的字句。
每逢發現這類假圖,鄭家榆會在 Facebook 搜尋圖片的語句,點選「照片」的一欄就可找出包含該虛假言論的圖片,從中追溯該圖最早在 Facebook 出現的來源。他發現有些是來自內容農場式群組,例如「On9 病病院 2.0 / 3.0」,也有些立場傾向「黃絲」的專頁如「有種責任叫堅持」、「二次創作權關注組」等,但更多是個體戶,像「nini.ng.9028」
、「calvin.kwan.790」兩個個人帳戶,曾在過去兩年間多次分享這類假圖,可說是「慣犯」。
2019 年的假圖主題大多是煽動市民對警方暴力執法的憤怒,2020 年起則較多是關於國安法。「我找到的假語錄圖中相對少是迎合『藍絲』政治立場的,原因不清楚,他們好像比較少用這種形式。」其中一個符合「藍絲」角度的例子,是去年 7 月時任「公共醫療醫生協會」會長馬仲儀照片被配上「我地既良知就是死幾多病人都唔會接受內地醫護」的句子。
* * *
「黃絲法官」批鬥潮
然而,藍營流傳的另一類假新聞其實更難對付。鄭家榆指出,自去年起不少建制立場的 Facebook 專頁及群組經常斷章取義地評論示威相關的法庭判決,營造「黃絲法官放生暴徒」、「法治已死」等論調;部份甚至以 infographic 及統計數字的方式呈現。若不細心了解案情及判辭,很容易被誤導。
其中一個被「藍絲」針對的法官是何俊堯。去年 8 月,名為「香港警察,忠誠勇毅,心繫社會,加油。」的 Facebook 群組流傳一張 infographic,比較三宗由何俊堯處理的示威案件、及另外三宗「同樣案情」但由其他法官判了更種刑罰的案件,營造何俊堯偏幫示威者的形象。但實際上所謂「同樣案情」的案件細節大相逕庭。
例如 2019 年 3 月「三名眾志成員衝擊立法會」案,被告是於《國歌條例草案》公聽會上舉標語、播國歌及離開座位而被控違反《立法會(權力及特權)條例》的行政指令,結果每人判罰款 1,000 元;而該圖用作對比的另一宗「33 歲男衝擊立法會」案,則是兩名被告於 2019 年民陣 6.9 遊行後於立法會示威區衝擊警方防線、被控非法集結及襲警罪,結果判入獄 4 個月。兩宗案件的性質及控罪均有明顯輕重差別,該圖片卻皆稱為「衝擊立法會」並作出誤導公眾的對比。
另一個被扭曲判決理由的是裁判官林希維。去年 8 月「全民抵制毒果日報」的 Facebook 群組內,有帖文轉述林對 2019 年 11 月馬鞍山伯伯被淋易燃液體及燒傷一案的判決,指林希維認為馬鞍山伯伯「與在場人士對罵,甚至比其他人士更惡死」所以被燒到也不能怪其他人。
但實際上,該宗案件的被告只是一對沒有參與縱火的旁觀夫婦、被控「在公眾地方作出擾亂秩序的行為」。而該控罪如要成立,須證明被告意圖激使他人破壞社會安寧、「使人害怕自己的人身或財產會因襲擊、毆鬥、暴動、非法集結或其他騷亂而實際或相當可能受到損害」;故此林官才按事發經過分析,馬鞍山伯伯有逃跑機會但反留在現場指罵他人、足證兩名被告並沒有令他害怕,故此判罪名不成立。
「但那個 post 就將件事講成:法官認為佢鬧人、所以佢俾人燒都係抵死。」鄭家榆說,類似扭曲判決理由的帖文多不勝數,而且很難對付,「因為他在很技術性的地方下手,你要研究條控罪的定義和案情才能知道問題所在,但對方好容易就抽出一句半句無 context 的說話出來,而且被廣傳。」
* * *
改變世界,從了解現實開始
假消息的源頭一旦被發現通常很快消失,用以對證的資料和新聞報導也未必能長存於網絡上。為了迅速備份網頁內容,鄭家榆經常使用美國非牟利組織 Internet Archive 提供的網絡工具 Wayback Machine。它除了會定期 back up 一些主要網站的頁面外,網民亦可以提供具體網址去 back up 自己有用的網頁,或搜尋特定網頁過往的備份紀錄,比對當中的內容有否更改。一般網民都可以免費註冊帳戶,亦可在瀏覽器安裝 add-on 軟件方便使用。
另一個他常用的工具則是 CrowdTangle,較多為市場推廣及媒體從業員使用,須由已持有帳戶者邀請才能開戶。該工具可分析 Facebook、Instagram 和 Reddit 上公開帖文的數據表現,找出討論度高但內容可疑的帖文進行 fact check;也可自訂關注清單,例如鄭家榆就會按不同時事主題及政治光譜建立清單,方便找出如建制派、熱血公民系、反抗疫派等不同圈子的專頁當時最熱門流傳的內容。
Wayback Machine 可以搜尋特定網址的備份頁面,圖中月曆顯示《立場新聞》首頁於 Wayback Machine 中已有備份的日子。
「這項功能好重要,可以突破社交媒體演算法的同溫層效應。」鄭家榆說:「如果用自己的 Facebook 作為搜集資訊的工具,一定會受到演算法和自己的偏見影響。我揀選帖文來 fact check 時都會提醒自己,不要只 check 某一邊陣營的內容,或者我唔鍾意這群人就 check 佢多啲,主要按它的流傳程度和議題的公共性作為考量。」
他認為虛假或誤導消息被流傳,最大問題是會影響公共討論的聚焦。自從 2019 年 8.31「打死人」傳言後,大量網民研究自殺疑案,認為是警方將打死了的示威者或其家屬棄屍。然而,鄭家榆指出當時網上流傳的自殺個案列表多有錯漏,例如重覆計算相同案件、未有剔除自殺不遂的個案等,造成「自殺個案飆升」、「突然多了很多年輕人自殺」的觀感;實則對照 2019 年死因庭發佈的數字,自殺總數及年齡分佈並沒有跟過往趨勢有明顯分別。
「打死人或者被自殺的講法,背後是由情感帶動的關注,實際上我們到現在都找不到很有力的證據去覺得 8.31 有死人。但本來關注這件事是可以有好多面向的,例如警察在車廂裡狂噴胡椒、扑警棍,這種武力是否恰當?相關的討論就會少了。你亦都可以見到,政府、警察或者『藍絲』陣營,而家係咁話 8.31 打死人是假消息、假新聞,重點去了有無打死人。係咪無打死人件事就唔值得討論?唔係架嘛。」
8.31 晚,多名警方速龍成員及防暴警察衝入太子站往中環月台及列車,以警棍不停毆打車廂內示威者、市民。 (梁柏堅@米報)
對於「黃絲」圈子也流傳不少假消息,他認為,要是為求引起公眾關注、燃起反抗熱度,就算消息真假未辨都先流傳,最終很可能引起反效果。「如果有人想用假消息作為一種策略,要好小心去考慮。」
「但我會覺得除了談策略,假消息最主要的問題,就係因為佢係假架囉。」他對於這個有點像黎明金句的答案笑了一下,「這首先是一個倫理問題吧?假消息本身,會令人對好多嘢失去信任,對公共討論好有害。而且任何想改變現實世界的人,必須先了解現實,不然是改變不到它的。」
攝影/Oiyan Chan