你還敢用微信嗎不只敏感文字中國老大哥連圖片都有辨識審查手段

作者
發佈時間 2019/7/24 11:48:12
最後更新 2019/7/24 11:49:58

「老大哥正看著你...的微信!」中國微信(Wechat)在中國的滲透率高達 93 %、月活躍用戶超過十億,但你知道微信不只有「文字獄」審查「敏感詞」,現在就連透過微信傳送的每張圖片,也逃不過「老大哥」的敏感資料庫監控審查!過去早已不時傳出新聞,有人被中國公安傳訊,結果對方直接秀出他的私人微信對話內容,讓民眾對微信的使用者隱私保護感到懷疑

中國政府對言論的監控無所不在、無孔不入。(圖片取自公民實驗室報告)

中國政府對言論的監控無所不在、無孔不入。(圖片取自公民實驗室報告)

加拿大多倫多大學研究小組公民實驗室(Citizen Lab)日前發表研究報告,發現微信系統針對用戶所傳送的圖像建立龐大且不斷更新的資料庫,系統會自動監測、辨認出「敏感」圖片,將之加入黑名單並刪除。微信黑名單的涵蓋範圍相當廣,除了與攸關政治議題的圖片之外,美中貿易戰、華為財務長孟晚舟的相關圖片皆遭封鎖,還有許多圖片因被系統判定諷刺或貶低了中國人而無法傳送。還在用微信傳梗圖嗎?或許看著圖呵呵笑的人比你想像的還多呢!

什麼樣的圖片會被加入黑名單?

中國法律要求在中國營運的社交媒體公司必須「控制」其平台上的內容,否則將面臨處罰,因此這些網路公司必須「自律」運用技術來「對其服務內容負責」。公民實驗室翻閱過往研究資料,發現不同的中國社交媒體進行的審查幾乎沒有一致標準,此外中國政府也常對一些知名的社交平台直接下令,也因為中國嚴格審查網路文字,所以許多人試圖用傳送圖片來躲避「老大哥」監控,但這些人很快發現,圖片也無法避開審查。公民實驗室針對中國最大、每月活躍用戶超過 10 億的社交平台——騰訊微信的聊天功能進行測試,探究微信審查圖片的機制和標準。

公民實驗室在 7 月 15 日發布的報告指出,除了批評政府的諷刺漫畫、官員醜聞的相關照片之外,微信後台還會擋掉與以下 11 個新聞或歷史事件的相關照片:

ㄧ、文化大革命

二、1989 年六四天安門事件

三、范冰冰逃稅醜聞

四、2018 年重慶客車撞車事故

五、2018 年美國選舉

六、最高人民法院醜聞

七、華為財務長孟晚舟被捕事件

八、美中貿易戰

九、基因改造嬰兒

十、2019 年成都七中食堂醜聞

十一、2019 年成都森林大火

公民實驗室指出,微信定義黑名單的標準不明,除了具有政治意涵的圖片,例如 2010 年諾貝爾和平獎頒獎典禮上為劉曉波保留的空椅子、波蘭主持人在節目上表達支持臺灣等新聞照片之外,一篇作者自述其向母親出櫃經驗的文章中的配圖「鴕鳥的逃避」也被微信封鎖,公民實驗室認為原因可能是圖片有諷刺中國人逃避麻煩的「鴕鳥心態」之嫌。還有一些圖片沒有被列入黑名單的明確理由,卻也同樣遭到封鎖,其中一個案例是著名靈長類動物學家珍古德(Jane Goodall)與一隻嬰兒黑猩猩的照片,公民實驗室猜測封鎖原因可能是系統認為黑猩猩的照片是對中國人的種族歧視。

被封鎖的圖片「鴕鳥的逃避」(圖片取自公民實驗室報告)

被封鎖的圖片「鴕鳥的逃避」(圖片取自公民實驗室報告)

另外公民實驗室還發現遭到微信刪除的公開文章中所使用的配圖都會另外被系統加進黑名單,即使圖片本身並沒有「敏感」內容,其中甚至有許多是取自中國官方網站的官員照片和政策公告的截圖。公民實驗室認為,微信母公司騰訊可能過度審查其認為政治敏感或會引起公眾「不必要的關注」的事件相關圖片。

私聊、群聊和朋友圈各自有獨立資料庫

公民實驗室經測試發現,微信的三種主要社交功能:一對一的私聊、多人群組聊天、用戶發表即時動態的朋友圈,皆會被後台系統建立獨立的資料庫並以不同標準進行審查,大部分無法在朋友圈發布的圖片同樣也無法在聊天群組中傳送,但有一部分朋友圈的「禁圖」可以透過私聊傳送。每張出現在微信的圖片都會被記錄在微信後台龐大的 hash資料庫,但是否列入黑名單似乎在三項功能中標準不一,影響力較大、會接觸到人群、可能讓內容被廣傳的朋友圈受到的審查最嚴,其次是群組聊天,一對一私聊相對之下審查略微寬鬆。

另外,公民實驗室還發現微信審查的對象針對中國境內的用戶,在使用分別以中國手機號碼註冊和以加拿大手機號碼註冊的兩個微信帳號進行測試時,許多傳送的圖片中國帳號無法收到,但是加拿大號碼都能順利收到。另外,圖片被擋時微信系統也不會作出提醒,傳送人依然能看到圖片出現在對話框,但是接收人什麼也看不到,也不會知道對方嘗試傳送圖片。

公民實驗室發現微信對中國國內外的用戶審查的標準不同。(圖片取自公民實驗室報告)

公民實驗室發現微信對中國國內外的用戶審查的標準不同。(圖片取自公民實驗室報告)

公民實驗室還想確認同為騰訊公司旗下的另一個社交平台 QQ 空間是否與微信共享黑名單,經過測試發現在 QQ 空間被擋的 30 張圖片有 24 張同樣也被微信朋友圈封鎖,重複率高達 84%,之後用同一批圖片進行第二次測試時,則有 27 張圖片無法發布,重複率上升到 93%,公民實驗室推測這兩個社交平台可能共用同一份黑名單,只是新舊版本的不同。

中國微信如何進行審查?

公民實驗室測試後發現,微信透過建立每張圖片的 Hash 索引資料庫,檢查並記錄每張圖片檔案的 MD5編碼,並將其中具有「敏感」內容的圖片列入黑名單,讓用戶無法在微信上傳送這類圖片。公民實驗室設法在一張畫有中國民主人士劉曉波的漫畫(敏感內容)和另一張公民實驗室的標誌圖片(非敏感內容)的檔案中加入了相同的 MD5 編碼,測試發現兩張照片都無法用微信傳送。

左為中國民主人士劉曉波的漫畫(敏感內容),右為公民實驗室的標誌圖片(非敏感內容),加入了相同的 MD5 編碼後,兩張照片都無法用微信傳送。(圖片取自公民實驗室報告)

左為中國民主人士劉曉波的漫畫(敏感內容),右為公民實驗室的標誌圖片(非敏感內容),加入了相同的 MD5 編碼後,兩張照片都無法用微信傳送。(圖片取自公民實驗室報告)

微信利用 Hash 索引來過濾平台上的「敏感圖片」,雖然 Hash 索引並不是一種靈活的辨認程式,一旦圖片檔案的原始數據被稍微更改,其 Hash 數值就會被改變,但是公民實驗室發現如果微信用戶在傳送圖片時沒有特別選擇「發送原圖」,微信系統就會對圖片進行壓縮,並在過程中對圖片重新編碼。經過微信重新編碼的「敏感」圖片,即使經過修改,也無法再在微信上傳送,因為編碼已經被微信系統記錄。若用戶傳送一張 hash 資料庫中沒有的「新圖片」,系統會准許傳送,但這張圖片也將自動列入「待審查」隊伍,由系統檢測有無「敏感」內容,隨後就無法再正常傳送。

經過微信重新編碼的圖片,其編碼已經被微信系統記錄。(圖片取自公民實驗室報告)

經過微信重新編碼的圖片,其編碼已經被微信系統記錄。(圖片取自公民實驗室報告)

公民實驗室嘗試對「敏感圖片」檔案進行修改,包括調色、降低畫素、增加黑格等方式,為每張投入測試的「敏感圖片」做出 10 個有微小差異的版本,測試微信系統是否會將被改過的檔案過濾掉。結果發現,即使有部分動過手腳的「敏感」圖片在第一次測試時騙過微信系統順利傳送,但也在短時間之內被系統識別、加入黑名單。公民實驗室的測試為期一個月,總共製作了 30 張經過微調的圖片,在實驗結束的時候沒有任何一張可以在微信傳送。

最後由於公民實驗室使用的微信帳號大量傳送「敏感」圖片,被微信系統關閉,而申請新帳號非常困難,公民實驗室表示新帳號必須被另一個帳號批准,而另一個帳號必須存在六個月、「信譽良好」、一個月內未批准其他帳號成立,因此無法再在微信上進行更多測試。

註解

  1. 簡稱文革,是一場於 1966 年 5 月至 1976 年 10 月間在中華人民共和國境內所發生的政治運動。文革是由時任中國共產黨中央委員會主席的毛澤東與中央文化革命小組,自上而下動員成千上萬紅衛兵在中國大陸進行全方位發動的階級鬥爭。普遍認為官方鼓勵的批鬥、抄家及告密等過激行為,使中國傳統文化與道德淪亡,整體經濟受嚴重影響,受害人數以千萬計,亦有人指不少文物都遭到紅衛兵的蹂躪。時任國家主席劉少奇、十大元帥的彭德懷和賀龍等領導人被迫害致死,鄧小平、陳雲等黨內高層亦在此期間被下放,習近平之父習仲勳、薄熙來之父薄一波等人更被打倒監禁。
  1. 中華人民共和國政府稱為 1989 年春夏之交北京發生的政治風波,廣義上稱為八九民運,是自 1989 年 4 月開始,由中國大學生在北京市天安門廣場發起,持續近兩個月的全國性示威運動。狹義上又指六四清場,即 1989 年 6 月 3 日晚間至 6 月 4 日凌晨,中國人民解放軍、武裝警察部隊和人民警察在北京天安門廣場對示威集會進行的武力清場行動。至今六四事件在中國仍是敏感話題。
  1. 指 2018 年中國收入最高的女演員范冰冰及其擔任法定代表人的企業因偷逃稅款遭調查及處罰的事件。范冰冰本人因此事失蹤長達 4 個月,最終追稅、罰款共 8.9 億人民幣。
  1. 於 2018 年 10 月 28 日上午 10 時 08 分發生在中國重慶市萬州區萬州長江二橋的一起交通事故。當時一輛萬州公車由長江南岸的江南新區開往北岸萬州城區,行駛途中車輛突然越過道路中心實線,撞擊對向正常行駛的紅色小轎車後墜入長江。隨後將車體與乘客從江中進行打撈,根據公開還原的車內錄影顯示,彼時司機與乘客發生衝突,司機向左轉動方向盤過猛直接導致了車輛墜江。事故導致包括司機在內的 15 人遇難。
  1. 在 2018 年 11 月 6 日週二舉行,本次中期選舉是在共和黨籍總統唐納·川普的第一屆總統任期舉行,被視為 2020 年美國總統選舉的風向指標。 美國眾議院所有 435 個席位和美國參議院 100 個席次中的 35 個席位將進行改選。36 個州的州長,美國海外 3 個領地,以及華盛頓特區市長,共 40 位地方首長也將進行改選。
  1. 2018 年底,中國最高人民法院出現案卷失蹤案。涉及一個千億元礦產所有權的案卷在戒備森嚴的最高法院失蹤,監控案卷所在的辦公室的監控設備兩套也同步出現黑屏故障,無法調看監控錄影。最高人民法院法官王林清公開表示,發現案卷失蹤後,最高法院沒有報案,而他也特別不能理解監控錄影怎麼會兩套雙雙壞掉。
  1. 是在 2018 年 12 月 1 日,加拿大警方應美國政府司法互助要求逮捕在溫哥華轉機的中國華為公司副董事長兼財務長孟晚舟而引發的涉及中、美、加三國的司法、政治、外交事件。孟晚舟被逮捕時面臨美國紐約東區聯邦地區法院的指控。初時加拿大未明確指出逮捕孟晚舟的理由,但眾多傳媒均報導指出孟晚舟很可能是因華為涉嫌違反美國出口管制向伊朗出售「敏感科技」,並」以假帳資料掩護「而被捕」。事後,中國駐加拿大大使館於 12 月 6 日表示堅決反對並強烈抗議,向美國和加拿大兩國提出嚴正交涉,要求它們立即恢復孟晚舟的人身自由。12 月 11 日,孟晚舟獲卑詩省高等法院准許保釋,案件延後到2019年2月再審。2019 年 1 月 28 日,美國代理總檢察長惠塔克,商務部長羅斯,國土安全部部長尼爾森以及聯邦調查局局長克里斯多夫·A·瑞伊在美國司法部舉行聯合新聞發布會,宣布正式要求引渡孟晚舟,並以 23 項罪名起訴華為。
  1. 貿易爭端源起於美國總統唐納·川普於 2018 年 3 月 22 日簽署備忘錄,宣布以「中國偷竊美國智慧財產權和商業秘密」為由,依據 1974 年貿易法第 301 條指示美國貿易代表對從中國進口的商品徵收關稅,涉及商品總計估達 600 億美元。2019 年 5 月 5 日,川普宣布對另外價值約 2000 億美元,合共 2500 億美元的中國輸美商品徵收 25% 的關稅,該措施於 6 月 1 日起正式對到達美國港口的中國商品生效。貿易戰開打以來,中國經濟蒙受巨大打擊,股市一度直線下跌。
  1. 是中國南方科技大學生物系副教授賀建奎及其團隊於 2018 年通過基因編輯技術,對一對雙胞胎嬰兒胚胎細胞的 CCR5 基因進行改造,從而使嬰兒獲得可遺傳的對部分愛滋病的免疫力的爭議性事件。因為基因編輯嬰兒本身涉及仍未解決的倫理和技術問題,此事引起中國國內外強烈反對和譴責。
  1. 2019 年 3 月,成都七中實驗學校小學部家長發現學校食堂使用腐爛的肉以及發霉的麵包作為食材,滋生不滿情緒,繼而進行群體抗議之事件。涉事後勤集團亦服務於多所學校,亦引起當地家長群體的擔憂。該事件發生在 2019 年中國大陸兩會期間;承接於 1 月份江蘇金湖過期疫苗後又一起關於兒童健康的公共事件,從而引起較高關注,由於成都七中學費昂貴,是當地名校,事件曝光後後政府又安排「假家長」出面維護學校,種種舉措令民憤沸騰。
  1. 指 2019 年 3 月 30 日至今在中國四川省涼山彝族自治州木里藏族自治縣雅礱江鎮立爾村發生的森林火災。當日雅礱江鎮立爾村一處海拔 3800 米的山坡發生森林火災;隨後,縣、州兩級政府啟動應急預案,並投入了 689 名消防員前去滅火。截至 4 月 4 日,共有 27 名森林消防指戰員和 4 名地方撲火人員因風向突變在火災中殉職。
  1. 雜湊(英語:Hashing)是電腦科學中一種對資料的處理方法,通過某種特定的函式/演算法(稱為雜湊函式/演算法)將要檢索的項與用來檢索的索引(稱為雜湊,或者雜湊值)關聯起來,生成一種便於搜尋的資料結構(稱為雜湊表)。
  1. 是騰訊公司於 2005 年推出的一個 blog 系統,目前活躍於中國。
  1. MD5 訊息摘要演算法,一種被廣泛使用的密碼雜湊函式,可以產生出一個 128 位元的雜湊值,用於確保資訊傳輸完整一致。MD5 由美國密碼學家羅納德·李維斯特設計,用以取代 MD4 演算法。這套演算法的程式在 RFC 1321 中被加以規範。 將資料運算變為另一固定長度值,是雜湊演算法的基礎原理。