高原萬里
高原萬里

香港人,居英國,好遊牧。不想繼續因為生活而遠離文字,現在又努力重新執筆中。沒有了不能活下去的東西有:蝦子餅、咖啡、小說、旅行和麵包。

剪不斷,理還亂,去或留。 唯有谷歌難放手。

Photo by Kai Wenzel on Unsplash

談開科技巨頭,就繼續小小說下去。

Google,中文譯名是谷歌。

因為近期人們熱切討論的都是科技巨頭是不是權力過大,有沒有限制到我們的言論自由的問題,所以注意力都集中在 Facebook、Twitter、Instagram身上,倒沒有很多人提起另一家同樣手握大部分個人資料的巨無霸級科技公司——谷歌。

也不是完全沒有人提到,網傳有 KOL 用 Google Translate 加入一句 China breaks promise,轉成繁中就變成「中國信守承諾」,輸入 America breaks promise 後,就被正確地翻成「美國違反承諾」了,然後沾沾自喜地說了一句「附合國情」。當時有不少人跟著試玩,有人說翻譯無問題,有人說自己的結果和 KOL 的一模一樣。我覺得,出現這個現象的原因可能是 Google 的翻譯 AI 出錯了,不代表中共可以隻手遮天到這個地步。

基於好奇,今天我也用 Google Translate 試了試,發覺䌓簡翻譯完全沒問題,中文之外我又試了幾個外語,用完 Safari 又用 Chrome,然後用 Microsoft Bing,甚至上百度再譯一次,一樣無事。

如果連百度都可以提供正確答案,那中共又如何迫 Google Translate 去篡改它的翻譯呢?而且網上翻譯用的都是 AI,非人手操作的。

無論如何,在網上為了這種事起閧,真的很無聊。

被收服的果凍

撇開 Google Translate 有沒有遭到鬧劇式荼毒不說,谷歌、雅虎、臉書等矽谷巨企為了進入龐大的中國市場,著實放棄了不少原則,甚至積極參中國式的網絡過濾法。去年夏天看了 James Griffiths 的《牆國誌》(The Great Firewall of China),由網絡降臨中國的黎明期一路說起,詳述中共二十年來如何一步一步、有系統地把本來應該是與國家權力對立、讓每個微小的平民都有發聲機會的互聯網操控起來,而且不只在國內封得滴水不漏,甚至還積極地把這一套中國上網模式輸出給俄國和非洲一些極權國家,近年還反客為主,用網絡來對世界進行統戰,真的可謂神之手也。

書中作者引述,西方當年笑中國要控制根本不能控制的互聯網,跟想把軟爬爬的果凍釘在牆上沒分別。二十年過去,原來不只中國做到了,就連西方一些人也學懂了如何利用網絡來把群眾的情緒控制得死去活來。

James Griffiths 的《牆國誌》中譯本

也不去到中俄那麼遠,即使人在英國,一樣可以從日常的網絡生活中感受到中國的力道,例如每次用來查中文都讓我很洩氣的 Google Search。

自從近幾年開始,每一次我在搜尋器打入任何中文字,出來的頭幾頁結果都一定是內地的網頁,要按後好幾頁,才看到幾隻熟悉的䌓體字,如果一定要找䌓體網頁,就必需在搜尋器中鍵入 site:hk 或 site:tw,可是這樣很麻煩,曾經試過去 Google 的設定中看看可不可以把䌓體網站設成優先,可是目前還未找到這個選項。

我輸入的明明是䌓體字,為什麼出來的結果卻是簡體字呢?為什麼只要偵測到是中文,就先推一大堆內地的文章呢?那裡跟我的文化不同、生活環境不同、思維不同、寫出來的每隻字都不同,自然跟我想找的東西有很大的差落,Google 也不會一味餵英國人看美國的東西吧?

也許在港台的 Google 還是會先推本地的網頁,然後才會列出內地網站,我不太記得了,總覺得在某一個時點開始,我的 Google 就一切以內地資訊為先。

一個簡單的搜尋器,讓我深深地感受到「文化霸權」是什麼回事。 

不只 Facebook、Twitter,Google 當然也可以影響我們看到什麼、看不到什麼。

沒有秘密的 Gmail

2020年幾乎一整年都在斷斷續續的封城中。

話說到了十月,我開始因為長期禁足而感到焦躁,還失眠。在一封跟朋友訊苦的 Gmail 電郵中,我很清晰地寫了一句「I want to buy a car」,因為有車子的話,至少可以離開自己居住這區,即使只能到郊外散散心也是好的。

隔天,我的 Facebook 和 Safari 就被汽車廣告洗版了。

很多年前,有人教我打電郵一定不要直接寫上自己的電郵地址,至少要在@前後加上括號,例如 hellokitty[at]hellokitty[dot]com 之類的。這個動作近年已經少做了,沒想到的是,竟然連我跟朋友之問的私人對話,一樣被看得清清楚楚。現實中 Gmail 當然沒有人有這個空去看我這麼一個微不足道的人的郵件,是它背後的 AI 在自動分析我通訊中的用字。根據維基,Gmail 到 2019 年10 月為止,用戶已達15億人,所以 Google 手上掌握的數據量之龐大,除了軍方或其餘一兩個矽谷巨擘外,大概無人能及吧。我們發出的信件是「文字檔(live text)」,Google 的 AI 運用 NLP(Natural Language Processing),把文字檔中未能搆成有用訊息的雜碎篩選出去,再抽出重要的關鍵字,這樣,很容易就可以猜出每一位客戶的心思。

例如,從商業的角度去看,我那一句「I want to buy a car」中,「I、to、a」可有可無,而「want」就表示了明確的慾望,「buy」是關鍵的動詞,「car」是跟在關鍵動詞後的名詞。如此,再結合 Google 海量的電郵數據,要得出這個 Gmail 用戶有想買車的打算的結論不難。再加上如今大部分的網頁都有內嵌 Google Analytics,當我再去其他地方上網時,Google Analytics 就可以把我的戶口和那些網站對上,不只更能清楚地歸納出我是怎樣的一個人,各個網站的運作人和他們使用的行銷公司(例如 Google AdSense)也可以在我瀏覽的網站放入專為我度身訂造的廣告。

等價交換的依賴?

雖然看到 Facebook 和 Safari 被汽車廣告洗版心裡有點不舒服,但我卻沒有想到要停用 Gmail,不是特別對它情有獨鍾,而是不可以不用

從網頁安全的角度去看,最好是自己買一個 domain,再從那裡建立自己的網址,身邊也有人這樣做,甚至網購一個 email、交稅一個 email、跟朋友通訊一個 email、連跟大廈的管理處通話都另開一個 email。私人 email 我也用過很多次,問題是通常一個電郵只可用一兩年,然後我就會開始收到排山倒海的垃圾郵件,原因可能是我的通訊錄中有人被病毒感染了、又或者是我登記過的不知哪一個公司網站被「駭了」,客戶資料流到黑市去,然䶃我每天早上一起床就是看這些:

Willie Works Excellent!
Harder and Longer!
Make her worship you!!

上面的垃圾郵件在講些什麼不用我譯了吧⋯⋯每天起來都兩三百個這樣的headlines,我份早餐都不用吃了。

這種情況一開始就沒救了,那個電郵只好廢掉。所以我總是開了新電郵又要改,開了又要改,漸漸地,我用來跟人溝通的重心都轉到 Gmail 上,同樣因為 Google 所收集了的極大量的數據,讓它們的垃圾郵件過濾器比誰都優。雖然近日我用開的私人domain 公司說他們已經改良了對垃圾郵件的過濾了,但無論怎樣改,都很難跟 Google 比吧。

除了 Gmail 不能不用之外,其餘還有不少 Google 做出來的很出色的軟體,現代人也很難不用,例如 Google Doc、Google spreadsheet、Google Map、Google Translate 等,有誰可以完全脫手?就算你在私人層面上不用,工作上也躲不了,很多公司都用 G Suite,無他,因為對於不少中小企來說,要什麼都自己來太貴了。我也知道有幾家明明是做 Cyber Security 生意的公司,本身都在用 G Suite,把公司內的通訊和商用文件全都拱手放在 Google 的侍服器上。

2019 年我因為身體不適等不及NHS,跑去看私家醫生了(好X貴),那個醫生竟然用 Gmail 來傳送我的病歷!我覺得,我絕對可以引用 GDPR 來投訴她的。


為什麼網上的廣告就特別讓人覺得反感呢?明明去7仔買一本《壹週刊》,裡面會有廣告;買一份報紙,裡面也有廣告呀。

可能就是上面提到的,大型科企在背後鬼鬼祟祟地幫我們做 profiling,再給我們餵別出心裁的廣告這回事吧,讓我們覺得自己由一個有血有肉的個體變成一堆被人用來掘金的數據。

其實我們從來都只是數據。

可是換一個角度來看,假如你是一個設計師,見工要要帶作品集的,而凖備作品集其中一個要點就是要揀出會引起你的對象興趣的東西,如果你明明去見一間 Fortune 100 的跨國企業,那裡想找人做年終簡報,你卻不斷地給他們看你的童書作品,你叫人怎樣請你?從這個角度想,行銷者想找出他們應該針對的客層,進而對他們送出應有的廣告,其實也不是一件那麼邪惡的事吧。

近日身邊有人因為工作需要而向 Amazon 租了AWS(Amazon Web Server)用,12個一般容量的侍服器只租一天,要價400鎂。那只一個客人、一件短期工作而已,試想想 Google、Facebook 等用戶以億計的服務,他們要維持的數據有多龐大多昂貴?跟據 CRN 的報導,2019 年 Facebook 花了 160 億鎂在數據中心上,如果不是發生武肺,它們還得繼續建新的數據中心。對於一般使用者來,Google、Facebook 等服務是免費的,如果沒有廣告,這樣一類如同燒銀紙的生意,要如何維持?

說到底,科技公司不是公共部門、不是慈善中心、不是NGOs,即是它們是以上三項,也還是得顧及收支平衡。

不是想為 Google、Facebook 濫用客戶資料開脫,只是想試著從基本營運的方面來看,科企利用我們的個人資料賣廣告,也許是無可厚非的事,我們因為是免費所以一真用得很開心,其實我們一早就付錢了,明知是上繳個人資料,但一些人還是會用,說到底,這可能只是等價交換而已。

如果事情只留在商用階段,情況也許並不那麼嚴重。但假如說個人資訊和話語權是二十一世紀的新油田,那麼 Google、Yahoo、Facebook、Twitter 等公司的權力就無限大了(其實 Apple 也有我們的指紋和臉部辨識特徵,TikTok 嘛,是來自中國的),事實上 2018 年爆出過 Cambridge Analytica 事件,直接影響國政。

中學時上經濟學課,第一堂第一句是:There is no free lunch。

這個世界沒有免費午餐。

Quote 一句很多人都 quote 過的話:

If the service is free, then you are the product(如果那服務是免費的,那你就是商品囉)

其實也沒有必要把科企當成是洪水猛獸,電視台的節目一樣對人有很大的影響,正正經經印出來的報紙,也是良莠不齊,自己的意志最後還是由自己把關,雖然這樣說有點老套。


CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…
加载中…

发布评论