讚賞公民共和國

化讚為賞 回饋創作 https://like.co

何以數碼內容沒有像 ISBN 一樣的註冊資料庫?

Photo by form PxHere (CC0)

ISBN 對於出版物來說除了是一個唯一的識別碼外,還承載着一些相關的元數據,諸如基本的書名、作者,還有語言、出版人、出版地及出版時間等的資訊。有了這個識別碼及相關元數據,除了有利建立全球性的銷售/管理系統外,甚至可以用來建立一套系統讓作者和插畫師按其出版物於公共圖書館的借閱次數的比例來獲取回報。


那麼,一個針對數碼內容而設的註冊資料庫有甚麼用途呢?首先做一些假設:

  1. 世上已存在一個龐大的數碼內容註冊資料庫
  2.  絕大部份的創作者在完成創作的同時都能簡單地、低成本地將其數碼內容註冊到這個資料庫
  3.  所有展示數碼內容的地方都能輕易找到其對應的唯一識別碼

基於以上假設,有一些應用場景便會立馬浮現出來:

  • 查閱數碼內容的授權方式
  • 當一個數碼內容產生利潤時,可以按該內容的所有持份者來作出分成
  • 一個數碼內容的存在證明 (Proof-of-Existence)

查閱數碼內容的授權方式

在現今互聯網,絕大部份的內容使用者都不太關注內容的授權方式,而當中不太關注的人也往往是因為根本就太難去找到一個數碼內容的授權方式,久而久之也就不了了之了。

一個簡單的實測,嘗試找一下迷因(meme)原圖的授權方式吧。我就來找找這條「哲學速龍」(Philosoraptor)究竟是甚麼授權方式吧。

Philosoraptor by Sam Smith (CC BY-NC)

用了10秒,找到了大量上面那張圖,跟著用了5分鐘看 knowyourmeme.com 且瞭解到原圖是 Sam Smith 幫 Lonely Dinosaur T-Shirts 設計的 T-Shirt 且是受版權保護的,後來成為了出名的迷因後,他跟 Lonely Dinosaur T-Shirts 通電郵說道:

We're not exactly sure who started putting text over it, and far be it from us to try and control a meme… We put a creative commons non-commercial license on it, so all your stuff is cool and we think what you're doing is great, but now everyone thinks that the shirt we're selling is just something we cut and pasted off the web, which kind of sucks for us. It'd be cool to see if we could put our side of the story out there and see if we can find the person who first put text over it, and have a complete history of origin of the meme.

似乎授權方式由作者本人轉成了 CC BY-NC,但我花多了30分鐘無論如何也証實不了以上的訊息的真偽,且一來我找不到 Sam Smith 本人的聯絡方法,二來也找不到究竟是哪一個版本的 CC BY-NC,我投降了。一個期望尊重授權方式的人也尚且不能確定授權方式,那就更莫論普通的內容使用者了。

當有一個容易查閱授權方式的方法的時候,雖然站在個人層面來說,本來就不關注授權方式的人未必會因而變得關注,但站在企業層面來說那就是一大進步了。在2019年3月26日於歐洲議會獲得通過的《數位單一市場著作權指令》,當中最大爭議的草案第13條要求各個網站:

  1. 若要使用具有版權的作品時要獲得許可
  2. 不然就要第一時間阻止侵權作品出現

而客觀結果將會導致各大 UGC 平台如 YouTube、Facebook 等因為不想付出巨額費用給各種各類不同的版權持有人來取得許可,所以必然會搬出用 AI 有殺錯冇放過地過濾內其平台上的內容,那就必然會妨礙創作自由了。況且規模細的 UGC 平台跟本就負擔不起過濾器的研發,那就唯有關門大吉了。對於創作者、受眾及平台是三輸的局面,這就是此條文的爭議點。但綜觀根本的原因,其實是平台方不能簡單容易地知道數碼內容當中所涉及的所有授權方法,若然能知道的話,起碼第一不會誤判,第二就算遇上具版權保護的內容時也能判斷其實是否已取得了相應許可,那就皆大歡喜了,版權得到尊重,創作自由得以保障,平台也不用花錢去研發沒有意義的過濾器了。

利潤分成

要說利潤分成,首先就要釐清一個數碼內容當中所有持份者的關係,視乎類型,其實是可以極其複雜的,也可以非常簡單的。例如你創作一個小故事放到某一個內容平台,那麼你就是作者而那個平台是發佈者,至於分成比例原則上就是這兩個持份者之間的事。但這件事放在今時今日,假如你在一些大社交平台發佈一下你的小故事,平台拿了你的流量,賺走了廣告費不會分給你不特止,就算有人覺得你才情橫溢,最多也只能按個讚留個言,你還是得要繼續食西北風。但如果在元數據內加入持分者的資訊及分成比例,那麼就算平台真的騎劫了因作者產生的流量所帶來的收益,也還有可能由第三方提供基於元數據內的分成比例製作而成的打賞機制。

複雜一點的情況是有攝影師影了個風景,有個插畫師在這張相上加入了插畫,而你寫了篇文章用了這張加工了的相來做配圖,放了上一個平台發佈,那麼所有持份者就包括第一個攝影師,第二個插畫師,第三個作者及最後的發佈平台,當在元數據中記錄下這些持份者的資料再加上分成比例,當有利潤產生時便可輕易計算並分發到相關人仕了。有了這個元數據,就算是非常複雜的持份者關份,理倫上都可以設計出對應的分成機制。

存在證明

最初的數碼存在證明 (Proof of Eistence) 是有人利用比特幣區塊鏈上傳了一些電腦檔案,而上傳時比特幣區塊鏈會記錄時間,且這個時間是不能被竄改的,而基於比特幣區塊鏈的特性,上傳時亦要求上傳者以其數碼密鑰來簽署確認,這樣的話,只要有任何人能證明自己擁有該串數碼密鑰,那就間接證明了他是當初的上傳者了。所以只要註冊一個數碼內容時滿足以下的條件,那麼這筆註冊便可以作為存在證明了:

  1. 註冊時要求使用數碼密鑰以作簽署確認
  2. 註冊內容包含內容本身,甚或只需簡單包含內容的數碼指紋也可
  3. 以不可竄改的形式記錄時間戳

其實這個存在證明最多也只能證明是誰在何時上傳過甚麼,所以若某數碼內容已早在公開的地方流傳過,那個上傳者還是不是作者就無法確認了,所以最好的做法還是一完成創作未發佈於人前便立即進行註冊,那就最好不過了。不過這裏就要求整個註冊機制要方便且成本十分低,除非那個內容是具有足夠高的價值,試問又有誰會花高昂的時間或金錢成本來註冊內容呢?


如果有一個數碼內容的註冊資料庫是有這麼多用途的話,那就要問回當初的問題「何以數碼內容沒有像 ISBN 一樣的註冊資料庫?」。其實真的要做出來的話當中也涉及不少範疇的技術問題要解決,而當中最主要的是兩大個問題:

  1. 如何讓整套的註冊資料庫是具有公信力
  2. 需要定義清楚註冊的資料結構的規範

一個有公信力的資料庫

如果這套註冊資料庫涉及記錄數碼內容的授權方式、利潤分成,甚至用來做存在證明,每每都是跟數碼內容的各持份者的利益息息相關的,那麼整套系統由註冊,到儲存,再到被人查詢,都需要有公信力,需要讓人信服當中所記錄的資訊不曾被竄改過,也是由相應的持份者提出或更改的。這就不是撘建一個後台加個資料庫再做個用戶界面出來就可以解決的問題,這樣由用戶角度來看自從註冊了數碼內容後,註冊的完整性、正確性都不能確認。

綜觀現行的技術,區塊鏈技術是可行又能滿足以上條件的。第一,任何人要註冊數碼內容到區塊鏈時都需要以其數碼密鑰來簽署確認,這就記錄了是誰在註冊,註冊時的時間戳也會被記錄,那就滿足了是誰在何時註冊了甚麼,就算將來有更改也是通過相同的機制來進行。第二,區塊鏈會記錄每次的發起改動的要求,那就能輕易檢視所有註冊元數據的建立和改動,從而能檢視註冊的完整性、正確性。最後區塊鏈也能確保所有記錄的數據是不曾被竄改的,不過這個解釋起來比較技術向,也就不在此詳述了。

註冊的資料結構規範

一個數碼內容的註冊,當中會記錄十分多不同類形的元數據才能發揮到不同形式的功效,而其中大多數情況下都是由應用來運算的而不是單純下載下來以作檢閱的,所以一份嚴緊而精密的規範便有其必要性了。由此,我們正在倡議一份專為數碼內容而設的註冊表規範,並稱之為 International Standard Content Number(簡稱 ISCN)。

ISCN

ISCN 的目的就是規範作為一個數碼內容的註冊表所應該需要記錄的訊息以及其格式。規範的初步設計會分成四大部份,分別是第一層記錄了唯一識別碼及內容指紋的主註冊表,而第二層則分別載有數碼內容持份者、 授權方式以及數碼內容本身的元數據,大致的架構如下:

ISCN architecture by LikeCoin Foundation (CC-BY-SA 4.0)

規範的第一份提案已放到 GitHub 上,大家也可以上去一起討論啊。

404 Not found 遇得多 402有見過麼?

中文電子書實驗報告(readmoo、樂天及其他)

如何以區塊鏈打擊假新聞?

發布評論

看不過癮?

一鍵登入,即可加入全球最優質中文創作社區