編輯導(dǎo)語:互聯(lián)網(wǎng)的存在便利了許多人的生活,但是當(dāng)下互聯(lián)網(wǎng)也存在著一定問題,其中就包含著大量死鏈存在的問題,而大量死鏈的存在、或者鏈接被修改的現(xiàn)狀帶來了一定的嚴(yán)重后果。本文作者就此進(jìn)行了闡述,一起來看一下。
編者按:哈佛大學(xué)法學(xué)與計算機科學(xué)教授喬納森·齊特林(Jonathan Zittrain)于《大西洋月刊》發(fā)表評論長文,他詳細(xì)介紹了互聯(lián)網(wǎng)目前面臨著的存在大量死鏈(腐爛鏈接)或被修改過的鏈接可能造成的嚴(yán)重后果,他認(rèn)為應(yīng)該建立一套完善的記錄和追蹤系統(tǒng)以便讓公眾知道每一次修改或刪除的內(nèi)容與目的。原文標(biāo)題The Internet Is Rotting。
01
60年前,科幻小說家、未來學(xué)家阿瑟·克拉克指出,任何足夠先進(jìn)的技術(shù)都和魔法差不多?;ヂ?lián)網(wǎng):這個讓我們既相互交流,又共同保存人類文明的智力產(chǎn)品,很符合克拉克的這句話。用史蒂夫·喬布斯的話說,“她就是好用”(it just works),就和點擊、敲鍵盤或說話一樣容易。與魔法一樣,當(dāng)互聯(lián)網(wǎng)不起作用時,其原因通常是神秘的,以至于對她的解釋就像試圖解開一個失效的咒語一樣。
支撐我們龐大而看似簡單的數(shù)字網(wǎng)絡(luò)的是技術(shù),如果沒有這些技術(shù),互聯(lián)網(wǎng)可能就不會是現(xiàn)在這個樣子,她是一種非常特殊情況下的產(chǎn)物。
互聯(lián)網(wǎng)的獨特結(jié)構(gòu),源于一種獨特的限制和一種獨特的自由。首先,早期互聯(lián)網(wǎng)的設(shè)計者都具有學(xué)術(shù)背景,他們不期望、也沒有籌集大量的資金來建設(shè)網(wǎng)絡(luò);其次,他們不希望從他們的發(fā)明中賺錢。
聯(lián)邦快遞花費了數(shù)千萬美元的資本支出,部署了統(tǒng)一的飛機、卡車、人員和投遞箱,建立了一個單一的點對點的交付系統(tǒng)。而互聯(lián)網(wǎng)的制造者們沒有資金來簡單地推出一個統(tǒng)一的集中式網(wǎng)絡(luò),他們解決的是如何將現(xiàn)有網(wǎng)絡(luò)連接起來的規(guī)則。
互聯(lián)網(wǎng)的設(shè)計不是仿照傳統(tǒng)的電話系統(tǒng),由政府或一些大規(guī)模的公用事業(yè)部門運營的單一集中式網(wǎng)絡(luò),互聯(lián)網(wǎng)允許任何地方的任何設(shè)備與任何其他設(shè)備互操作,允許任何供應(yīng)商帶來其擁有的任何網(wǎng)絡(luò)能力。因為互聯(lián)網(wǎng)的創(chuàng)造者并不打算將其用來牟利,更不用說壟斷了,而是讓互聯(lián)網(wǎng)的用戶自然地提供內(nèi)容,其中一些人將作為內(nèi)容生產(chǎn)者或存儲放,為其他人建立水坑。
與短暫興起的專有網(wǎng)絡(luò)如CompuServe、AOL和Prodigy不同,內(nèi)容和網(wǎng)絡(luò)將被分離。事實上,互聯(lián)網(wǎng)過去和現(xiàn)在都沒有主菜單,沒有CEO,沒有公開發(fā)行股票,根本沒有正式的組織。只有工程師們每隔一段時間聚在一起開會,以完善通信協(xié)議,然后硬件和軟件制造商以及網(wǎng)絡(luò)建設(shè)者們就可以隨意地使用。
因此,互聯(lián)網(wǎng)是一個用研缽制作出來的配方,邀請任何人,每個人,加入他們自己的原料。
蒂姆·伯納斯·李接受了這一邀請,發(fā)明了萬維網(wǎng)的協(xié)議,這是一個在互聯(lián)網(wǎng)上運行的應(yīng)用程序。如果你的電腦通過運行一個瀏覽器說 “web”,那么她就可以與同樣說 “web”的服務(wù)器對話,這自然就是網(wǎng)站了。
網(wǎng)站上的網(wǎng)頁可以包含各種鏈接,根據(jù)定義,這些鏈接只需點擊一下就可以找到,而且實際上可以在世界其他地方的服務(wù)器上找到,這些服務(wù)器的主人或組織不僅與鏈接的網(wǎng)頁沒有關(guān)系,而且完全不知道她的存在。
而網(wǎng)頁本身在作為一個整體顯示之前,可能會與多個來源組合起來,這就促進(jìn)了廣告網(wǎng)絡(luò)的興起,網(wǎng)站可以在有人想要瀏覽網(wǎng)頁的時候,要求廣告網(wǎng)絡(luò)插入監(jiān)控信標(biāo)和廣告。
和互聯(lián)網(wǎng)的設(shè)計者們一樣,伯納斯·李把他的協(xié)議免費送給了世界,這使得省去了任何形式的集中管理或控制,因為沒有任何使用情況需要由萬維網(wǎng)公司來跟蹤,以達(dá)到收費的目的。萬維網(wǎng),就像互聯(lián)網(wǎng)一樣,是一個集體的幻覺,一組獨立的努力被共同的技術(shù)協(xié)議聯(lián)合起來,成為一個無縫的、神奇的整體。
這種沒有中央控制,甚至沒有中央監(jiān)控的便利,長期以來一直被譽為基層民主和自由的工具。對互聯(lián)網(wǎng)這樣一個有機和分散的網(wǎng)絡(luò)進(jìn)行審查并非易事。但最近,因為沒有簡單的關(guān)口來刪除或標(biāo)記不在主要平臺保護范圍內(nèi)的惡意內(nèi)容,或者無法簡單快速識別其來源,這些特點被理解為成了促進(jìn)個人騷擾和社會不穩(wěn)定的載體。
雖然這兩種評估都很有力量,但她們都掩蓋了分布式網(wǎng)絡(luò)和互聯(lián)網(wǎng)的一個關(guān)鍵特征。她們的設(shè)計自然會造成維護他人所依賴的有價值內(nèi)容的責(zé)任空白。
在互聯(lián)網(wǎng)誕生之前,保存某樣?xùn)|西的主要方式最早是將她刻在石頭上,然后是寫在羊皮紙,然后是紙莎草紙,然后是20磅的無酸紙,然后是磁帶機、軟盤或硬盤,并將結(jié)果儲存在寺廟或圖書館:一個旨在保護她們免受腐爛、盜竊、戰(zhàn)爭和自然災(zāi)害的建筑。
這種方法促進(jìn)了一些材料的保存,時間已達(dá)數(shù)千年之久。理想情況下,會有多個相同的副本儲存在多個圖書館中,所以一個倉庫出問題不會使里面的知識熄滅。在罕見的情況下,如果一份文件被偷偷地改變,她可以與其他地方的副本進(jìn)行比較,以發(fā)現(xiàn)和糾正這種修改。
這些地點不是自發(fā)的,也不是單純的倉庫。她們配備了神職人員、圖書管理員,他們培養(yǎng)了一種保存文化和許多精心設(shè)計的做法,因此珍貴的文件既能得到保護,又能大規(guī)模地被查閱。
而且同樣重要的是,通過仔細(xì)的索引,一個探究的心靈可以與圖書館中可能滿足這種渴求的東西配對(正如豪爾赫·路易斯·博爾赫斯所指出的,一個沒有索引的圖書館,隨著她的增長,其信息量會變得越來越少,這很矛盾)。
在互聯(lián)網(wǎng)時代的黎明,25年前,互聯(lián)網(wǎng)似乎會給圖書管理員這些管家的長期工作帶來巨大的改善,也許會有一些緩解。
互聯(lián)網(wǎng)和萬維網(wǎng)設(shè)計的古怪之處在于確保“完美”不會成為“好”的敵人。在互聯(lián)網(wǎng)和網(wǎng)絡(luò)的設(shè)計中,沒有一個謹(jǐn)慎的系統(tǒng)來指定與日常事務(wù)不同的 “重要”知識,也沒有將這些知識輸入到永久保存和使用的機構(gòu)和文化中(圖書館),有的只是無限變化的網(wǎng)絡(luò),比如那些學(xué)術(shù)論文和報紙文章的經(jīng)典參考網(wǎng)站,與散落在各處的PDF、博客和社交媒體帖子并列。
富有進(jìn)取心的學(xué)生設(shè)計了網(wǎng)絡(luò)爬蟲,自動跟蹤并記錄他們能找到的每一個鏈接,然后跟蹤該鏈接末端的每一個鏈接,然后建立一個索引,讓人們在一個無縫的整體中進(jìn)行搜索,創(chuàng)建搜索引擎,你搜索一個詞或短語時候,就會在在今天超過100萬億個可能的網(wǎng)頁中返回10個鏈接。“網(wǎng)絡(luò)就像一個不斷增長的圖書館,有數(shù)十億本書,卻沒有中央檔案系統(tǒng)”。
現(xiàn)在,我只是引用了谷歌公司的網(wǎng)站,而且我用了一個超鏈接,這樣你就可以看到我的來源。
來源( Sourcing)是將人類的知識凝聚在一起的膠水。她可以讓你了解更多像這篇文章中只初略提到的內(nèi)容,也可以讓其他人仔細(xì)檢查我所陳述的事實。
我使用的鏈接指向了:https://www.google.com/search/howsearchworks/crawling-indexing/。假設(shè)谷歌改變了該網(wǎng)頁上的內(nèi)容,或者在我寫這篇文章和你讀這篇文章之間的任何時候作出改動,或者直接取消她。改變原鏈接的內(nèi)容就叫做內(nèi)容漂移(content drift);完全消除原鏈接被稱為失效鏈接(link rot)。
事實證明,失效鏈接和內(nèi)容漂移是網(wǎng)絡(luò)上的普遍現(xiàn)象,這對于擁有 “數(shù)十億冊圖書而沒有中央檔案系統(tǒng) ”的圖書館來說,既不足為奇,又有巨大的風(fēng)險。
想象一下,如果圖書館不存在,只有實體書的 “共享經(jīng)濟”。人們可以登記他們家里有哪些書,然后其他想要這些書的人就可以來參觀和閱讀,這樣的系統(tǒng)可能會過時,書不在他們宣稱的地方,特別是如果有人在2015年報告了一本書在別人家里,然后一個感興趣的讀者在2021年看到了2015年的報告,并試圖訪問原來提到的存放這本書的家庭。這就是我們現(xiàn)在互聯(lián)網(wǎng)上遇到的情況。
鏈接時效
2010年,塞繆爾·阿利托大法官在最高法院審理的一個案件中寫了一份同意意見,他的意見書鏈接到一個網(wǎng)站,作為解釋其理由的一部分。意見書發(fā)布后不久,任何人通過這個鏈接都看不到內(nèi)容。相反,他們會發(fā)現(xiàn)如下圖的信息。“如果你像阿利托法官那樣引用了這個網(wǎng)頁,原始內(nèi)容早就消失了?!?/p>
在這樣的案例啟發(fā)下,我和一些同事在2014年開始調(diào)查時效鏈接程度,并在今年春天再次重啟。
第一項研究是與肯德拉·阿爾伯特(Kendra Albert)和拉里·萊西格(Larry Lessig)合作進(jìn)行的,重點是旨在無限期存在的文件:學(xué)術(shù)論文中的鏈接,如《哈佛法律評論》和最高法院的司法意見。
我們發(fā)現(xiàn),自1996年第一個超鏈接被使用以來,嵌入法院意見中的50%的鏈接失效。而《哈佛法律評論》中的75%的鏈接失效。
人們往往忽略了現(xiàn)代互聯(lián)網(wǎng)的衰敗,事實上,這些數(shù)字是非同尋常的:她們代表了事實監(jiān)管鏈的全面崩潰。
圖書館現(xiàn)在還是存在的,里面仍然有書,但圖書館已經(jīng)和人們的絕大多數(shù)信息無關(guān),包括正式的法律文件等。互聯(lián)網(wǎng)的靈活性(正是這一特點使其發(fā)揮作用),使其取代了CompuServe(外國第一家主流商業(yè)性網(wǎng)絡(luò)服務(wù))和其他集中組織的網(wǎng)絡(luò),分散了對這一核心社會功能的責(zé)任。
這個問題并不只是針對學(xué)術(shù)文章和司法意見。在約翰·鮑爾斯(John Bowers)和克萊爾·斯坦頓(Clare Stanton)的幫助下,以及在《紐約時報》的友好合作下,我能夠分析自1996年成立以來在nytimes.com的文章中發(fā)現(xiàn)的大約200萬個外部鏈接。
我們發(fā)現(xiàn),25%的深度鏈接已經(jīng)失效,深度鏈接是指向特定內(nèi)容的鏈接。文章越舊,鏈接就越可能失效。如果你追溯到1998年,72%是死鏈??偟膩碚f,在《紐約時報》所有包含深度鏈接的文章中,超過一半的文章中至少有一個失效鏈接。
我們的研究結(jié)果與其他研究是一致的。早在2001年,普林斯頓大學(xué)的一個團隊研究了科學(xué)文章中網(wǎng)絡(luò)參考文獻(xiàn)的持久性,發(fā)現(xiàn)學(xué)術(shù)文章中包含的URL的數(shù)量正在增加,但許多鏈接已經(jīng)失效,包括他們從1994年收集的文章中的53%。
13年后,六位研究人員創(chuàng)建了一個數(shù)據(jù)集,其中包括超過350萬篇關(guān)于科學(xué)、技術(shù)和醫(yī)學(xué)的學(xué)術(shù)文章,并確定每五篇中就有一篇不再指向其最初的來源。2016年,對同一數(shù)據(jù)集的分析發(fā)現(xiàn),75%的參考文獻(xiàn)內(nèi)容已經(jīng)改變了。
當(dāng)然,對于網(wǎng)上的許多東西來說,還有一個與之密切相關(guān)的持久性問題。人們以感覺上稍縱即逝的方式交流,并相應(yīng)地放松了警惕,卻發(fā)現(xiàn)Facebook上的評論可以永遠(yuǎn)存在。其結(jié)果是兩個世界中最糟糕的情況:一些信息在不應(yīng)該存在的情況下仍然存在,而其他信息在應(yīng)該存在的情況下卻消失了。
02
到目前為止,互聯(lián)網(wǎng)的興起導(dǎo)致了經(jīng)常性地引用那些非正式的信息來源;博客或隨意放在某個特定網(wǎng)址上的論文在前互聯(lián)網(wǎng)時代是沒有的。
但是,任何真正值得保留下來的東西,肯定還是會以書籍或?qū)W術(shù)期刊上的文章的形式出版,使其能夠被今天的圖書館訪問,并以與以前相同的方式保存下來?可惜的是,沒有。
由于把信息放到網(wǎng)上很容易,制作紙質(zhì)文件并以傳統(tǒng)方式存儲的動機開始緩慢下降,后來則急劇下降。紙質(zhì)副本曾經(jīng)被視為原件,任何數(shù)字內(nèi)容都只是額外的。但現(xiàn)在,無論是出版商還是消費者,以及長期代表消費者的圖書館,都將數(shù)字視為訪問的主要工具,而紙質(zhì)副本則被棄用。
從我作為一個法學(xué)教授的位置來看,我已經(jīng)看到了在派對結(jié)束時準(zhǔn)備熄燈的最后一批人:學(xué)術(shù)法律期刊的法學(xué)學(xué)生編輯。
對剛?cè)雽W(xué)的法學(xué)學(xué)生來說,一個更令人窒息的儀式是 “subcite”,即檢查正在進(jìn)行的學(xué)術(shù)研究中的引文,以確保她們符合法律引文標(biāo)準(zhǔn)所要求的嚴(yán)格而繁瑣的形式,更直接地說,確保引用來源本身還存在,并且說的是引文作者所說的內(nèi)容。
比方說,《哈佛法律評論》最初的做法是要求學(xué)生要有一份紙質(zhì)的原始引用資料,例如法規(guī)或司法意見書。哈佛大學(xué)法律圖書館也會努力保留所有資料的實體副本(理想情況下是所有相關(guān)法律和案例的實體副本,目的就在于此)。
此后,《法律評論》放松了警惕,允許印刷文本的數(shù)字圖像就足夠了,這并不是完全不受歡迎。事實證明,實體的法律(有別于物理定律)占據(jù)了大量的空間,而哈佛大學(xué)法學(xué)院正在將越來越多的書籍轉(zhuǎn)為遠(yuǎn)程存儲,需要費力地檢索。
幾年前,我?guī)椭I(lǐng)導(dǎo)了一項工作,將所有這些紙張以圖像和可搜索文本的形式數(shù)字化:超過40,000卷,包含超過4,000萬頁,這完成了對每個州從該州成立之初到2018年底的幾乎所有已出版法律案例的掃描。掃描的書籍已被送往肯塔基州的一個廢棄的石灰石礦,作為對某種世界末日的對沖)。
一個特殊的情況使我們能夠掃描這些文件:外國案例法沒有版權(quán),因為她是法官的產(chǎn)品。事實上,外國政府的任何作品都被法規(guī)要求進(jìn)入公共領(lǐng)域。但哈佛大學(xué)法學(xué)院圖書館不再收集可供掃描的印刷版本,成本太高。在版權(quán)法得到完善以更好地適應(yīng)數(shù)字時代之前,其他印刷材料基本上都只能留在紙上。
在這一缺口中,出現(xiàn)了一些天生數(shù)字化材料,這些材料是由以前銷售印刷品上的出版商提供的。但是有一個問題。這些官方認(rèn)可的材料的使用期限是有限制的。
無論是個人還是圖書館,購買者通常只是在一定時期內(nèi)購買材料的使用權(quán),而沒有能力將作品轉(zhuǎn)移到購買者自己選擇的容器中。許多商業(yè)出版的學(xué)術(shù)期刊也是如此,對她們來說,“訂閱 ”不再意味著定期交付紙質(zhì)材料。相反,訂閱是為了持續(xù)獲得由出版商自己主辦的整個期刊庫數(shù)據(jù)庫。如果訂閱取消,所有內(nèi)容就無法訪問了。
在這些情況下,圖書館不再是任何東西(無論是有形的還是無形的)的時代保管人,而是個收錢的。
同樣,現(xiàn)在人們經(jīng)常在Kindle上購買電子書,Kindle是數(shù)字設(shè)備中的加州旅館:書籍不能被提取。購買的書籍還可能被亞馬遜收回,退給你購書原價。
眾所周知,亞馬遜會這樣做。例如,10年前,一個第三方書商在亞馬遜上以99美分一本的價格提供Kindle格式的知名書籍,誤以為書籍已經(jīng)進(jìn)入公共版權(quán)。一旦注意到這個錯誤,亞馬遜在某種程度上的恐慌中,把每一本下載到Kindle中的這本書都刪除了。這本書是喬治·奧威爾的《1984》,這件事本身似乎也有點《1984》的味道。
當(dāng)時,這一事件引起了爭論,但并不真正令人擔(dān)憂;畢竟,《1984》有大量的實體書籍存在。今天,隨著個人和圖書館的書籍購買從實物轉(zhuǎn)向數(shù)字圖書,Kindle圖書的去平臺化(包括追溯性的去平臺化)可能會帶來更大的影響。
刪除并不是唯一的問題。但信息不僅可以被刪除,而且還可以被篡改。在互聯(lián)網(wǎng)出現(xiàn)之前,在一本書出版很久后,試圖改變書的內(nèi)容是徒勞的。圖書管理員對有人試圖撕掉或標(biāo)記 “不正確”的書的幾頁內(nèi)容不以為然。最接近于事后編輯的做法是影響新版的內(nèi)容。
電子書沒有這些限制,這是因為新版本可以隨時創(chuàng)建,而且事后對現(xiàn)有版本進(jìn)行 “更新 ”太簡單了。想想菲利普·霍華德的經(jīng)歷,他在2010年坐下來閱讀紙質(zhì)版的《戰(zhàn)爭與和平》。在閱讀這本磚頭大小的巨著時,他為他的Nook電子閱讀器購買了一個99美分的電子版,在閱讀這個電子書版本時,在和實體書對照之后,他發(fā)現(xiàn)書里把kindled替換為了Nooked。
對該書的Nook版本的電子書進(jìn)行的搜索證實了這一點。kindle(點燃)這個詞都被nook取代了,這也許是為了更改Kindle版本的電子書,供Nook使用,下面是我當(dāng)時拍的一些截圖。
這些出版形式的可追溯性成為內(nèi)容審查的一個新監(jiān)管領(lǐng)域,這只是一個時間問題。如果一本實體書中的某個段落被某人認(rèn)為是誹謗性的,受害的人可以為此起訴,如果他們是對的,可以獲得金錢上的賠償。很少有人對書的存在本身提出質(zhì)疑,哪怕只是因為出版后很難把書回爐重造。
現(xiàn)在,要求對違規(guī)的句子或段落進(jìn)行改進(jìn)或直接修改要容易得多。只要這些補救措施不再令人遐想,和解的條款就可以包括這些補救措施,以及承諾不在廣告宣揚已經(jīng)更改了書籍。而且甚至不需要提起訴訟;只需要公開或私下提出要求。重讀Kindle的舊書,可能會變成閱讀那本舊書的略微調(diào)整過的版本,她并不完全是人們記憶中的樣子。
這不是假設(shè)。最近,暢銷書作家Elin Hilderbrand出版了一部新小說,這部小說受到評論界的廣泛贊譽,其中有一段對話,一個角色對另一個角色開了一個狡猾的玩笑,說他在南塔克特島的閣樓上度過夏天,“像安妮·弗蘭克一樣”。一些讀者在社交媒體上批評人物之間的這一對話是反猶太主義的。作者試圖解釋這個人物使用的是比喻,然后表示道歉,并說她已經(jīng)要求出版商立即從該書的數(shù)字版本中刪除這段話。
電子書出版后有很多技術(shù)和排版上的改動,以至于出版商自己都不知已經(jīng)修改了多少出版的內(nèi)容。近25年前,我?guī)椭鷾氐稀と麪枬山⒘艘粋€網(wǎng)站,現(xiàn)在叫Lumen,跟蹤從加利福尼亞大學(xué)、互聯(lián)網(wǎng)檔案館、維基百科、推特和谷歌等機構(gòu)提出的修改要求,通常是通過點擊該平臺發(fā)布的鏈接而聲稱發(fā)現(xiàn)版權(quán)侵犯行為。Lumen可以讓我們了解更多關(guān)于網(wǎng)絡(luò)搜索中由于外部要求而丟失或改變的信息。
例如,因為該網(wǎng)站對刪除內(nèi)容以及刪除要求的來源和文本都進(jìn)行了記錄,法律教授尤金·沃洛克(Eugene Volokh)能夠識別出一些帶有欺詐性刪除要求(在他審查過的提交給谷歌的700份 “法院命令”中,有近200份顯然是用PS制作的)。此后,德克薩斯州總檢察長起訴了一家公司,因為她經(jīng)常向谷歌提交這些偽造的法院命令,以達(dá)到強制刪除內(nèi)容的目的。
隨著Kindle的興起,即使是鏈接的概念(統(tǒng)一資源定位器),即URL,也面臨著巨大的壓力。由于Kindle書籍不在萬維網(wǎng)上,因此沒有指向某個特定頁面或段落的URL。任何移動App中的內(nèi)容也是如此,這使得人們不得不發(fā)屏幕截圖,來傳達(dá)內(nèi)容。
這讓我們想到一個事實:長期的內(nèi)容,包括官方文件,可能經(jīng)常需要參考短期的、非規(guī)范的來源,以確定他們的意思,而這樣做越來越難了(或者更糟的是,完全沒有注意到)。
即使是長期的、經(jīng)典的來源,如書籍和學(xué)術(shù)期刊,也處于危險之后,通常是為了支持?jǐn)?shù)字訂閱模式,而排除了長期鏈接。
03
現(xiàn)在,沒有簡單的方法可以為后人引用許多來源,而那些可以引用的資料又太容易改變。
我們的互聯(lián)網(wǎng)之所以取得驚人的成功,是因為作出了一個明智的決定:即傾向于好的而不是完美的,贊成一般的而不是具體的。
我曾欽佩地稱其為 “拖延原則”,即一個優(yōu)雅的網(wǎng)絡(luò)設(shè)計不會因為試圖解決每一個可能在未來出現(xiàn)的問題而變得過于復(fù)雜。我們在維基百科中看到了這一原則,她最初的宣傳似乎很荒謬:“我們可以通過允許世界上任何一個人創(chuàng)建一個新的頁面,以及世界上任何一個人都可以修改的頁面,來產(chǎn)生一個完全徹底和大部分可靠的百科全書?!?/p>
我們很自然地會問,什么會促使人們對維基百科這樣的事物做出建設(shè)性的貢獻(xiàn),以及如何防范無知或惡意的編輯。如果維基百科獲得了足夠多的流量,難道不會有一些二流的供應(yīng)商有動力將每篇文章變成勞力士手表的垃圾廣告嗎?
事實上,維基百科飽受破壞行為的困擾,而且隨著時間的推移,維護維基百科的社區(qū)已經(jīng)開發(fā)出了一些工具和做法來處理這些行為,而這些工具和方法在維基百科創(chuàng)建時并不存在。如果這些工具和做法過早地實施,可能會阻止許多讓維基百科最初的運作和發(fā)展。拖延原則得到了回報。
同樣,萬維網(wǎng)發(fā)明者蒂姆·伯納斯·李也不打算按照真實性、可靠性或其他任何標(biāo)準(zhǔn)來審查新網(wǎng)站。人們可以建立和提供任何他們想要的東西,只要他們有硬件和連接能力來建立一個網(wǎng)絡(luò)服務(wù)器,其他人就可以按照他們的意愿自由訪問該網(wǎng)站或忽視她。
網(wǎng)站會來來去去,個別網(wǎng)頁可能被重新安排,這是一個特點,而不是一個漏洞。正如互聯(lián)網(wǎng)本可以被構(gòu)造成一個大型的CompuServe,由中央調(diào)解,但她并不是這樣。泰德·尼爾森的Xanadu項目考慮了更多,包括 “雙向鏈接”,每當(dāng)有人選擇鏈接到一個網(wǎng)站時,就會提醒該網(wǎng)站,但Xanadu從未成功。
拖延者知道,遲一點并不意味著不會發(fā)生,互聯(lián)網(wǎng)和萬維網(wǎng)的靈活性所帶來的好處(包括允許在其上建立完全拒絕URL概念的圍墻式應(yīng)用花園)現(xiàn)在對更大的企業(yè)來說是有很大風(fēng)險和成本的,用谷歌早期的話來說,就是 “整合全球信息,供大眾使用,使人人受益”。
谷歌創(chuàng)始人謝爾蓋·布林和拉里·佩奇的想法是崇高的,以至于把她托付給一家公司,而不是社會上長期磨練的機構(gòu)(如圖書館)是不公平的。
事實上,當(dāng)谷歌的創(chuàng)始人第一次發(fā)布描述他們所發(fā)明的搜索引擎的論文時,他們在附錄中提到了 “廣告和混合動機”,結(jié)論是 “廣告問題引起了足夠多的混合動機,因此擁有一個透明的、學(xué)術(shù)領(lǐng)域的競爭性搜索引擎是至關(guān)重要的”。2021年沒有這樣透明的、學(xué)術(shù)性的競爭搜索引擎。通過使信息的存儲和組織成為每個人的責(zé)任,互聯(lián)網(wǎng)和網(wǎng)絡(luò)可以增長,空前地擴大訪問量,同時使所有的信息變得脆弱。
我們要如何應(yīng)對我們所處的危機?沒有人比布魯斯特·卡勒更敏銳地意識到互聯(lián)網(wǎng)的轉(zhuǎn)瞬即逝問題,他是一位技術(shù)專家,在1996年創(chuàng)立了互聯(lián)網(wǎng)檔案館(Internet Archive),作為一項非營利性機構(gòu)來保存人類的知識,特別是互聯(lián)網(wǎng)上的內(nèi)容。
布魯斯特曾開發(fā)了一個名為WAIS的網(wǎng)絡(luò)先驅(qū),然后是一個名為Alexa的網(wǎng)絡(luò)流量測量平臺,最終被亞馬遜收購。那次收購使布魯斯特個人有能力幫助資助互聯(lián)網(wǎng)檔案館的最初運作,包括Wayback機器,專門用于收集、保存和提供網(wǎng)頁,即使網(wǎng)頁本身已經(jīng)消失了。她通過挑選多個入口點開始 “刮取”網(wǎng)頁,而不是僅僅在瀏覽器中顯示其內(nèi)容,然后盡可能多地跟蹤這些網(wǎng)頁上的連續(xù)鏈接,以及這些網(wǎng)頁的鏈接網(wǎng)頁。
像布魯斯特這樣一個有公民意識的人站了出來,而不是我們現(xiàn)有的機構(gòu),這并不是巧合。
部分原因是潛在的法律風(fēng)險,這些風(fēng)險往往會減緩或阻止成熟的租住。抓取、存儲和展示網(wǎng)絡(luò)的版權(quán)問題起初并沒有得到解決,一般來說,這種行為要么留給那些可以低調(diào)處理的人,他們只為自己保存他們所抓取的東西;要么留給像搜索引擎這樣的大型和強大的商業(yè)機構(gòu),他們的商業(yè)需要使他們只顯示最新的、活躍的網(wǎng)頁,這是他們工作的核心;要么留給具有創(chuàng)業(yè)心態(tài)的技術(shù)型個人。
后者的一個例子是Clearview AI的工作,在那里,一個狡猾的企業(yè)家從Facebook、linkedIn和Instagram等社交網(wǎng)站收集了數(shù)十億張圖片和標(biāo)簽,以建立一個能夠識別幾乎任何照片或視頻片段的面部識別數(shù)據(jù)庫。
布魯斯特表面上也屬于這一類,但本著互聯(lián)網(wǎng)和網(wǎng)絡(luò)發(fā)明者的精神,他這樣做是因為他相信做的事情的價值,而不是其經(jīng)濟潛力。
Wayback Machine的方法是盡可能多地保存,而在實踐中,這意味著每隔一段時間就要保存很多東西。這是至關(guān)重要的工作,她應(yīng)該得到更多的支持,包括政府補貼和更多的基金會支持。互聯(lián)網(wǎng)檔案館是麥克阿瑟基金會 “100與變革 “(100 and Change)倡議的半決賽選手,該倡議向有價值的事業(yè)單獨頒發(fā)1億美元。
通過獨立搜刮來 “保存一切”的另一個補充方法是,無論誰在創(chuàng)建鏈接時,都要確保在創(chuàng)建鏈接時保存一份副本。
我共同創(chuàng)辦的伯克曼·克萊因互聯(lián)網(wǎng)與社會中心的研究人員,用一個名為Amberlink的開源軟件包設(shè)計了這樣一個系統(tǒng)?;ヂ?lián)網(wǎng)和萬維網(wǎng)邀請任何形式的建設(shè),因為沒有人正式批準(zhǔn)新的補充。
Amberlink可以在一些網(wǎng)絡(luò)服務(wù)器上運行,使其在Amberlink授權(quán)的服務(wù)器上捕捉到鏈接的內(nèi)容。然后,當(dāng)有人點擊一個經(jīng)過Amber調(diào)整的網(wǎng)站上的鏈接時,如果原來鏈接不再可用,也能看到Amberlink在該鏈接上捕獲的內(nèi)容。谷歌等搜索引擎也有這個功能,你通常可以要求查看搜索引擎從搜索結(jié)果頁面鏈接的網(wǎng)頁的 “緩存 “副本,而不是去網(wǎng)站。
Amber是一個網(wǎng)站歸檔另一個的例子。網(wǎng)站也有可能為長存而自我存檔。2021年,互聯(lián)網(wǎng)檔案館宣布與一家名為Cloudflare的公司合作,流行的或有爭議的網(wǎng)站使用Cloudflare,以抵御有人惡意攻擊,這些攻擊可能使網(wǎng)站癱瘓。啟用 “永遠(yuǎn)在線”服務(wù)的網(wǎng)站將看到她們的內(nèi)容被Wayback Machine自動存檔,如果原網(wǎng)站不可用,互聯(lián)網(wǎng)檔案館保存的頁面副本將被替代原網(wǎng)站。
這些方法普遍有效,但并不總是具體有效。當(dāng)一個司法意見、學(xué)術(shù)文章或社論專欄指向一個網(wǎng)站或網(wǎng)頁時,作者往往有一些非常明確的想法。如果該網(wǎng)頁正在發(fā)生變化(而且無法知道她是否會發(fā)生變化),那么,如果最近的網(wǎng)頁副本是在2017年或2024年存檔的,那么2021年引用的網(wǎng)頁就不可靠了。
從布魯斯特的工作中獲得靈感,并與互聯(lián)網(wǎng)檔案館合作,我與哈佛大學(xué)圖書館創(chuàng)新實驗室的研究人員合作,創(chuàng)辦了Perma。
Perma是一個由150多家圖書館組成的聯(lián)盟。持久性文件的作者(包括學(xué)術(shù)論文、報紙文章和司法意見)可以用Perma將其中的鏈接轉(zhuǎn)換為永久的鏈接,存檔在http://perma.cc;參與的圖書館將在這些鏈接收藏,并承諾無限期地保存。
研究人員馬丁·克萊因、肖恩·瓊斯、赫伯特·范·德·索姆佩爾和邁克爾·納爾遜已經(jīng)磨合了一項名為Robustify的服務(wù),允許將任何來源的鏈接檔案,包括Perma,納入新的“雙重用途”鏈接,以便她們可以指向一個當(dāng)下有效的頁面,同時在原始頁面失效時提供一個存檔的替代品。
這可以使來自各種檔案的鏈接快照形成一個滾動的目錄,一個網(wǎng)絡(luò)化的歷史,她既是謹(jǐn)慎的分布,又有互聯(lián)網(wǎng)風(fēng)格,同時由長期存在的機構(gòu)管理(圖書館),這些機構(gòu)都是為了至關(guān)重要的公共利益目的而存在。
作者和出版商可以通過技術(shù)基礎(chǔ)設(shè)施保存他們所利用的鏈接,這是一個必要的開始。但數(shù)字可塑性的問題超出了技術(shù)層面,還涉及法律問題。
出版商應(yīng)該制定明確的原則性政策,反對在公眾壓力下進(jìn)行出版物的更改,因為公眾壓力并沒有達(dá)到法律規(guī)定的侵權(quán)行為。而且,在很多情況下,出版商也應(yīng)該頂住法律壓力。
在某些情況下,追溯改正是有好處的,比如修正食譜中的印刷錯誤,或者屏蔽出于騷擾目的而分享的某人的電話號碼。公眾希望看到改變的內(nèi)容,或者至少知道已經(jīng)做出了改變以及改變的原因,這既是合法的,也是分散的。因為她是分散的,所以很少有人能代表她發(fā)言。
在審查被認(rèn)為是正確做法的時候,應(yīng)該對被修改的內(nèi)容進(jìn)行細(xì)致的記錄。這些記錄應(yīng)該向公眾開放,就像Lumen會對谷歌搜索中的版權(quán)刪除的記錄一樣,除非這種公開違背了刪減的目的,例如,到目前為止,當(dāng)谷歌在網(wǎng)絡(luò)搜索中刪除有關(guān)某人的負(fù)面條目時,并沒有向Lumen公司報告,以免保護個人隱私。
在這些情況下,應(yīng)該有一種保存記錄的手段,公眾不能隨意獲取,但研究人員應(yīng)該可以得到。約翰·鮑爾斯、伊萊恩·塞登伯格和我已經(jīng)建議圖書館可以再次作為公共和私人在線審查的半封閉式檔案館。我們可以建立德國人所說的 “禮物柜”,一個包含危險作品的 “毒藥柜”,但這些作品在某些情況下還是應(yīng)該被保存和使用。
通過假裝錯誤從未發(fā)生來掩蓋錯誤,這確實是很誘人的。我們現(xiàn)在的技術(shù)讓這樣的行為更簡單。我們應(yīng)該減少一點效率,多一點慣性,因為印刷品的性質(zhì),以前的慣性為自己提供了充足的質(zhì)量。即使是最高法院也不排除對其法令中的不準(zhǔn)確之處進(jìn)行一些追溯性的調(diào)整。
正如法律教授杰弗里·費舍爾在我們的同事理查德·拉扎勒斯發(fā)現(xiàn)變化后所說:“在最高法院的意見中,每個字都很重要……當(dāng)他們改變意見的措辭時,他們基本上是在改寫法律?!?/p>
如果這篇文章有一個錯誤,我們都應(yīng)該希望在底部有一個作者或編輯的說明,指出在哪里進(jìn)行了更正,為什么要這樣做,而不是那種悄悄的修改。
如果社會不能對自己誠實,就無法了解自己;如果只能活在當(dāng)下,就無法對自己誠實。我們早就應(yīng)該確認(rèn)并制定政策和技術(shù),讓我們看到我們已經(jīng)走過的地方,特別是我們的錯誤,這樣我們就可能對自己的現(xiàn)狀和未來有一個一致的認(rèn)識。
作者:Jonathan Zittrain,譯者:蒂克偉
來源:https://36kr.com/p/1348491511699720
本文由 @神譯局 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。