安娜的檔案
影子图书馆 来自维基百科,自由的百科全书
安娜的檔案(英語:Anna's Archive)是一家自由、非營利的影子圖書館元搜尋引擎,由匿名的檔案員團隊所創(即安娜和/或盜版圖書館鏡像團隊)[1]。2022年11月,他們在得知美國當局查封Z-Library後,決定創立安娜的檔案[2][5][6]。
該團隊表示,安娜的檔案轉錄源自開放圖書館的元資料、備份各影子圖書館的資料[2][7]、提供有關國際標準書號的資訊,但它本身沒有儲存任何侵權作品——只儲存公眾能在其他途徑獲得的元資料[2][3][5][8][9][10]。其官方網站寫道,安娜的檔案是個非營利組織,但為了抵消成本而接受捐款[3]。
截至2023年11月1日,安娜的檔案官方網站宣稱它是「世上最大型的開源開放數據圖書館」,收錄了22,052,322本書、97,847,390篇文章、2,451,032本漫畫、673,013本雜誌[11]。
概覽
安娜的檔案表示:「資訊渴望自由」,它的成員「十分支持資訊自由,認為應盡一切努力保留知識和文化」[3][12][13]。其官方網站提到,它的宗旨是「透過聚合數據,編錄世上所有書籍……監測『影子圖書館』收錄所有書籍的進度」[14][15][16]。該團隊還說道:「我們站在Z-Library等相關網站的對立面——我們盡可能不會留下任何蹤跡,有很高的作業安全意識」[5][8][9]。它的官方網站提到,歡迎人們在現實和各大社群媒體推薦人使用安娜的檔案,並表示「我們的數據和代碼都是開源的,因此可以無限地東山再起」[17][18]。
未來發展
2023年10月,安娜的檔案稱已抓取了世界上最大的圖書元資料資料庫(聯合目錄)WorldCat的數據,去重後共7億條記錄,以助其實現儲存世界上所有書籍的目標。[19][20]2024年1月,安娜的檔案因受到義大利出版商協會的著作權投訴,在義大利被封鎖。[21]2024年2月,WorldCat的運營方連線電腦圖書館中心起訴安娜的檔案,並同時聲明其內部系統未遭受駭客攻擊[22]。
2023年11月,安娜的檔案宣布獲得一位匿名人士捐贈的750萬本共約350TB中文圖書資源,資源來自超星網的讀秀資料庫,該資料庫的盜版資源長期在網際網路上暗中流傳。安娜的檔案發文尋求大型語言模型合作夥伴完成該系列資源的OCR文字提取工作,合作者可獲得1年或更久的該資源獨家存取權。[23][24]
參見
參考資料
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.