热门问题
时间线
聊天
视角

鏈結資料

在不同数据源之间创建语义关联的方法 来自维基百科,自由的百科全书

Remove ads

鏈結資料Linked data)在電腦科學領域,是指經過結構化處理的資料,這些資料因彼此互相鏈結(linked),而能透過語意查詢英语Semantic query的方式變得更有用處。鏈結資料利用了現有的網路標準技術,例如HTTPRDFURI,其應用超出了只是為人類提供網頁資訊,而是要讓電腦能自動讀取與理解資訊。[1][2]

全球資訊網協會(W3C)主席蒂姆·伯納斯-李 ,在2006年語意網計畫的筆記中,創造了「Linked Data」這個名詞。[3]鏈結資料的願景之一,是要讓網際網路成為一個全球資料庫。

鏈結資料可以是開放資料,在這種情況下稱作鏈結開放資料(Linked Open Data)。

譯詞

中國大陸譯為「链接数据」[4]、「关联数据」[5],台灣譯作「链结资料」[6],其他用過的譯詞包括「键连资料」、「资料连结」、「连结资料」、「关联资料」等[7]

原則

蒂姆·伯納斯-李(Tim Berners-Lee)在2006年的筆記中,提出鏈結資料的四大原則[3]

  1. 使用URI(Uniform Resource Identifiers)來命名和辨識事物。
  2. HTTP URI能用來查詢、解釋這些事物,並能讓電腦透過這個 URI 取得背後的資料(dereference,取值)。
  3. 經由RDFSPARQL等開放標準,提供名稱所識別的對象是什麼的有用資訊。
  4. 在網路上發布資料時,提到其他的事物應使用他們基於 HTTP URI 的名稱。

他在2009年TED大會上,重新闡述了這些原則:[8]

  1. 所有概念性的事物都應擁有一個以 HTTP 作為起始的名稱。
  2. 查詢 HTTP 名稱應以標準格式回傳關於該事物的有用資料。
  3. 透過其資料,和該事物有關係的任何其他事物,也應賦予以HTTP 作為起始的名稱。

組成

鏈結開放資料

鏈結開放資料是成為開放資料的「鏈結資料」。[9][10][11]

蒂姆·伯納斯-李定義了「鏈結開放資料」與「鏈結資料」的區別:

「鏈結開放資料」是在開放授權下釋出的「鏈結資料」,該授權不阻礙資料能自由的再次使用。

——Tim Berners-Lee,Linked Data[3][12]

大型的「鏈結開放資料集」包括DBpediaWikidataWikibase和Open ICEcat。

歷史

「鏈結開放資料」(Linking Open Data)這個術語至少從2007年2月以來就已經在使用,也就是「Linking Open Data mailing list」建立之時。[13] [14]該郵件清單是由麻省理工學院的SIMILE計畫管理。[15]

鏈結開放資料計畫

Thumb
上述圖表顯示了截至 2014 年 8 月,哪些鏈結開放資料集(Linking Open Data datasets)彼此相互連結。這是由始於 2007 年的「鏈結開放資料雲」(Linked Open Data Cloud)專案製作的。部分資料集可能包含可免費取得但受版權保護的資料。[16]
Thumb
與上述圖表相同,但為 2017 年 2 月版,展示短短兩年半內的成長情況。

W3C 語意網教育與推廣小組(Semantic Web Education and Outreach group)旗下的「鏈結開放資料」(Linking Open Data)社群專案,目標是透過在網路上以 RDF 格式發佈各種開放資料集,並在不同資料來源的資料項目間建立 RDF 連結,擴展網路成為一個資料共享平台(data commons)。2007 年 10 月,資料集包含超過二十億個 RDF Triples英语Semantic triple,透過兩百萬多個 RDF 連結相互連結。[17][18] 到 2011 年 9 月,數量成長至三百一十億個 RDF Triples,連結約五億零四百萬個 RDF 連結。2014 年發表了詳細的統計分析報告。[19]

Remove ads

歐盟計畫

歐盟有多個涉及鏈結資料的專案,包括「全天候鏈結開放資料」(Linked Open Data Around The Clock, LATC)專案,[20]機器可讀取立法資料的 AKN4EU 專案,[21]PlanetData 專案,[22]資料與平台即服務(DaPaaS, Data-and-Platform-as-a-Service)專案,[23]以及鏈結開放資料 2(Linked Open Data 2, LOD2)專案。[24][25][26]資料的連結是歐盟開放資料門戶英语EU Open Data Portal(EU Open Data Portal)的主要目標之一,該網站提供數千筆資料集,供任何人重複使用與連結。

知識本體

知識本體(Ontology)是資料結構的正式描述。其中較著名的知識本體包括:

  • FOAF英语FOAF(Friend of a Friend)— 描述人物、其屬性與關係的本體
  • UMBEL英语UMBEL(Upper Mapping and Binding Exchange Layer) — 一個輕量級的參考結構,包含約 20,000 個主題概念類別及其關係,這些概念來自 OpenCyc,可作為外部資料的綁定類別;同時連結了 DBpedia 與 YAGO 等資料庫中的約 150 萬個具名實體

資料集

  • DBpedia – 自維基百科擷取資料的鏈結開放資料集。
  • GeoNames- 全球地名及其基本資訊的鏈結開放資料集。
  • Wikidata維基媒體基金會於2012 年發起的結構化資料儲存專案。
  • Global Research Identifier Database英语Global Research Identifier Database - 學術研究的機構的國際資料庫。
  • 上海圖書館开放数据平台 – 上海圖書館建置,包含人名、姓氏、歷史紀年、地理名詞、機構名錄、印章、避諱字等資料。
  • 链结开放资料平台 – 中央研究院數位文化中心建置,將中研院執行數位典藏計畫以及各研究所製作的數位資料轉換為鏈結資料,涵蓋生物學、人類學、宗教、藝術、影音、歷史等領域。
  • DILA 链结开放资料平台 - 法鼓文理學院建置,將「佛學規範資料庫」內的人物與地點資料,轉換為鏈結資料的格式。[27]

參見

參考文獻

延伸閱讀

外部連結

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads