热门问题
时间线
聊天
视角
鏈結資料
在不同数据源之间创建语义关联的方法 来自维基百科,自由的百科全书
Remove ads
鏈結資料(Linked data)在電腦科學領域,是指經過結構化處理的資料,這些資料因彼此互相鏈結(linked),而能透過語意查詢的方式變得更有用處。鏈結資料利用了現有的網路標準技術,例如HTTP、RDF與 URI,其應用超出了只是為人類提供網頁資訊,而是要讓電腦能自動讀取與理解資訊。[1][2]
全球資訊網協會(W3C)主席蒂姆·伯納斯-李 ,在2006年語意網計畫的筆記中,創造了「Linked Data」這個名詞。[3]鏈結資料的願景之一,是要讓網際網路成為一個全球資料庫。
鏈結資料可以是開放資料,在這種情況下稱作鏈結開放資料(Linked Open Data)。
譯詞
中國大陸譯為「链接数据」[4]、「关联数据」[5],台灣譯作「链结资料」[6],其他用過的譯詞包括「键连资料」、「资料连结」、「连结资料」、「关联资料」等[7]。
原則
蒂姆·伯納斯-李(Tim Berners-Lee)在2006年的筆記中,提出鏈結資料的四大原則[3]:
- 所有概念性的事物都應擁有一個以 HTTP 作為起始的名稱。
- 查詢 HTTP 名稱應以標準格式回傳關於該事物的有用資料。
- 透過其資料,和該事物有關係的任何其他事物,也應賦予以HTTP 作為起始的名稱。
組成
- Uniform Resource Identifier,URI
- Hypertext Transfer Protocol,HTTP
- 結構化資料:使用控制字彙( controlled vocabulary)的術語和資料集的定義,並以資源描述框架(Resource Description Framework,RDF)序列化格式,例如 RDFa、RDF/XML、Notation3、Turtle 或 JSON-LD,來表示結構化資料。
- 鏈結資料平台
鏈結開放資料
鏈結開放資料是成為開放資料的「鏈結資料」。[9][10][11]
蒂姆·伯納斯-李定義了「鏈結開放資料」與「鏈結資料」的區別:
「鏈結開放資料」是在開放授權下釋出的「鏈結資料」,該授權不阻礙資料能自由的再次使用。
「鏈結開放資料」(Linking Open Data)這個術語至少從2007年2月以來就已經在使用,也就是「Linking Open Data mailing list」建立之時。[13] [14]該郵件清單是由麻省理工學院的SIMILE計畫管理。[15]。


W3C 語意網教育與推廣小組(Semantic Web Education and Outreach group)旗下的「鏈結開放資料」(Linking Open Data)社群專案,目標是透過在網路上以 RDF 格式發佈各種開放資料集,並在不同資料來源的資料項目間建立 RDF 連結,擴展網路成為一個資料共享平台(data commons)。2007 年 10 月,資料集包含超過二十億個 RDF Triples,透過兩百萬多個 RDF 連結相互連結。[17][18] 到 2011 年 9 月,數量成長至三百一十億個 RDF Triples,連結約五億零四百萬個 RDF 連結。2014 年發表了詳細的統計分析報告。[19]
Remove ads
歐盟有多個涉及鏈結資料的專案,包括「全天候鏈結開放資料」(Linked Open Data Around The Clock, LATC)專案,[20]機器可讀取立法資料的 AKN4EU 專案,[21]PlanetData 專案,[22]資料與平台即服務(DaPaaS, Data-and-Platform-as-a-Service)專案,[23]以及鏈結開放資料 2(Linked Open Data 2, LOD2)專案。[24][25][26]資料的連結是歐盟開放資料門戶(EU Open Data Portal)的主要目標之一,該網站提供數千筆資料集,供任何人重複使用與連結。
知識本體(Ontology)是資料結構的正式描述。其中較著名的知識本體包括:
- FOAF(Friend of a Friend)— 描述人物、其屬性與關係的本體
- UMBEL(Upper Mapping and Binding Exchange Layer) — 一個輕量級的參考結構,包含約 20,000 個主題概念類別及其關係,這些概念來自 OpenCyc,可作為外部資料的綁定類別;同時連結了 DBpedia 與 YAGO 等資料庫中的約 150 萬個具名實體
- DBpedia – 自維基百科擷取資料的鏈結開放資料集。
- GeoNames- 全球地名及其基本資訊的鏈結開放資料集。
- Wikidata – 維基媒體基金會於2012 年發起的結構化資料儲存專案。
- Global Research Identifier Database - 學術研究的機構的國際資料庫。
- 上海圖書館开放数据平台 – 上海圖書館建置,包含人名、姓氏、歷史紀年、地理名詞、機構名錄、印章、避諱字等資料。
- 链结开放资料平台 – 中央研究院數位文化中心建置,將中研院執行數位典藏計畫以及各研究所製作的數位資料轉換為鏈結資料,涵蓋生物學、人類學、宗教、藝術、影音、歷史等領域。
- DILA 链结开放资料平台 - 法鼓文理學院建置,將「佛學規範資料庫」內的人物與地點資料,轉換為鏈結資料的格式。[27]
參見
參考文獻
延伸閱讀
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads