Loading AI tools
Van Wikipedia, de vrije encyclopedie
DBpedia is een vrijwilligersorganisatie die wil bijdragen aan een open informatie-infrastructuur. Daartoe ontwikkelt en onderhoudt zij een systeem dat gestructureerde informatie op een ook voor machines leesbare wijze uit Wikipedia haalt, de open internet-encyclopedie. Deze informatie wordt als linked data beschikbaar gesteld.
DBpedia | ||||
---|---|---|---|---|
Ontwikkelaar(s) | Universiteit Leipzig Universiteit van Mannheim OpenLink Software | |||
Uitgebracht | 10 januari 2007 (17 jaar geleden) | |||
Recentste versie | DBpedia 2016 - 10 (Oktober 2016) | |||
Status | actief | |||
Besturingssysteem | OpenLink Software | |||
Geschreven in | Scala, Java, VSP | |||
Categorie | Semantisch web, Open data | |||
Licentie(s) | GNU General Public License | |||
Versiebeheer | Officiële broncode | |||
Website | nl.dbpedia.org | |||
|
Artikelen in Wikipedia bestaan grotendeels uit ongestructureerde tekst, maar deels ook uit gestructureerde data in sjablonen, categorieën, geo-data of externe links. Om zo veel mogelijk data uit dit geheel te verzamelen maakt DBpedia gebruik van extractors, die met behulp van mappings[1] termen uit Wikimedia afbeelden op de ontologie van DBpedia. Mappings dienen op deze manier vooral het eenduidig maken van begrippen en zijn wezenlijk voor het omgaan met synoniemen en homoniemen. Zij zijn voor 125 talen beschikbaar en worden per taalgebied gemaakt.
In 2007 is de eerste dataset van DBpedia voor publiek beschikbaar gekomen, nadat het project gestart is door de Vrije Universiteit van Berlijn en de Universiteit van Leipzig, in samenwerking met OpenLink Software. De Nederlandstalige versie van de DBpedia is van augustus 2012. Het initiatief hiertoe is afkomstig uit de wereld van de openbare bibliotheken, waar Bibliotheek.nl[2] een samenwerkingsovereenkomst aanging met de Universiteit van Leipzig om ook voor het Nederlandse taalgebied DBpedia tot wasdom te brengen. Inmiddels is de groep achter de Nederlandstalige DBpedia[3] over de bibliotheekgrenzen heen gegroeid en maken ook Vlamingen hiervan deel uit.
DBpedia maakt gebruik van het Resource Description Framework (RDF) om de geëxtraheerde informatie te structureren en koppelbaar te maken aan andere linked data. De data in nl.dbpedia.org kunnen met zoekvragen opgehaald worden via een SPARQL interface[4] of afzonderlijk worden bekeken via een interface dat RDF naar het http-protocol omzet. Sinds 2013 is dit gebruikersinterface vernieuwd, en als eerste op de Nederlandstalige DBpedia[5] toegepast.
In september 2014 is een nieuwe versie van DBpedia uitgebracht, DBpedia 2014 geheten. Vergeleken met vorige versies kunnen nu termen uit Wikipedia worden geëxtraheerd ook zonder terug te vallen op de data in sjablonen en categorieën. Dit wordt voornamelijk bereikt door efficiënter gebruik te maken van de samenvattingen aan het begin van elk Wikipedia-artikel. Ook van de enorme verzameling van rechtenvrij beeldmateriaal, Wikimedia Commons, worden nu de metadata geëxtraheerd en gekoppeld aan de DBpedia-ontologie. De complete dataset van DBpedia beschrijft nu 4,58 miljoen entiteiten, waarvan er 4,22 miljoen in de DBpedia-ontologie zijn opgenomen. Dit maakt dat we kunnen vaststellen dat - in de stand van zaken van mei 2014 - 1.445.000 personen, 735.000 plaatsen, 123.000 muziekalbums, 87.000 films, 19.000 videospellen, 241.000 organisaties, 251.000 diersoorten en 6.000 ziekten in DBpedia beschreven staan. Van deze entiteiten zijn er 1,8 miljoen specifiek voor het Nederlandse taalgebied.
DBpedia verzamelt uit Wikipedia 25,2 miljoen links naar beeldmateriaal en 28,8 miljoen links naar externe webpagina's. Als Linked-data toepassing bij uitstek bevat DBpedia circa 50 miljoen koppelingen naar andere datasets in RDF, 80,9 miljoen links naar de categorieën van Wikipedia en 41,2 miljoen categorieën van YAGO2. Als RDF-database bevat DBpedia 3 miljard triples, waarvan 580 miljoen uit de Engelstalige editie en 2,46 miljard uit andere talen.
DBpedia stelt gebruikers in staat om antwoorden te vinden op vragen waarop het antwoord verspreid ligt over talrijke verschillende Wikipedia-artikelen. De gegevens voor deze antwoorden worden opgevraagd met SPARQL als zoektaal. Stel, dat je geïnteresseerd bent in de Japanse shōjo manga serie Tokyo Mew Mew, en dat je wilt weten in welke genres de illustrator van deze mangaserie nog meer heeft gepubliceerd. DBpedia voegt informatie uit de Wikipedia-artikelen over Tokyo Mew Mew, Mia Ikumi en over werken zoals Super Doll Licca-chan en Koi Cupid samen tot een geheel. Omdat DBpedia deze data normaliseert binnen een enkele database, kan de volgende zoekvraag query worden gesteld zonder dat je hoeft te weten in welk artikel elk informatiefragment precies staat. Alle genres die door de zoekvraag worden geraakt komen in het resultaat:
PREFIX dbprop: <http://dbpedia.org/property/>
PREFIX db: <http://dbpedia.org/resource/>
SELECT ?who, ?WORK, ?genre WHERE {
db:Tokyo_Mew_Mew dbprop:author ?who .
?WORK dbprop:author ?who .
OPTIONAL { ?WORK dbprop:genre ?genre } .
}
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.