Loading AI tools
basis data graf pengetahuan yang dilayan oleh Wikimedia dan disunting oleh sukarelawan Dari Wikipedia, ensiklopedia bebas
Wikidata adalah graf pengetahuan yang diedit secara kolaboratif dan diladen oleh Yayasan Wikimedia.[1][2] Situs ini adalah wadah penyimpanan data terbuka untuk proyek Wikimedia seperti Wikipedia[3][4] maupun proyek data terbuka lain. Siapa pun dapat menggunakan data di Wikidata yang memiliki lisensi domain publik CC0. Wikidata adalah proyek wiki yang menggunakan perangkat lunak MediaWiki dan ekstensi MediaWiki untuk mendukung data semi terstruktur, Wikibase. Pada pertengahan 2024, Wikidata menyimpan 1.57 milyar pernyataan (data dalam Wikidata berbentuk tiga serangkai pernyataan.)[5]
| ||||
Informasi umum | ||||
---|---|---|---|---|
Tipe situs | ||||
Pengembang |
| |||
Lisensi | CC0 | |||
Tanggal peluncuran | 29 Oktober 2012 | |||
Pranala | wikidata.org | |||
Wikidata adalah sebuah basis data berorientasi dokumen, yang berfokus pada butir (item), yang mewakili segala jenis topik, konsep, atau objek. Tiap butir memiliki pengenal tetap yang unik; sebuah bilangan bulat positif yang diawali dengan huruf besar Q, yang dikenal sebagai "QID". Karakter Q tersebut berasal dari huruf awal dari nama depan Qamarniso Vrandečić (née Ismoilova), seorang Wikimedian Uzbekistan yang menikah dengan salah satu pengembang Wikidata, Denny Vrandečić. Konsep ini memungkinkan informasi dasar yang diperlukan untuk mengidentifikasi topik yang dicakup oleh butir-butir tersebut untuk diterjemahkan tanpa bergantung pada bahasa apa pun.
Beberapa contoh dari butir-butir ini adalah antara lain:
Label butir tidak harus unik. Misalnya, ada dua butir yang diberi nama "Agus Salim": Agus Salim (Q118629), yang mewakili tokoh pahlawan Nasional Indonesia, dan Agus Salim (Q109700049), seorang politisi Indonesia yang berasal dari Jawa Tengah. Namun demikian, kombinasi label dan deskripsinya harus unik. Untuk menghindari ambiguitas, pengenal unik item (QID) suatu item ditautkan dengan kombinasi ini.
Sesuai dengan jenisnya, butir-butir di Wikidata dapat diibaratkan sebagai dokumen. Tiap dokumen berisi data-data yang menggambarkan hubungan antara dokumen tersebut dengan dokumen lain. Menggunakan contoh Agus Salim sebelumnya, dokumen Agus Salim terhubung dengan dokumen Bukittinggi, tempat kelahirannya. Dokumen Agus Salim juga terhubung dengan dokumen Jakarta, tempat ia wafat. Pada contoh tersebut, dokumen Agus Salim juga terhubung dengan proyek Wiki lain, yaitu artikel tentang Agus Salim di Wikipedia Bahasa Inggris dan artikelnya di Wikipedia Bahasa Indonesia dan Wikimedia Commons, tempat foto Agus Salim berada.
Butir Agus Salim, berdasarkan penggambaran contoh sebelumnya, adalah terhubung dengan butir lainnya, terhubung dengan proyek Wikimedia lain (Commons, Wikipedia Bahasa Indonesia dan Wikipedia Bahasa Inggris). Butir-butir pada Wikidata juga dapat juga terhubung dengan proyek lain di luar Wikimedia. Hubungan ini dapat berupa rujukan terhadap data, maupun penanda untuk entri data yang sama pada basis data yang lain. Beberapa contoh dari penanda ini ada pada penanda Research Organization Registry (ROR) untuk institusi riset dan pendidikan tinggi, penanda ISNI untuk pengarang buku, penanda ISBN untuk buku, dan penanda ORCID untuk data peneliti.
Suatu butir Wikidata terdiri dari:
Seperti yang telah dijelaskan pada bagian sebelum nya, penanda QID digunakan sebagai kode unik untuk butir yang berisi konsep tertentu. QID tersambung dengan label dan deskripsi singkat. Dua atau lebih butir bisa saja memiliki label yang sama, namun mereka pasti memiliki QID yang berbeda. Pemberian label dan pemerian yang singkat dan baik adalah hal yang penting dalam merawat basis data Wikidata, ini karena ratusan butir bisa memiliki nama yang sama. Sebagai contoh adalah nama Depok, terdapat Depok di Jawa Barat, Depok di Sleman, maupun Depok di lokasi lain di Indonesia.
Suatu hal bisa saja memiliki penyebutan nama yang berbeda, namun mengarah kepada hal yang sama. Sebagai contoh, proklamator kemerdekaan Indonesia memiliki nama Soekarno, menggunakan ejaan lama. Namun, pada beberapa sumber, namanya ditulis sebagai Sukarno dengan menggunakan ejaan baru. Agar tidak terjadi duplikat butir, nama-nama dengan ejaan berbeda, panggilan, nama dengan gelar maupun sebutan lain dituliskan pada nama lain atau alias.
Pada butir Wikidata tersimpan data mengenai subjek topik dengan bentuk triplet pernyataan. Triplet ini menunjukkan hubungan butir dengan butir yang lain dengan penghubung properti atau atribut.[6] Bentuk tersebut dapat digambarkan sebagai rangkaian subjek - predikat - objek.[7] Rangkaian tersebut juga disebut dengan pasangan kunci dan nilai.[8] Dalam contoh lain, rangkaian pasangan kunci dan nilai ini menghubungkan antara atribut dengan nilai yang sesuai. Misal pada contoh butir Agus Salim di atas, informasi tempat kelahiran Agus Salim tersimpan sebagai berikut:
Rangkaian di atas memberikan informasi mengenai tempat kelahiran Agus Salim, yaitu di Bukittinggi, dengan memasangkan atribut tempat lahir dengan nilai Bukittinggi. Contoh lain adalah bagaimana butir mengenai karya kanon Sherlock Holmes menyimpan informasi mengenai penulis karya tersebut, yaitu Sir Arthur Conan Doyle, menggunakan atribut penulis. Dalam beberapa pernyataan, suatu atribut dapat dipasangkan dengan lebih satu nilai, seperti pada butir Agus Salim, pada atribut mengenai jabatan dapat berisi dua jenis nilai, yaitu Menteri Luar Negeri dan anggota Volksraad. Keduanya menunjukkan fakta yang benar secara historis, dengan waktu mulai jabatan dan akhir jabatan yang berbeda.
Nilai dari suatu atribut dapat berisi butir Wikidata lain, untaian (string), angka, atau berkas media. Tiap atribut yang tersimpan dalam Wikidata mensyaratkan jenis nilai tertentu yang dapat dipasangkan dengannya. Sebagai contoh, atribut situs resmi (official website) hanya bisa dipasangkan dengan nilai dengan tipe pranala (URL). Sebagai pencegahan galat dan membantu proses awakutu (debug) atribut akan memunculkan peringatan galat apabila nilai yang dipasangkan tidak sesuai.
Untuk memberikan penjelasan lebih spesifik terhadap nilai dalam pernyataan, suatu pernyataan dapat memiliki pewatas (qualifier) yang menjelaskan secara lebih detail informasi yang tercantum.[8] Seperti pada contoh butir Agus Salim, nilai dari atribut jabatan, yaitu Menteri Luar Negeri memiliki pewatas bermula pada, berakhir pada, menggantikan dan digantikan oleh. Pewatas-pewatas tersebut memberikan informasi yang lebih luas mengenai nilai pada atribut jabatan Agus Salim di pemerintahan Republik Indonesia. Nilai yang terpasang pada atribut juga dapat dianotasikan dengan rujukan (references) untuk mendukung sumber dari nilai tersebut.[8] Seperti pernyataan, pewatas dan rujukan juga berbentuk pasangan atribut dan nilai.
Rangkaian tersebut, meskipun terlihat sederhana, namun dapat membantu komputer menghubungkan antara data Agus Salim dan Bukittiggi, terlepas dari bahasa atau aksara apa informasi tersebut tersimpan. Melalui antarmuka Wikidata, para pengguna dari kalangan manusia bisa menyunting data tersebut tanpa harus kesulitan membaca data.
Tiap atribut memiliki penanda yang diawali dengan huruf kapital P dan tiap atribut memiliki halaman tersendiri di Wikidata yang berisi label, pemerian, nama lain dan pernyataan yang menggambarkan fungsi dan kegunaan dari atribut tersebut. Terdapat beberapa atribut yang berfungsi hanya untuk menjelaskan atribut lain seperti atribut subatribut dari (P1647).
Atribut juga dapat memiliki aturan tersendiri mengenai penggunaan mereka, yang sering disebut dengan istilah halangan (constraint). Sebagai contoh, atribut ibu kota, memiliki halangan nilai tunggal (single value constraint), yang merefleksikan aturan bahwa suatu daerah (biasanya) hanya memiliki satu ibu kota. Pelanggaran terhadap halangan akan menimbulkan peringatan galat dan petunjuk penggunaan dalam pemakaian.
Dalam proses pembuatan suatu atribut, komunitas Wikidata akan mendiskusikan pembuatan atribut pada warung kopi proyek. Suatu atribut bisa saja memiliki halangan untuk penggunaan wilayah tertentu, sebagai contoh atribut penanda Dapodikdasmen hanya digunakan di wilayah Indonesia. Atribut tersebut berisi nomor penanda halaman entri sekolah pada halaman Data Pokok Pendidikan Dasar dan Menengah milik Kementrian Pendidikan dan Kebudayaan, Riset dan Teknologi Republik Indonesia.
Dalam linguistik, leksem dimaknai sebagai konstruk teoretis untuk makna uniter dan atribut-atribut sintaksis milik bersama dari suatu kumpulan bentuk kata[9]. Leksem bisa juga dimaknai sebagai satuan yang membentuk kata dalam sebuah bahasa dan biasa dimasukkan sebagai entri atau lemma dalam sebuah kamus.[10][11]
Sejak 2016, Wikidata mendukung entri leksikografis dalam bentuk leksem dan bentuk-bentuknya dalam sistem Wikidata.[12] Dalam Wikidata, entri leksikografis memiliki penanda yang berbeda dengan entri butir biasa. Entri ini diawali dengan huruf L, seperti pada contoh entri kerbau (dengan penanda L1132199) dan sapi (dengan penanda L1339932). Entri leksikografis dalam Wikidata dapat berisi pernyataan, makna (senses) dan bentuk (forms.) Penggunaan entri leksikografis pada Wikidata memungkinkan dokumentasi penggunaan kata, hubungan kata dengan butir pada Wikidata, terjemahan kata (makna) dan memungkinkan pembacaan sistem terhadap data leksikografis.
Pada tahun 2020, entri leksikografis pada Wikidata sudah memiliki jumlah lebih dari 250.000.[13] Bahasa dengan entri leksikografis terbanyak adalah bahasa Russia, dengan jumlah leksem mencapai 101,137, diikuti dengan bahasa Inggris dengan 38,122 leksem.[13] Terdapat lebih dari 668 bahasa yang memiliki entri leksikografis di Wikidata.[13]
Skema (schema) pada Wikidata adalah model data yang memberikan gambaran atribut-atribut yang diperlukan pada suatu butir data.[14] Sebagai contoh adalah pada butir data yang menggunakan atribut "adalah" dengan nilai "manusia". Butir data tersebut selalu memiliki atribut di antaranya: "tempat lahir", "tanggal lahir", "tanggal wafat" dan "tempat wafat." Skema entitas pada Wikidata menggunakan Shape Expression untuk membantu mendeskripsikan data dalam butir Wikidata dalam bentuk Resource Description Framework (RDF).[15] Penggunaan skema entitas pada Wikidata dapat mengatasi inkonsistensi data pada Wikidata dan vandalisme yang tidak terperiksa. [15]
Skema entitas pada Wikidata masih dalam tahap pengembangan lebih lanjut, namun telah memiliki beberapa bentuk valid, seperti skema entitas untuk butir manusia dan skema entitas untuk butir bangunan. Pada Wikidata, skema entitas disimpan dengan penanda yang berbeda dari butir, atribut dan leksem. Skema entitas disimpan dengan penanda E, seperti E10 untuk skema entitas butir manusia dan E270 untuk skema entitas butir bangunan.
Wikidata pada awalnya didanai oleh Institut Allen untuk Kecerdasan Buatan, Yayasan Gordon dan Betty More, dan Google dengan total pendanaan mencapai 1.3 juta euro.[16][17] Pengembangan Wikidata dipimpin oleh Yayasan Wikimedia Jerman dalam tiga tahapan:[18]
Wikidata diluncurkan pada tanggal 30 Oktober 2012 sebagai proyek baru pertama Yayasan Wikimedia semenjak tahun 2006.[19][20] Pada saat itu, pengembangan baru selesai sampai tahap pembuatan wadah sentralisasi pranala interwiki bahasa. Pengembangan ini memungkinkan pembuatan entri butir dengan isi informasi sederhana: label, nama lain, pemerian, dan pranala interwiki yang mengarah ke artikel mengenai butir tersebut.
Dalam pengembangan Wikipedia sebelumnya, suatu artikel dalam Wikipedia mendaftarkan pranala-pranala interwiki yang menghubungkan artikel tersebut ke artikel dengan topik yang sama pada Wikipedia bahasa lain. Wikidata, pada awalnya, adalah repositori dari pranala interwiki tersebut.[21] Pada saat itu, Wikipedia edisi-edisi bahasa lain tidak dapat mengakses Wikidata, sehingga tiap artikel Wikipedia harus mencantumkan daftar pranala interwikinya masing-masing.
Pada 14 Januari 2013, Wikipedia bahasa Hungaria menjadi Wikipedia pertama yang menggunakan pranala interwiki melalui Wikidata.[22] Fungsi ini kemudian digunakan juga oleh Wikipedia bahasa Ibrani dan Italia pada 30 Januari[23], hingga Wikipedia bahasa Inggris pada 13 Februari[24], dan ke seluruh Wikipedia bahasa lain pada 6 Maret.[25] Pada tanggal 23 September 2013, pranala interwiki dapat digunakan di Wikimedia Commons.
Pada 4 Februari 2013, sistem pernyataan ditambahkan pada entri Wikidata. Nilai-nilai yang mungkin untuk atribut pada awalnya hanya dibatasi kepada dua tipe data (yaitu nilai dalam bentuk hubungan dengan butir yang lain, dan gambar dari Wikimedia Commons). Tipe data lain, seperti koordinat, tanggal, dan untaian (string) ditambahkan kemudian hari.
Kemampuan Wikipedia edisi ragam bahasa untuk mengakses Wikidata ditingkatkan secara progresif antara 27 Maret sampai 25 April 2013.[26][27] Pada 16 September 2015, Wikidata memulai meluncurkan apa yang disebut dengan akses arbitrer, atau akses yang diberikan kepada artikel Wikipedia untuk membaca atribut pada Wikidata yang tidak terhubung langsung dengan topik artikel tersebut. Sebagai contoh, akses arbitrer memungkinkan pembaca menemukan data mengenai Jerman melalui artikel mengenai Kota Berlin, yang sebelumnya tidak memungkinkan. Pada 27 April 2016, akses arbitrer diaktifkan di Wikimedia Commons.
Menurut suatu kajian yang dilakukan pada tahun 2020, sebagian besar data di Wikidata terdiri dari entri-entri data yang diimpor secara masif dari basis data lain oleh bot internet, yang membantu meruntuhkan apa yang disebut silo data.[28]
Pada 7 September 2015, Yayasan Wikimedia mengumumkan rilis Layanan Kueri Wikidata, yang dapat digunakan oleh para pengguna untuk melakukan pencarian (query; kueri) pada data yang disimpan pada Wikidata.[7][29] Layanan ini menggunakan bahasa SPARQL sebagai bahasa pencarian. Sejak November 2018, terdapat lebih dari 26 perangkat yang berbeda untuk membantu pencarian dalam ragam metode. Layanan Kueri Wikidata menggunakan Blazegraph sebagai penyimpanan RDF dan basis data graf.[30]
Setelah layanan kueri Wikidata dirilis, Yayasan Wikimedia Jerman merilis Pembangun Kueri, "suatu pembangun kueri berbasis formulir untuk orang-orang yang tidak memahami SPARQL" untuk menulis kueri.
Logo Wikidata berbentuk seperti kode batang yang memiliki warna dasar Wikimedia. Kode batang tersebut disusun membentuk kode Morse untuk kata "WIKI". Logo tersebut diciptakan oleh Arun Ganesh dan terpilih melalui pemilihan oleh komunitas.[31]
Seperti yang telah dipaparkan sebelumnya, Wikidata—berdasarkan sejarah pengembangannya—berfungsi sebagai wadah penyimpanan pranala interwiki yang menghubungkan antar edisi bahasa Wikipedia, beserta proyek saudarinya, juga basis data eksternal lain. Hal ini menjadikan Wikidata sebagai titik integrasi antara proyek Wikimedia dan basis data eksternal lain, menyatukan sumber pengetahuan publik menjadi satu kesatuan.[7]
Dalam perkembangan proyek Wikimedia secara keseluruhan, menjaga integrasi sumber data publik tersebut menjadi tantangan, karena selain besarnya volume data, namun juga ragam tipe data yang disimpan dalam Wikidata. Tantangan ini diatasi oleh Yayasan Wikimedia dengan mengaplikasikan teknologi jejaring semantik (web semantics) berupa RDF dan SPARQL, pertama untuk mendeskripsikan dan menghubungkan data yang terdapat di dalam Wikidata, dan yang kedua sebagai alat untuk melakukan cara dengan efektif.[7]
Wikidata menjadi lahan kajian teknologi jejaring semantik, dan bidang-bidang yang terkait dengannya. Dalam kajian yang dilakukan oleh Mora-Cantallops, et al., penelitian yang melibatkan Wikidata berkaitan dengan kualitas data yang disunting oleh pengguna manusia dan bot, serta hubungan antara dua penyunting tersebut dan kaitannya dengan perkembangan kualitas data.[32] Selain itu, penelitian yang berkaitan dengan Wikidata juga berhubungan dengan bagaimana pengetahuan diorganisir dalam lingkungan digital, serta bagaimana organisasi tersebut berhubungan dengan sumber daya eksternal (sebagai referensi) dan juga bagaimana bahasa mempengaruhi organisasi pengetahuan dalam Wikidata.[32]
Berkaitan dengan teknologi jejaring semantik, Wikidata menjadi objek kajian pada penelitian mengenai graf pengetahuan dan ilmu linguistik.[33] Pada bidang kesehatan dan medis, Wikidata dimanfaatkan sebagai repositori penyimpanan data ilmu hayat, farmasi, dan bidang kesehatan ilmu lainnya dan menjadi jembatan penghubung antara peneliti dengan sumber-sumber data penting ini.[33] Karena kontennya yang terbuka dan dapat diakses oleh publik dan digunakan dalam penelitian graf pengetahuan, Wikidata juga mendukung penelitian dalam bidang model bahasa besar.[32][33]
Komunitas memiliki peranan yang sangat besar baik dalam pengembangan perangkat lunak Wikidata, hingga konten dan pemanfaatan konten Wikidata.[2][7] Salah satu pemanfaatan yang menarik untuk dilihat adalah dalam bidang visualisasi data dan pengembangan dasbor pembacaan data. Pengguna Wikidata menggunakan SPARQL dan melakukan percobaan pada layanan kueri, dan kemudian mengembangkan visualisasi data dan konten lainnya menggunakan hasil kueri yang didapatkan. Sebagai contoh adalah yang dilakukan oleh Darari, et al. dalam mengembangkan sebuah dasbor untuk menampilkan seluruh pengetahuan yang ada dalam Wikidata mengenai penyakit Covid-19.[34]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.