Top Qs
Timeline
Obrolan
Perspektif

Perangkak web

Dari Wikipedia, ensiklopedia bebas

Remove ads

Perangkak web[1] (bahasa Inggris: web crawler), merupakan mesin/perangkat lunak yang secara sistematis menjelajahi Waring Wera Wanua dan biasanya dioperasikan oleh mesin pencari untuk tujuan pengindeksan[2] maupun untuk tujuan pengarsipan.[3]

Cara kerja perangkak web adalah dengan cara mengunjungi URL web tujuan, dan berkomunikasi dengan peladen web yang merespons URL tersebut, perangkak web mengidentifikasi semua pranala di halaman web yang diambil dan menambahkannya ke daftar URL yang akan dikunjungi, atau yang dikenal dengan istilah crawl frontier. Pada saat perangkak web melakukan pengarsipan, perangkap akan menyalin dan menyimpan informasi yang ada pada web tersebut, kemudian arsip web akan disimpan, sehingga dapat dilihat, dibaca, dan dinavigasi seolah-olah berada di web asli langsung.[4]

Remove ads

Daftar perangkak web

Beberapa perangkak web adalah sebagai berikut:

Perangkak web dengan sumber terbuka

Beberapa perangkak web sumber terbuka:

  • GNU Wget
  • GRUB
  • Heritrix
  • ht://Dig
  • HTTrack
  • mnoGoSearch
  • Apache Nutch
  • Open Search Server
  • Scrapy
  • Seeks
  • StormCrawler
  • tkWWW Robot
  • Xapian
  • YaCy

Perangkap web komersial

Beberapa perangkap web berbayar:

  • Diffbot
  • SortSite
  • Swiftbot

Referensi

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads