Scrapy

Scrapy
開發者	Scrapinghub, Ltd.（英語：Scrapinghub, Ltd.）
首次發布	2008年6月26日
當前版本	2.13.4（2025年11月17日；穩定版本）;
原始碼庫	github.com/scrapy/scrapy;
程式語言	Python
作業系統	Windows、macOS、Linux
類型	網絡爬蟲
許可協議	BSD許可證
網站	scrapy.org

Scrapy（/ˈskreɪpi/ SKRAY-pee^[2]是一個用Python編寫的自由且開源的網絡爬蟲框架。它在設計上的初衷是用於爬取網絡數據，但也可用作使用API來提取數據，或作為生成目的的網絡爬蟲^[3]。該框架目前由網絡抓取的開發與服務公司Scrapinghub公司（英語：Scrapinghub Ltd.）維護。

快速預覽 開發者, 首次發布 ...

Scrapy項目圍繞「蜘蛛」（spiders）建構，蜘蛛是提供一套指令的自包含的爬網程序（crawlers）。遵循其他如Django框架的一次且僅一次精神^[4]，允許開發者重用代碼將便於構建和拓展大型的爬網項目。Scrapy也提供一個爬網shell，開發者可用它測試對網站的效果。^[5]

使用Scrapy的知名公司和產品有：Lyst^[6]^[7]、Parse.ly（英語：Parse.ly）^[8]、Sayone Technologies（英語：Sayone Technologies）^[9]、Sciences Po Medialab^[10]、Data.gov.uk（英語：Data.gov.uk）的世界政府數據網站^[11]等。

[2]

[3]

[1]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

Scrapy

歷史

參考文獻

外部連結

參見

Wikiwand - on