Scrapy

Scrapy
开发者	Scrapinghub, Ltd.（英语：Scrapinghub, Ltd.）
首次发布	2008年6月26日
当前版本	2.13.4（2025年11月17日；稳定版本）;
源代码库	github.com/scrapy/scrapy;
编程语言	Python
操作系统	Windows、macOS、Linux
类型	网络爬虫
许可协议	BSD许可证
网站	scrapy.org

Scrapy（/ˈskreɪpi/ SKRAY-pee^[2]是一个用Python编写的自由且开源的网络爬虫框架。它在设计上的初衷是用于爬取网络数据，但也可用作使用API来提取数据，或作为生成目的的网络爬虫^[3]。该框架目前由网络抓取的开发与服务公司Scrapinghub公司（英语：Scrapinghub Ltd.）维护。

事实速览 开发者, 首次发布 ...

Scrapy项目围绕“蜘蛛”（spiders）建构，蜘蛛是提供一套指令的自包含的爬网程序（crawlers）。遵循其他如Django框架的一次且仅一次精神^[4]，允许开发者重用代码将便于构建和拓展大型的爬网项目。Scrapy也提供一个爬网shell，开发者可用它测试对网站的效果。^[5]

使用Scrapy的知名公司和产品有：Lyst^[6]^[7]、Parse.ly（英语：Parse.ly）^[8]、Sayone Technologies（英语：Sayone Technologies）^[9]、Sciences Po Medialab^[10]、Data.gov.uk（英语：Data.gov.uk）的世界政府数据网站^[11]等。

[2]

[3]

[1]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

Scrapy

历史

参考文献

外部链接

参见

Wikiwand - on