Beautiful Soup

Beautiful Soup
原作者	Leonard Richardson
当前版本	4.12.3（2024年1月17日；稳定版本）;
源代码库	code.launchpad.net/beautifulsoup/;
编程语言	Python
类型	HTML解析库、网络数据采集
许可协议	Python软件基金会许可证（Beautiful Soup 3及以前）; MIT许可证（Beautiful 4及以后）
网站	www.crummy.com/software/BeautifulSoup/

Beautiful Soup是一个Python包，功能包括解析HTML、XML文档、修复含有未闭合标签等错误的文档（此种文档常被称为tag soup）。这个扩展包为待解析的页面建立一棵树，以便提取其中的数据，这在网络数据采集时非常有用。^[2]

事实速览 原作者, 当前版本 ...

在2021年，Python 2.7的官方支持终止，BeautifulSoup发行版4.9.3是支持Python 2.7的最后版本^[3]。

示例代码