Beautiful Soup

Beautiful Soup
原作者	Leonard Richardson
目前版本	4.12.3（2024年1月17日；穩定版本）;
原始碼庫	code.launchpad.net/beautifulsoup/;
程式語言	Python
類型	HTML解析庫、網路資料採集
授權條款	Python軟體基金會授權條款（Beautiful Soup 3及以前）; MIT授權條款（Beautiful 4及以後）
網站	www.crummy.com/software/BeautifulSoup/

Beautiful Soup是一個Python包，功能包括解析HTML、XML文件、修復含有未閉合標籤等錯誤的文件（此種文件常被稱為tag soup）。這個擴充包為待解析的頁面建立一棵樹，以便提取其中的資料，這在網路資料採集時非常有用。^[2]

快速預覽 原作者, 目前版本 ...

在2021年，Python 2.7的官方支援終止，BeautifulSoup發行版4.9.3是支援Python 2.7的最後版本^[3]。

範例代碼