bs4的解析器的差異
2019/12/14 下午 09:50
Python網路爬蟲討論版
Will
觀看數:5
回答數:2
收藏數:1
看到不同範例作業中bs4有使用不同的解析,如html.parser, html5lib
, lxml,想請問各個之間有使用上的差別嗎?
回答列表
-
2019/12/15 上午 01:28Jeffrey贊同數:1不贊同數:0留言數:0
-
2019/12/15 下午 05:54張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
嗨,這三個工具主要是告訴 BeatifulSoup 要如何解析 HTML 語法而已,目的是一樣的,嚴格來說差異應該是「嚴謹跟精準程度」跟「效能速度」上略有差異,不過對於使用上我覺得沒有什麼不同。如果你有興趣的話,可以參考一下文件的說明:https://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-a-parser
一般來說: lxml 比較新比較厲害,html5lib 是預設的。