logo
Loading...

請問 BeautifulSoup 不同解析程序的差異為何 - Cupoy

在 Day12-Day16 的幾個範例程式中,BeautifulSoup 用來解析 Html 的方...

請問 BeautifulSoup 不同解析程序的差異為何

2020/11/29 下午 09:10
Wiki 的爬蟲實作練習
Ivy
觀看數:35
回答數:2
收藏數:0

在 Day12-Day16 的幾個範例程式中,BeautifulSoup 用來解析 Html 的方法有 'html5lib' 及 'lxml' 兩種,另還有 'html.parser',請問這三種解析程序在解析 html 文件上有什麼不同點?應該如何選擇什麼情況使用哪種方式?謝謝!

回答列表

  • 2020/12/02 下午 00:50
    Paul
    贊同數:0
    不贊同數:0
    留言數:0

    看來lxml解析速度最快也被推薦 https://www.crummy.com/software/BeautifulSoup/bs4/doc/

  • 2020/12/02 下午 02:28
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:0

    嗨,你好
    他們只是不同人新舊開發上的差異,原則上是沒有什麼差。官方有一個比較表,但我其實覺得沒什麼差: ![截圖 2020-12-02 14.27.09.png](http://kwassistfile.cupoy.com/000001762221546B000000256375706F795F72656C65617365414E53/1606789766648/large) 另外,推薦使用 lxml,因為他是最新的,對比較新的網頁解析效果比較好。

    嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ