logo
Loading...

D14當在解析伺服器回傳的html時,爬蟲抓取class的判別問題 - Cupoy

我有個觀念一直轉不過來,想請問各位專家當我要取<p>共46筆,目前顯示1~10筆</p>的text,...

D14當在解析伺服器回傳的html時,爬蟲抓取class的判別問題

2021/01/21 上午 02:29
Yahoo! 電影網頁爬蟲實作練習
Erin
觀看數:14
回答數:3
收藏數:0

我有個觀念一直轉不過來,想請問各位專家


當我要取<p>共46筆,目前顯示1~10筆</p>的text,在attrs以class作為key時,為什麼要用release_box,而不能直接選擇內層的release_time_c呢?

我直接取attrs={"class":"release_time_c"},印出時會是None,想了解這個觀念,謝謝。



回答列表

  • 2021/01/21 下午 08:01
    K.F
    贊同數:0
    不贊同數:0
    留言數:1

    你好阿

    你的方向並沒有錯歐

    只是class是release_time _c

    有一格空格歐


  • 2021/01/23 上午 01:13
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    嗨,你好
    release_time _c 代表這個 html 有兩個 class :「release_time」和「_c」,class 是利用 空格分隔的。

    嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ

  • 2021/10/14 下午 10:40
    Allen Chen
    贊同數:0
    不贊同數:0
    留言數:0

    你們好,那想請問選擇外層release_box 跟內層release_time __c 有什麼差別跟優缺點呢