D14當在解析伺服器回傳的html時,爬蟲抓取class的判別問題
2021/01/21 上午 02:29
Yahoo! 電影網頁爬蟲實作練習
Erin
觀看數:14
回答數:3
收藏數:0
我有個觀念一直轉不過來,想請問各位專家
當我要取<p>共46筆,目前顯示1~10筆</p>的text,在attrs以class作為key時,為什麼要用release_box,而不能直接選擇內層的release_time_c呢?
我直接取attrs={"class":"release_time_c"},印出時會是None,想了解這個觀念,謝謝。
回答列表
-
2021/01/21 下午 08:01K.F贊同數:0不贊同數:0留言數:1
你好阿
你的方向並沒有錯歐
只是class是release_time _c
有一格空格歐
-
2021/01/23 上午 01:13張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,你好
release_time _c 代表這個 html 有兩個 class :「release_time」和「_c」,class 是利用 空格分隔的。
嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook 或 技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ
-
2021/10/14 下午 10:40Allen Chen贊同數:0不贊同數:0留言數:0
你們好,那想請問選擇外層release_box 跟內層release_time __c 有什麼差別跟優缺點呢