logo
Loading...

selenium 抓取問題 求解抓取後內容失敗 - Cupoy

我想要透過selenium抓取下列連結的內容,但是我始終抓不到表格裡面的內容值,請問是我的等待時間過...

selenium 抓取問題 求解抓取後內容失敗

2020/08/11 上午 01:58
Python網路爬蟲討論版
張庭耀
觀看數:6
回答數:2
收藏數:0

我想要透過selenium抓取下列連結的內容,但是我始終抓不到表格裡面的內容值,請問是我的等待時間過短嗎?

http://fgj.wuhan.gov.cn/bsfw_44/zxsbhcxxt/fdcjjjg/


回答列表

  • 2020/08/11 下午 03:08
    Jia
    贊同數:1
    不贊同數:0
    留言數:2

    我從"開發人員工具" > "Network" 搜尋隨便一個字串,發現到它是從另一個網頁過來的,因此GET那個網址([http://119.97.201.22:8083/search/zzzz/zz_zhongjie2.aspx](http://119.97.201.22:8083/search/zzzz/zz_zhongjie2.aspx))就能抓取到表格內容了。 ![01.PNG](http://kwassistfile.cupoy.com/00000173DC49E3B80000002B6375706F795F72656C65617365414E53/1597116815560/large)
    另外從原本網頁的原始碼也可以看到,它是使用 iframe 內嵌框架嵌入另一個網頁。 ![02.PNG](http://kwassistfile.cupoy.com/00000173DC49E3B80000002B6375706F795F72656C65617365414E53/1597116815561/large)
    那為何 Selenium 會找不到資料? 稍微google搜尋"**selenium iframe**"會知道,想抓取 iframe 內的內容就需要先切進去,才能取得資料。 ```python browser.get("http://fgj.wuhan.gov.cn/bsfw_44/zxsbhcxxt/fdcjjjg/") time.sleep(10) browser.switch_to.frame(0) # <--- html_source = browser.page_source html_source ```

  • 2020/08/13 下午 11:37
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    嗨,這是一個好的例子,會建議像 Jia 先從檢視原始碼的部分先找找看,最後才用程式來爬,不要一開始就用程式。


    如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個社群活動:學員限定!CUPOY 馬拉松線上小聚 👨🏻‍💻👨🏻‍💻,歡迎一起來玩玩!