selenium 抓取問題求解抓取後內容失敗 - Cupoy

我想要透過selenium抓取下列連結的內容，但是我始終抓不到表格裡面的內容值，請問是我的等待時間過...

selenium 抓取問題求解抓取後內容失敗

2020/08/11 上午 01:58

Python網路爬蟲討論版

張庭耀

觀看數：6

回答數：2

收藏數：0

我想要透過selenium抓取下列連結的內容，但是我始終抓不到表格裡面的內容值，請問是我的等待時間過短嗎?

http://fgj.wuhan.gov.cn/bsfw_44/zxsbhcxxt/fdcjjjg/

import time
sys.path.insert(0,'/usr/lib/chromium-browser/chromedriver')
from selenium import webdriver
wd = webdriver.Chrome('chromedriver',chrome_options=chrome_options)
wd.implicitly_wait(20)
wd.get("http://fgj.wuhan.gov.cn/bsfw_44/zxsbhcxxt/fdcjjjg/")
time.sleep(10)
html_source = wd.page_source
html_source

回答列表

2020/08/11 下午 03:08

Jia

贊同數：1

不贊同數：0

留言數：2

我從"開發人員工具" > "Network" 搜尋隨便一個字串，發現到它是從另一個網頁過來的，因此GET那個網址([http://119.97.201.22:8083/search/zzzz/zz_zhongjie2.aspx](http://119.97.201.22:8083/search/zzzz/zz_zhongjie2.aspx))就能抓取到表格內容了。 ![01.PNG](http://kwassistfile.cupoy.com/00000173DC49E3B80000002B6375706F795F72656C65617365414E53/1597116815560/large)
另外從原本網頁的原始碼也可以看到，它是使用 iframe 內嵌框架嵌入另一個網頁。 ![02.PNG](http://kwassistfile.cupoy.com/00000173DC49E3B80000002B6375706F795F72656C65617365414E53/1597116815561/large)
那為何 Selenium 會找不到資料? 稍微google搜尋"**selenium iframe**"會知道，想抓取 iframe 內的內容就需要先切進去，才能取得資料。 ```python browser.get("http://fgj.wuhan.gov.cn/bsfw_44/zxsbhcxxt/fdcjjjg/") time.sleep(10) browser.switch_to.frame(0) # <--- html_source = browser.page_source html_source ```
2020/08/13 下午 11:37

張維元 (WeiYuan)

贊同數：0

不贊同數：0

留言數：0

嗨，這是一個好的例子，會建議像 Jia 先從檢視原始碼的部分先找找看，最後才用程式來爬，不要一開始就用程式。

如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕，也可以追蹤我的GITHUB 帳號。若還有問題的話，也歡迎再開一個新的問題繼續發問，或者把你理解的部分整理上來，我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個社群活動：學員限定！CUPOY 馬拉松線上小聚 👨🏻‍💻👨🏻‍💻，歡迎一起來玩玩！

selenium 抓取問題 求解抓取後內容失敗

回答列表

selenium 抓取問題求解抓取後內容失敗