Loading...

使用selenium按頁面，會被偵查出出現 Access Denied (用一般瀏覽器是正常的)? - Cupoy

https://www.dnb.com/business-directory.html用chrome...

使用selenium按頁面，會被偵查出出現 Access Denied (用一般瀏覽器是正常的)?

2020/07/02 下午 04:12

Python網路爬蟲討論版

ethanqq

觀看數：223

回答數：4

收藏數：0

https://www.dnb.com/business-directory.html

用chrome driver 去點連結開頁面，會出現“Access denied”

可否請各位老師們幫忙指點一下，如何讓我的selenium chrome driver不要被擋呢？

我有個研究專案需要在這邊抓資料，

我已經有用 user-agent與proxy

謝謝

回答列表

2020/07/02 下午 10:46

Jeffrey

贊同數：1

不贊同數：1

留言數：3

另一種偽裝方式, 提供參考:

#要爬取的网站

url = "https://www.zhihu.com/"

#设置请求报头头文件格式 headers = ("User-Agent", 用户具体代理值)

headers = ("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.5558.400 QQBrowser/10.1.1695.400")

#创建一个opener

opener = urllib.request.build_opener()

#将headers添加到opener中

opener.addheaders = [headers]

#将opener安装为全局

urllib.request.install_opener(opener)

#用urlopen()方法打开网页

data = urllib.request.urlopen(url).read().decode('utf-8')
2020/07/05 下午 07:04

張維元 (WeiYuan)

贊同數：0

不贊同數：0

留言數：2

嗨，想要先確認一下

所以是網站進得去，但是切換到特定頁面才產生錯誤嗎？請問是哪一個頁面/還是所有頁面？

如果這個回答對你有幫助請主動點選「有幫助」的按鈕，也可以追蹤我的GITHUB帳號。若還有問題的話，也歡迎繼續再追問或者把你理解的部分整理上來，我都會提供你 Review 和 Feedback 😃😃😃
2020/07/06 上午 00:28

張維元 (WeiYuan)

贊同數：1

不贊同數：0

留言數：2

用 requests + headers 是可以動的：
2020/07/06 上午 00:30

張維元 (WeiYuan)

贊同數：1

不贊同數：0

留言數：1

用 selenium 也是可以動的：