logo
Loading...

header使用問題 - Cupoy

搜了網址發現一進去就會跳出要我們登入的彈出視窗, 所以原本以為是因為這樣而出現錯誤不太理解為什麼解答...

pycrawler-2

header使用問題

2020/03/03 上午 00:23
Python網路爬蟲討論版
金美君
觀看數:7
回答數:2
收藏數:0
pycrawler-2

搜了網址發現一進去就會跳出要我們登入的彈出視窗, 所以原本以為是因為這樣而出現錯誤

不太理解為什麼解答那樣寫就可以爬出資訊, 還有那個 headers 是如何出來的

想請教一下~謝謝

回答列表

  • 2020/03/03 上午 02:22
    張晉豪
    贊同數:2
    不贊同數:0
    留言數:0

    關於為什麼要加Header可以參考以下的影片12:38處和day06的投影片p7~p14

    因為Server通常會檢查發出Request那⽅是否為正常的來源。

    所以加上Header是為了讓我們發出的Request像是⼀個正常使⽤者瀏覽網頁的⾏為,

    進而能夠收到Response,如:

    headers = {'user-agent': 'my-app/0.0.1'} 
    = requests.get(url,headers=headers)
    response = r.text

  • 2020/03/03 上午 02:43
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    嗨,美君


    簡單來說,headers 是一種 HTTP 溝通時會攜帶的資訊,通常表示「發送方」的資訊。是一種最基本的驗證機制,作為判斷來源是否合法的依據。在這個例子中,主要是帶出有 headers 這種東西,至於如何找出該帶哪些 headers 可以參考我之前整理的文章


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃