logo
Loading...

下載圖片網址問題 - Cupoy

如下我的程式碼我用 imageurl=tag.string 直接取得的網址type是bs4.elem...

下載圖片網址問題

2019/12/23 下午 05:10
Python網路爬蟲討論版
Emma
觀看數:3
回答數:2
收藏數:1

如下我的程式碼

我用 imageurl=tag.string 直接取得的網址type是bs4.element.NavigableString 請問是甚麼資料型態? 我用這樣直接送出請求下載圖片會有以下erron,貌似在img=Image.open(r.raw)出錯,表示這是網站網址不是圖片網址,所以找不到圖片嗎?

還有ptt上的資料說

i.imgur.com/Cgb5oo1.jpg

是圖片

imgur.com/Cgb5oo1

是網站

若從資料上只得到imgur.com/Cgb5oo1 這個網站網址,如何知道圖片網址?這個規則適用每個網站嗎?

回答列表

  • 2019/12/24 上午 11:46
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:1

    嗨,如果是 imgur 取出的網址,他的圖片網址規則是直接在網址後面加上 .jpg 或 .png 都可以

  • 2019/12/27 下午 05:20
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:0

    所以根據不同網站不同規則要再觀察囉?!


    => 正常來說你要存取圖片的話,應該是要用 <img> 標籤中的 src 屬性,這個才是真正的圖片網址。但這個例子中,批踢踢的用法其實是利用貼網址的方法提供使用者可以連過去看,因此我們的爬蟲是間接取得圖片的(實際上我們只能取得連結)。