下載圖片網址問題
2019/12/23 下午 05:10
Python網路爬蟲討論版
Emma
觀看數:3
回答數:2
收藏數:1
如下我的程式碼
我用 imageurl=tag.string 直接取得的網址type是bs4.element.NavigableString 請問是甚麼資料型態? 我用這樣直接送出請求下載圖片會有以下erron,貌似在img=Image.open(r.raw)出錯,表示這是網站網址不是圖片網址,所以找不到圖片嗎?
還有ptt上的資料說
i.imgur.com/Cgb5oo1.jpg
是圖片
是網站
若從資料上只得到imgur.com/Cgb5oo1 這個網站網址,如何知道圖片網址?這個規則適用每個網站嗎?
回答列表
-
2019/12/24 上午 11:46張維元 (WeiYuan)贊同數:2不贊同數:0留言數:1
嗨,如果是 imgur 取出的網址,他的圖片網址規則是直接在網址後面加上 .jpg 或 .png 都可以
-
2019/12/27 下午 05:20張維元 (WeiYuan)贊同數:2不贊同數:0留言數:0
「所以根據不同網站不同規則要再觀察囉?!」
=> 正常來說你要存取圖片的話,應該是要用 <img> 標籤中的 src 屬性,這個才是真正的圖片網址。但這個例子中,批踢踢的用法其實是利用貼網址的方法提供使用者可以連過去看,因此我們的爬蟲是間接取得圖片的(實際上我們只能取得連結)。