利用Pytersseract辨識高鐵的驗證碼?
2020/03/31 下午 01:56
Python網路爬蟲討論版
Martin
觀看數:80
回答數:1
收藏數:0
在高鐵的訂票網站中:https://irs.thsrc.com.tw/IMINT/?locale=tw
會需要輸入辨識碼,
但是利用Pytesseract辨識時,似乎無法辨識,
print(code)的時候,沒有輸出
headers = {
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36"
}
response = requests.get('https://irs.thsrc.com.tw/IMINT/captImg/McVxSVuDFh.jpg',headers=headers)
img = Image.open(BytesIO(response.content))
code = pytesseract.image_to_string(img)
print(code)
回答列表
-
2020/04/05 上午 05:42張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,這裡可能要加上一點影像處理的技巧,例如去除干擾線之類的。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃