logo
Loading...

如何檢查網址的正確性 re.compile('.*')意思 params=payload的意思 - Cupoy

1. 想問一下,我有先觀察網址的規律(如註解地方),可是我想知道code跑得對不對,所以想print...

如何檢查網址的正確性 re.compile('.*')意思 params=payload的意思

2019/12/13 04:17 AM
Python網路爬蟲論壇
cham chen
觀看數:0
回答數:5
收藏數:4

1. 想問一下,我有先觀察網址的規律(如註解地方),可是我想知道code跑得對不對,所以想print看看網址,可是會有error,想問如何解? 或是說 可以問一下 params=payload 的用意?


2. 想問 hw中 re.compile('.*') 語法上是什麼用意?


3.  lxml ? html5lib ? 差別在哪? 之前都是用 html5lib


4. 想問說大家會如何去爬蟲資料,我的方式是會print 出 soup 內文,並 一 一 對應去找我要的內容。但這樣相對很慢,而且資料量若很大,就會很難去找 (使用jupyter note,好像無法對output進行搜尋,如下圖,我想找"筆") 

 所以好奇有沒有一些tip或是一些經驗可以分享? 謝謝各位,耐心看完,不好意思 問這麼多