使用API串接熱門/非熱門的結果差異
2019/11/29 下午 06:40
Python網路爬蟲討論版
金仁冕
觀看數:10
回答數:3
收藏數:1
pycrawler
pycrawler-d05
在計算"熱門/非熱門" 時
兩者run出來的數字一直都差不多
由於找不出問題,想請老師幫忙解答
https://github.com/2010130tim/1st-PyCrawlerMarathon/blob/master/homework/Day005_HW.ipynb
回答列表
-
2019/11/30 上午 10:24Jeffrey贊同數:1不贊同數:1留言數:0
提供給你參考:
計算主題熱門度的演算法:
https://tonytonyjan.net/2012/07/05/building-popularity-algorithm/
D-Card 有個特性, 36hours , 熱門議題會重算
-
2019/11/30 下午 03:07小糖果贊同數:1不贊同數:0留言數:0
可能你剛好抓取到的熱門文章和非熱門文章的讚數和留言都不多, 熱門取前30,但可能有些文章的留言數都很少,才會算的結果差不多。
我執行過你的程式碼,今天再跑一次的話數值就差很多了,熱門文章又重新排列過。
-
2019/11/30 下午 11:25張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
這應該是剛好的哦,可以試試看抓比較熱門的版試試看XD