logo
Loading...

使用API串接熱門/非熱門的結果差異 - Cupoy

在計算"熱門/非熱門" 時兩者run出來的數字一直都差不多由於找不出問題,想請老師幫忙解答https...

pycrawler,pycrawler-d05

使用API串接熱門/非熱門的結果差異

2019/11/29 下午 06:40
Python網路爬蟲討論版
金仁冕
觀看數:10
回答數:3
收藏數:1
pycrawler
pycrawler-d05

在計算"熱門/非熱門" 時

兩者run出來的數字一直都差不多

由於找不出問題,想請老師幫忙解答

https://github.com/2010130tim/1st-PyCrawlerMarathon/blob/master/homework/Day005_HW.ipynb

回答列表

  • 2019/11/30 上午 10:24
    Jeffrey
    贊同數:1
    不贊同數:1
    留言數:0

    提供給你參考:

    計算主題熱門度的演算法:

    https://tonytonyjan.net/2012/07/05/building-popularity-algorithm/


    D-Card 有個特性, 36hours , 熱門議題會重算

  • 2019/11/30 下午 03:07
    小糖果
    贊同數:1
    不贊同數:0
    留言數:0

    可能你剛好抓取到的熱門文章和非熱門文章的讚數和留言都不多, 熱門取前30,但可能有些文章的留言數都很少,才會算的結果差不多。

    我執行過你的程式碼,今天再跑一次的話數值就差很多了,熱門文章又重新排列過。

  • 2019/11/30 下午 11:25
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    這應該是剛好的哦,可以試試看抓比較熱門的版試試看XD