logo
Loading...

關於共現矩陣的問題,window_size的參數是指在這個window_size內的範圍的word_id在矩陣上都+1嗎? - Cupoy

您好: 關於共現矩陣的問題,解答的部份共現矩陣那部份的code不是很清楚,如下圖的第14行...

關於共現矩陣的問題,window_size的參數是指在這個window_size內的範圍的word_id在矩陣上都+1嗎?

2020/12/03 下午 10:47
計數方法詞向量實作介紹
eating
觀看數:41
回答數:3
收藏數:0

您好: 關於共現矩陣的問題,解答的部份共現矩陣那部份的code不是很清楚,如下圖的第14行: ![Screenshot from 2020-12-03 22-35-01.png](http://kwassistfile.cupoy.com/0000017628E563D2000000016375706F795F72656C656173655155455354/1606789766699/large) 我舉個例子: ['我', '今天', '意外地', '很', '好看'],有這個句子,若window_size設為1,今天掃到'我',那共現矩陣應該是 '我' 跟 '今天' 的位置+1而已,以上是我對共現矩陣的理解,但圖上第14行是: => context_ids = sms_ids[max(0, center_i - window_size):center_word_id] 他不是拿到句子的第center_i + window_size個詞 而是直接拿到第center_word_id個詞,以上述的例子,若'我'在字典id是50,那我會看這個句子的'我'的index-window_size一直到第50個詞,這些詞全部都會+1,想確認這樣是正確的嗎? 或是我對共現矩陣的理解有誤 再麻煩您們解答了 感謝!

回答列表

  • 2020/12/06 下午 11:05
    Paul
    贊同數:0
    不贊同數:0
    留言數:0

    沒看過原程式但第14行 center_word_id 似乎應該是 center_i 比較像 window

  • 2020/12/23 下午 06:14
    Jeffrey
    贊同數:0
    不贊同數:0
    留言數:0

    應該還有其他參數設定, 還是提供整段code? 或是可以輸出共現矩陣對照?

  • 2021/01/21 下午 04:32
    黃易辰
    贊同數:0
    不贊同數:0
    留言數:0

    相同疑問+1 是否有誤?