logo
Loading...

在jieba斷詞中新建英文辭典,但英文單字會被斷開 - Cupoy

我的文本主要是中文,並使用 jieba.load_userdict() 載入一個單字一行的自建辭典,...

在jieba斷詞中新建英文辭典,但英文單字會被斷開

2022/12/23 上午 11:46
Jieba 中文斷詞工具介紹及應用
魏敬玲
觀看數:9
回答數:1
收藏數:0

我的文本主要是中文, 並使用 jieba.load_userdict() 載入一個單字一行的自建辭典, 其中只要像是 APP STORE 這種英文單字組合的詞,都會被斷開,如 APP / STORE, 請問要怎麼建立辭典,才能完整辨識出 / APP STORE /

回答列表

  • 2023/01/12 下午 01:05
    王健安
    贊同數:0
    不贊同數:0
    留言數:0

    魏敬玲 您好, 因為 jieba 規定自定義辭典的格式剛好就是用空白隔開以抓取不同資訊, 因此建議您可在斷詞之前就先將 APP STORE 轉換成同一個字, 例如:「APP STORE」變成「APP_STORE」, 這樣就可放入自定義辭典中了。