Loading...

Tutorial 1（中間字預測）的 BertModel 作用？ - Cupoy

在程式碼中 load 了 BertModel 以及 BertForMaskedLM 兩個預訓練模型，...

AI共學社群

Tutorial 1（中間字預測）的 BertModel 作用？

2021/03/29 下午 08:20

BERT 的案例應用練習(二) ：「文法與中間詞預測」

夏婕禎

觀看數：56

回答數：2

收藏數：0

在程式碼中 load 了 BertModel 以及 BertForMaskedLM 兩個預訓練模型，但最後預測只使用 BertForMaskedLM 模型，如下圖： ![截圖 2021-03-29 下午8.11.14.png](http://kwassistfile.cupoy.com/000001787DDE5DF3000000136375706F795F72656C656173655155455354/1616666438265/large) 想問那 BertModel 在這裡的作用是？若 BertModel 也可以做中間字預測那該如何知道它預測的答案？ ![截圖 2021-03-29 下午8.18.26.png](http://kwassistfile.cupoy.com/000001787DDE5DF3000000136375706F795F72656C656173655155455354/1616666438266/large) 因我在此將 BertForMaskedLM 的預測結果 predictions 換成 encoded_layers（BertModel 的 output[0]），結果有點詭異。

回答列表

2021/03/30 下午 02:14

Paul

贊同數：0

不贊同數：0

留言數：0

BertModel是Encoder， "Let’s see how we can use BertModel to **encode our inputs in hidden-states**:" Encoder之後可以串自己開發的Decoder/Classifier BertForMaskedLM是Predictor "And how to use BertForMaskedLM to **predict a masked token:**" 請參考：https://huggingface.co/transformers/quickstart.html
2021/03/30 下午 03:23

張維元 (WeiYuan)

贊同數：0

不贊同數：0

留言數：0

嗨，你好
以這個範例來說，BertModel 應該是沒有用到的。

嗨，你好，我是維元，持續在不同的平台發表對 #資料科學、 #網頁開發或 #軟體職涯相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流，都可以追蹤我的粉絲專頁ヽ(●´∀`●)ﾉ