fastText

2022/04/25

AI

fastTextとは

fastTextではWord2Vecで考慮されていないsubwordを導入する。

Word2Vecでは単語を1つのベクトルで表現していたが、fastTextでは単語をその単語とsubword(単語のn-gram)のベクトルの和で表現する。

例として、"where"という単語のsubwordを次に示す。なお、<>は単語の始端と終端を表す。

Notion Image

"where"という単語のベクトルは上記のsubwordのベクトルの和で表現される。

fastTextはsubwordを使用しているため、活用系など部分的に共通している単語同士を近いベクトルに変換でき、トレーニングデータ中に存在しない単語についてもベクトル化できるという特徴を持つ。


著者画像

ゆうき

2018/04からITエンジニアとして活動、2021/11から独立。主な使用言語はPython, TypeScript, SAS, etc.