タイトルの通りです。
Gaucheの練習 & 機械学習の勉強として作ってみました。
ナイーブベイズを用いて、ユーザーの直近の発言内容からそのユーザーが「AV女優、一般男性、一般女性、bot」のうちどれに最も近いかを判定します。
このように、AV女優のIDを入れるとかなりの高確率でAV女優であると判定してくれます。
ちなみに、自分は一般女性と判定されました。
現在の問題点としては、教師データが自分の友達とAV女優の2種類(+botが数種類)しかないので、そのいずれにも属さないアカウントはうまく判別することができません。
たとえば橋本環奈のアカウントを入力してみた場合、
全国の橋本環奈ファンの皆さん、申し訳ございません。