Google翻訳を使って、今の自動音声認識がどのくらいの精度なのかを検証するとともに、自らの発音チェックにどのくらい信頼度が置けるのかをチェックしてみました。
自動音声認識
主要な自動音声認識API
◆Google(google翻訳, OK検索など)
◆Apple(Siriなど)
◆Amazon(アレクサなど)
検証内容
◆単語単位でも聞き取ってもらえる?
◆文章でも大丈夫?
◆リンキングを絡めても大丈夫?
◆省略も聞き取れるか?
単語
work, walk, woke
right, light, write
word, ward, world
Literal, Literally, Literacy
フレーズ
I walk to work. I’m working on walking.
Turn right at the first light.
I’ll be arriving within an hour.
I’m going to grab some coffee.
検証結果
◆単語単位でも聞き取ってもらえる?
過去形や機能語など、それだけでは意味不明な単語の検知は難しい。
◆文章でも大丈夫?リンキング?省略?
実際に使われているフレーズであれば
ほぼ100%聞き取ってもらえる。
検証結果のまとめ
Google音声認識APIは
発音が通じる通じないの目安にして
大丈夫な精度(95%)である。
ただし意味が通じるものに限る。
Leave a Reply