結局、音声認識の優秀さは日本語の場合、同音異義語の間違いの少なさ尽きると思います。

相変わらず毎日音声入力を使っていますが、なんだかんだいって結局、一番私の音声入力を使う時のシェアが高いのがWindows 11の音声入力になっています。

音声入力のスピードだけで言うと、ピクセルの方がはるかに早いのですが、残念ながらピクセルの音声入力エンジンの唯一最大の難点は、とにかく同音異義語を日本語において間違えることです。

そうするとそのチェック修正の手間隙がかかってしまうので軽く遅れるWindows 11の方がトータルでは早くなってしまいます。

同音異義語に関しては、以前はSimejiがGoogleよりもずっと優秀だと思っていたのですが、Windows 11の同音異義語選択はSimejiの能力を上回る優秀さです。

最近はGoogle日本語入力に変えてしまいましたが、以前、ATOKを愛用していたのも同音異義語の選択が優秀だったからでした。

そして、同じエンジンを使っているとしたら、ひょっとしたらMS-IMEの方が優秀かもしれないので、これはちょっと変える価値があるかもしれないので、こちらも検討してみたいと思います。試してみてよさげだったらまた報告します。

追記

MS-IMEはIMEのオンオフのトグルが、なぜかChromeではできないページが多く、Edgeではできるのですが、Edgeの使い勝手が悪いので、あきらめました。なんだ、あの、謎仕様。