私の音声入力と格闘した16年の歴史を語る

最近やっとフットスイッチで、Androidの音声入力ができるようになって落ち着きました、そしていつから音声入力を始めたんだろうと思って調べていたところ、2005年からでした。

メールを検索してみたところ、まずは2005年の8月にViaVoiceというソフトウェアを買っています。

当時の音声入力は本当に認識性能が悪くて明らかに手で打った方が早かったのですが、それでも毎日色々レポートを書く仕事をしていましたのでわらにもすがる思いで音声入力ソフトを試していました。

そして、2008年ぐらいから、ドラゴンスピーチやAmiVoiceという少しましなソフトウェアが出始めて、何をしていたかというと、せっせと私の発音の癖を覚えさせてちょっとでも単語認識が違うものについてはもう一度教育をするといったようなわりと地味なことをしていました。

ところがそんなこんなをしてるうちにスマホの音声入力が出回り始めて、2016年ぐらいから明らかにスマホの認識の方が、ドラゴンスピーチその他よりも優秀なので考えたことは何かというと

「何とかしてこのスマホの優秀な音声入力をパソコンに取り込めないか」

ということです。

そして色々探していたら

「リモートマウス」

というソフトウェアをブログで紹介してもらって、同じWiFiにスマホとパソコンを繋げば、スマホの入力をパソコンに取り込むことができるようになりました。

当時はまだiOSの標準のソフトウェアを使っていたのですが、どうも使い勝手が悪いと嘆いていたら、やはり別の方が、ブックマークで

「Simejiであれば、句読点が自動挿入できるからそちらを使ってみたら」

と紹介してもらったので、そこでSimeji乗り換えました。そしてSimejiの方は残念ながらiOSよりもAndroidの方が使い勝手か良かったのでほぼ音声入力目的で私のスマホもそこからiOSからアンドロイド系に変わってくのです。

そうこうしてるうちに一応ウインドウズにも標準の音声入力がつき始めましたし、ワードやGoogleドキュメントで音声入力ができるようになったのでだんだんと音声入力ができる環境が整ってきたのですが、それでもGoogleの音声入力はGoogleドキュメント専用なのと、あとなんといっても句読点が入らないのがボトルネックでした。

そうしたら、今度はGoogleの音声入力をChrome内で汎用的に使える

「ボイスイン」

という拡張機能が開発されて、これも便利に使うことになりました。

そしてなんといっても、今年に入ってのブレークスルーは音声入力のオンオフをフットスイッチで行うようになったことです。最初の頃はウインドウズしかフットスイッチをつなげる手段が思いつかなかったのですが、数日前からやっとAndroidに繋げることが出来たのでAndroidのSimejiでフットスイッチで音声入力をしたものをwindowsに流すという一連の流れがやっと出来ました。

それこそ私が中学生や高校生になるぐらいまではワープロを使えるだけでも特殊技能だったのが、プログラムも当たり前になった上、今ではこんなにスムーズに音声入力で様々なものが文章になっていくなど、本当に夢のような世界です。

お陰様で、私は物書きなので、文章を書くスピードがすごく上がって、思考を邪魔しなくなったのが本当にありがたいです。なんといってもこれまで文章を書いてると頭より先に指が疲れてしまったので。

今、有料で発行してる毎日のサポートメールも音声入力がなかった頃は2000字ぐらいでしたが、今は4000字で、気をつけないと5000字ぐらいになってしまいます。

キーボード入力がボトルネックでなくなった世界というのは少なくとも著述家に対してはものすごいブレークスルーです。きっとこれからの書き物というのもだんだん書き言葉と話し言葉が近づいていくのではないかと思います。