BBD

「昨日の自分に教えたいこと」をテーマに書き散らしてます

執筆に「音声入力」を何種類か使ってみたので所感をメモする

f:id:rough-maker-an9:20190222092216j:plain

ここ最近は仕事でもブログの執筆でも、基本的に音声入力を使うようになりました。一口に音声入力といってもAppleやGoogle、Simejiと、喋ったことを文字にするための音声入力ソフトはいくつかあります。

とりあえず、自分の環境で使える音声入力ソフトを試してみて、使い勝手を比較してみたのでメモを残しておきます。

Mac単体でApple音声入力/Google音声入力

まず一番最初に使ったのが、私のメインの執筆環境であるMac上で使える音声入力でした。具体的には、Macに標準搭載されているAppleの音声入力と、Googleドキュメントで使えるGoogle音声入力です。

音声入力を使っている人ならご存知だと思いますが、基本的に音声入力の変換精度はGoogle音声入力の方が上。しかしGoogle音声入力はAndroidスマホやタブレットを除けば、原則としてGoogleドキュメント上でしか使えません。

Googleドキュメント上では、音声入力とキーボード入力を併用することができるんですが、喋っている途中に句読点などを入れようとすると、その時点で音声入力が止まってしまうのがネックでした。キーボード入力と音声入力が競合しないように、キーボード入力をしてから一定時間は音声入力を受け付けなくなる仕様みたい?

一方のAppleの音声入力なら、変換精度は低いものの、あらゆる場所で利用することができます。「てん」「まる」と喋って、句読点を入れてくれるのもAppleの音声入力のメリットですね。こちらはキーボードとの併用ができませんが、そのぶん割り切って音声入力だけに集中できたりもします。

どちらも一長一短という感じでして、Appleの音声入力は変換精度が低いし、Google音声入力は使う場所が限られてしまってちょくちょく止まってしまうのがストレス。何かいい方法はないかなと考えたところ、Macを2台並べてGoogle音声入力を使ってみることを思いつきました。

Mac+MacでGoogle音声入力

2台のMacで同じGoogleドキュメントを開き、片方のMacで音声入力を担当し、もう片方のMacでキーボードを使った編集を担当。そうすれば、音声入力が受け付けなくなるタイミングが最小限になり、音声入力とキーボード入力を併用しやすくなるんじゃないかと考えたわけです。

しばらくこの体制でやってみようかと考えたんですが、やっぱりパソコンを2台並べて作業するのはちょっと面倒くさい。しばらく無言が続いて音声入力の受付がストップしてしまった時には、手を伸ばしてまた音声入力を起動するショートカットキーを押さないといけません。

最大のネックは、入力カーソルをいちいち移動するのが手間だったことです。キーボード入力専用のMacでは入力カーソルが次の段落に行っているのに、音声入力専用のMacではそのひとつ前の段落でカーソルが止まっているという状況がよく発生します。

つまりMac二つぶんのトラックパッドを一度に操作する必要が出てきたわけです。それを苦にしない人なら便利に使えるのかもしれませんが、私の場合は却下となりました。

Mac+iPhoneでSimeji音声入力ほか

次に試したのが、MacとiPhoneで同じGoogleドキュメントやテキストファイルを立ち上げて、iPhoneで音声入力を担当し、Macでキーボード入力を担当する方法です。iPhoneで音声入力を入れながら、Macで句読点を入れつつ編集できるできるので、これがベストかなと思ったんですね。

しかし、iPhone向けの音声入力ソフトって、どうも安定しないものばかり。Appleの音声入力は変換精度が低いので実用的でないし、Google音声入力は受付時間が短すぎて文章の入力に向かない。

Simejiの音声入力がなかなかの精度と聞いて試してみたものの、私の環境と相性が悪いのか、入力直後に文章全体が消えてしまうというトラブルが何度か発生しました。せっかく喋った内容がアンドゥされてしまう不具合みたいな。

Android向けのGoogle音声入力は受付時間が長く変換精度も高いようなので、Androidスマホかタブレットを音声入力のために購入しようか検討中です。

結局はMac単体でGoogle音声入力に着地

Androidを購入するまでは、結局Mac単体でGoogle音声入力を行う方法をとることに。Googleドキュメント開いて、音声入力の受付停止を回避しながら執筆する方法ですね。

とりあえず音声入力をひたすら続けている分には不具合はなく、キーボードで句読点などを入れた直後に受付がストップしてしまうことが分かってきたので、多少気持ち悪いところではありますが、句読点や改行を気にせずババっと長文を入力することにしています。

最後の最後で、誤変換や句読点を入れて、体裁を整えることに。音声入力を考えている方は、ぜひ参考にしてみてください。