Google音声入力の精度が半端じゃない(他の音声入力ソフトとの比較やおすすめのマイクも紹介)

パソコンの音声入力を探して辿り着いたGoogle音声入力。

正直、音声認識の精度が高すぎて驚いています。これだけの認識精度とスピードがあるなら、スマホ世代がタイピングしなくなるのも不思議じゃない。

しかも人工知能の発達に伴ってますます性能がアップするし、スマートスピーカーのように家電にも使われていくので、音声入力がより身近になっていく未来が待っています。

ーーー

さて、このページでは、Google音声入力の使い方、認識精度(動画あり)、メリットとデメリット、音声入力におすすめのマイク、他の音声入力ソフトとの比較などについて書いています。

広告

Google音声入力の使い方

Google音声入力の使い方は簡単。Chrome ブラウザでGoogleドキュメントを開いて音声入力するだけ

アカウントを持っていない場合は準備が必要なこともあるので、順番に説明していきます。

Google Chromeのインストール

Googleドキュメントを使うためにはWebブラウザの「Google Chrome」が必要です。

もしパソコンにGoogle Chromeがインストールされてない場合はChromeブラウザ公式サイトからインストールしてください。

Chromeが入っているかチェック

※インターネットを見る時に以下のアイコンを使っている人は、すでにGoogle Chromeがインストールされているのでこの手順は必要ありません。

Googleアカウントの作成

もしGoogleアカウントをまだ持っていない場合は、アカウントの作成をしてください。すでに持っている場合は必要ありません。

Googleアカウントの作成方法がわからない場合はこちらのGoogle公式ヘルプをどうぞ。

Googleドキュメントを開く

「Chromeブラウザ」と「Googleアカウント」の準備が済んだので、これでGoogle音声入力が使えるようになりました。

まずはGoogle ドキュメントのページにアクセスして、真ん中にある 「Googleドキュメントを使う」ボタンをクリックします。

Googleドキュメントを使う

次に、画面右下の+ボタンをクリック。

Googleドキュメントホーム画面

そしたら「無題のドキュメント」という新規文書が作成されるので、すぐにでも音声入力を始めることができます。

音声入力の実行

音声入力を始めるには、Googleドキュメント上で「ツール」→「音声入力」の順番にクリック。

そしたらマイクが画面上に表示されるので、音声入力のオンオフを切り替えることができます。

ショートカットキー

ちなみに音声入力の切り替えはショートカットキーを使いましょう。

誤変換の修正や、音声入力が途中で認識しなくなった時など、頻繁にオンオフを切り替えることになるので、絶対にショートカットキーを覚えた方が楽です。


Ctrl+Shift+S音声入力ON・OFF

このように、Google音声入力は始めるのが簡単なのが良いところ。

Google音声入力の特徴

実際にGoogleドキュメントの音声入力を使っていて気づいた特徴を紹介していきます。

認識精度やスピードはかなり優秀

iOSやAndroidのスマホ音声入力も認識精度が高いですが、それと同じくらいmGoogleドキュメントの認識精度は非常に高いです。

この記事の下書きで困ることはほとんど無く、キーボードは句読点と改行とカッコしか使わないくらいでも大丈夫です。

「Iphone」「android」「google」など、の英単語の入力に関しては大文字になる箇所がおかしいこともありますが、日本語の文章はかなり精度が高いと思います。

また、長文だと、途中で気を利かせて変換を修正してくれることまであります。

音声入力のリアルタイム性も高く、iPhoneで音声入力している時と同じくらい速い変換速度でした。

ーーー

↓こちらは実際にGoogle音声入力を使っている動画。音声が変換される速さなどがわかります。

マルチプラットフォーム

GoogleドキュメントはChromeブラウザを使うので、Windowsでも、Macでも、クロームブックでも使うことができます。

市販の音声入力ソフトだとWindowsしか使えないのが当たり前のようなものなので、Macやクロームブックを使っている人たちにとっては魅力的かもしれません。

話し言葉なので、自然な文章が書ける

音声で入力することにより、より自然な話し言葉で文章を入力できるというメリットがあります。

また、タイピングに自信がない人は、漢字変換する労力が減るので、文章の内容に集中できます。

ただでさえ一番普及しているローマ字入力は、頭のなかでローマ字を中継して変換するというプロセスが発生するため、文字を直感的に入力できないと常々言われています。

もちろんえげつないほどのタイピングスキルがあれば喋るように入力できるので問題ないでしょうが、ほとんどの人にとっては音声入力のほうが速いはずです。

ショートカットキーを使って一瞬でオンオフを切り替えられる

Ctrl+Shift+Sショートカットキーで音声入力のオンオフをすぐに切り替えられるので、キーボードの句読点入力と併用しやすいと思います。

言葉に詰まって間違えた時はショートカットキーで音声入力をオフにした後、すぐバックスペースキーで文字を消して音声入力を再開するような使い方ができます。

音声入力とキーボード入力を併用できる

音声入力がオンのままキーボード入力を併用できるので、スマホだといちいち「てん」とか言わないと入力できない句読点がキーボードから入力できます。

そもそもGoogleドキュメントの音声入力は、「てん」と発音しても「、」が入力されないので、キーボード入力と併用せざるを得ないですけどね。

パソコン用音声入力ソフトの amivoice だったら、喋るリズムによって自動で句読点まで入力してくれるので、ここらへんが有料と無料の違いなのかなと思います。

Google音声入力の不満点

Google音声入力は、無料の音声入力としては非常に優秀だと思いますが、使ってみて気になった不満点を書いておきます。

句読点や改行は音声入力できない

これがキーボード入力から音声入力に完全に切り替えられない大きな理由になると思いますが、Google音声入力は句読点「、」「。」や改行を音声入力できません。

スマホだと「てん」「まる」「かいぎょう」 のように発音すれば入力できるし、AmiVoiceやドラゴンスピーチなどの音声入力ソフトなら句読点を命令しなくても話すリズムに合わせて自動で挿入してくれるので、より便利になっています。

句読点や改行の自動入力ができるか出来ないかで効率が全然違うので、この点はまだまだ市販のソフトが圧勝してますね。

音声入力ですべてのパソコン操作はできない

現在のところ日本語版では音声による命令で句読点や改行はもちろん、誤変換の修正をすることもできないので、どうしてもキーボードとの併用が必要になってきます。

まぁGoogleドキュメントでは記号も含めてすべての入力を音声でしようとすると逆に難しくなってしまうので、補助としてキーボードを利用するのが一番効率がいいです。

Googleドキュメントの英語版では2016年2月から改行などの命令もできるようになったらしいので、日本語版もそのうち対応されるかもしれません。

途中で音声入力が途切れることがある

Google音声入力で入力し続けていると、見た目は音声入力オンの状態なのに、入力が途切れ途切れになることがありました。

ただしそんなに心配する必要はなく、この不具合は、ショートカットキーで音声入力をオフ→オンすると元に戻ります。

ショートカットキーのCtrl+Shift+Sは左手だけですぐに操作できる場所なので常にスタンバイしておきましょう。

↓実際に途中から認識が途切れていると思われる動画がこちら。録音開始から1分15秒経過したところから音声認識が途切れ途切れになります。(動画の再生は途切れ始めたところから始まります)

自分が音声入力している限りでも、1分くらいで途切れることが多いので、元々そういう仕様なのかもしれません。

Google ドキュメント上でしか音声入力できない

Google音声入力はGoogleドキュメント上でしか使えないので、自分のお気に入りのテキストエディタなどで音声入力することはできません。

メモ帳やブログエディターでもGoogle音声入力が使えたら物凄く便利だったんですけどね。

すべてのアプリケーションで直接音声入力したい場合は、AmiVoice などの音声入力ソフトが必要になります。

音声の辞書登録はない

Google音声入力に辞書登録(単語登録)は無いので、独自の言い回しやイントネーションを覚えさせて精度を極限まで高めていくことはできません。

ただしGoogle音声入力は元々の認識精度がかなり高いので、ブログの下書き程度であれば辞書登録が無くても問題ないと思います。

後で修正が必要な部分は出てくるでしょうけど、文章の意味がわからなくなるほど誤認識することはほとんどないので、後からキーボードで修正するような使い方になると思います。

自分専用に辞書を強化したい人は市販の音声入力ソフトのほうが良いですが、学習させるのがめんどくさいと思っている人にとっては、むしろ Googleが勝手に賢くなっていくのでありがたいとも言えます。

タイピングが衰える

正直、認識精度が高いのでタイピングで文章を入力する必要がほとんどありません。せいぜいタイピングするのは音声入力した後の修正ぐらいです。

タイピングが速いと何かと便利ですが、これだけ音声入力が発達するとタイピングが速いことによるメリットが少なくなっていくのかもしれません。

ただし会議室や図書館など、声を出しにくい場所では未だにタイピングできた方が便利ですけどね。

スマホにはGoogle音声入力がない

スマホ版のGoogleドキュメントの中には音声入力の機能はありませんでした。

とは言っても、iPhoneもAndroidも、最初から精度の高い音声入力が使えるのであんまり影響は無いですけどね。

Google音声入力の活用

ここで一旦Google音声入力について整理すると、以下のような特徴を持っています。

Google音声入力の特徴
  • 音声認識の精度はかなり高い
  • マルチプラットフォーム(Windows・Mac・Chromebook)
  • Googleドキュメント上でしか使えない
  • パソコン操作全般には使えない(文章入力のみ)
  • キーボード入力と併用できる
  • 句読点・改行・記号は音声入力できない
  • 途中で音声入力が途切れることがある(約1分)
  • 辞書登録はできない

これらの特徴から、文字の入力でGoogle音声入力を使った場合の向き不向きについて書いてみました。

テープ起こし

漢字変換の精度はメモ用途なら支障がないですが、誤字脱字が許されないテープ起こしにGoogle音声入力は不十分だと思います。

また、認識精度だけじゃなく、表記揺れの修正や、句読点や改行を後からキーボード入力しないといけないので、仕事として使う場合はかなり効率が落ちます。

ただ、会社で会議の簡単な議事録を起こすなど、単発の頼まれごとくらいならGoogle音声入力でも十分でしょう。

仕事として継続して依頼されるテープ起こしなら、AmiVoiceなどの市販のソフトを使ったほうが良いでしょう。このページの後半でも少し紹介しています。

ブログの下書き

これは実際に自分でも使いましたが、ブログの下書きならGoogle音声入力でも十分に役に立ちます。

下書きなので多少の誤字脱字があってもいいし、何より筆が進まない時にとりあえず書き始めることができるのが良い点です。

頭の中で長文が出来上がってから音声入力するよりも、短い文や箇条書きでどんどん喋っていくといいように思います。

---

ただし、ブログの下書きならスマホの音声入力のほうがネタが出てきた時に気軽に始められるので、パソコンにこだわらないほうが良い場合もあります。

メール作成

メールでのメッセージは「お世話になります」などの話し言葉が多いので、音声入力と相性が良い場合もあります。

ブログや論文のように不特定多数に見せるような書類ではなく、誰かに送る手紙のような文章だと、音声入力しやすいこともあるかもしれません。

と言ってもなかなかメールで音声入力を使うのは定着してなさそうですけどね。

音声入力に使うマイク

調べてみると、音声入力に使うマイクは特別高性能なマイクじゃなくても大丈夫ですが、「口元との距離」「指向性」を吟味すると、コスパの良いマイクを見つけることができます。

音声入力におすすめのマイク

安価に音声入力に最適なマイクが欲しいなら、これがおすすめです。

音声入力では、マイクの性能差よりも、口元との距離が近いことがとても重要なので、アームが長くてフレキシブルなスタンドマイクなら、下に何か置いて嵩上げしてから、横方向にアームを伸ばして口元との距離を調整すればOK。

それと、このマイクは単一指向性でもあるので周囲の雑音が入りにくく、なおさら音声入力向きとも言えます。

↓実際、このマイクのテスト動画を聴くと、十分な音質だしノイズは少ないし、音声入力するなら非常に相性が良いということがわかります。

ピンマイク

もしちょっと動き回る場合はピンマイクという選択肢もあります。

ただし、ピンマイクは探してもUSB接続のものがなく、ステレオミニプラグ接続ばかりなので、ノイズが認識精度に影響しないかちょっと心配になります。

そして、ピンマイクはほとんどのものが全指向性なので、周りがうるさい場合は認識精度に影響が出る可能性が高く、どうしてもピンマイクじゃないといけない理由がなければ他のマイクのほうが良さそうです。

静かな室内で、口元からの距離が近いならたぶん大丈夫でしょう。

「ピンマイク」で検索

ノートPCで外出先で音声入力するなら

外出先でマイクを使いたい場合、こういう形のマイクを使うのも一つの方法です。

ノートパソコンの内蔵マイクよりは、マイク性能も口元からの距離も多少はマシになるので、精度向上が期待できます。

ただしマイク全長がそんなに長くなく、全指向性だと周りの雑音も拾いやすいので、もうちょっと口元との距離を近くしたければ、フレキシブルタイプのUSB延長ケーブルを使ったり、

L字型USBアダプタを使うのもありかもしれません。

ただ、ここらへんのアダプタ類は、あまり聞いたこと無いメーカーの互換品ばかりなので、レビューなどをよく見て自己責任でお願いします。

ーーー

ちなみに口元との距離がどのくらい影響するのか、自分のMacBook Proの内蔵マイクでGoogle音声入力すると、マイク部分にわざわざ口元を近づけて喋るとそこそこ認識精度が高いですが、普通に座っている位置(口元とマイクの距離50cm)で喋ると著しく認識精度が落ちます。

なので、外出先でノートPCで音声入力したいなら上記のような口元との距離を近づける工夫が必要かな、と思います。ノートパソコンの内蔵マイクによっても性能が違うかもしれないので、まずは試してみてください。

ヘッドセットマイク

Skype通話する機会もありそうならヘッドセットマイクも選択肢としてあります。口元とマイクの距離が近くなるので、認識精度は安心感があるんじゃないかと思います。

長時間つけると耳の締め付けが痛くなるかもしれないので気をつけてください。

「ヘッドセットマイク」で検索

アーム式マイクスタンド

音声入力の認識精度はマイクと口元との距離を近くすることが重要なので、自宅でもっと本格的な設備にするなら、いっそのことアーム式のマイクスタンドを使うという方法もあります。

マイクスタンドはこういう骨組みのものや、

もしくはフレキシブルタイプのマイクスタンドがあります。

これらのマイクスタンドを机に固定して、

↓マイクスタンドにマイクを付けて、

というふうにすれば、口元との距離を自由に調節できるし、良いマイクを選び放題だし、机の上もスッキリします。

仕事で本格的に音声入力するなら、こういう設備を整えておくと快適になると思いますよ。

あと、口元に近づけた時にツバの飛散や鼻息の音を拾うのが気になるならポップガードを。

他の音声入力ソフトと比較

Google音声入力以外の音声入力ソフトについても使ってみたり動画を見たりして比較したので少し書いておきます。

Windows音声認識

Windowsに標準で搭載されている音声認識がありますが、認識精度がすごく低くて最初の設定も時間がかかるし使い物になりません。

Windows 7ではスタートメニューの中に「アクセサリ」→「コンピューターの簡単操作」→「Windows音声認識」という場所にあるので、興味がある人は使ってみてください。

AmiVoice

市販ソフトの AmiVoice (アミボイス)は、さすがに専用の音声入力ソフトだけあって、Google音声入力よりも認識精度・スピードともにかなり良くなります。

まずは音声入力がどんなものかGoogle音声入力を使ってみて、仕事で使えそうならAmiVoiceも検討する、という流れが良いんじゃないでしょうか。

AmiVoiceは、「句読点の自動入力」「Wordやテキストエディタなどに直接入力できる」「単語登録」など、Google音声入力ではできない様々な機能が揃っているので、本格的に音声入力するなら導入する価値ありです。

エムシーツー 音声認識ソフト AmiVoice SP2 USBマイク付
エムシーツー
エムシーツー

※ちなみにAmiVoiceのAmazonレビューは低く見えますが、星1個のレビューには会議やテレビの音声ファイルをそのまま認識させようとしてダメだったものが多く、そもそも間違った使い方をしています。

音声認識ソフト【AmiVoice SP2】公式サイトによると、音声ファイルからの文字化について「複数人数の会議、講演会、およびインタビューなどで、マイクの距離が遠い場合、認識することができません。」「口元とマイクの距離が5cm以内で録音した音声で、かつ、はっきりとした音声であることが条件です。」と書かれています。

これはAmiVoiceに限った欠点ではなく、録音環境の悪さが原因です。議事録の作成がしたい方はドラゴンスピーチなど他のソフトを使っても同じ結果になってしまうので気をつけてください。

現在のところ、市販のソフトであっても、発話者からマイクの距離が遠い会議などの音声を高精度に認識してくれるものはありません。

ドラゴンスピーチ

AmiVoiceとよく比較される音声ソフトに「ドラゴンスピーチ」というものがあります。

認識精度はAmiVoiceと良い勝負となっていて、細かい使い勝手に違いがあるので、人によってどちらが向いているのか変わってくる、とよく言われます。

↓変換している様子がわかる動画はこちら。認識精度は十分ですが、文字が表示される速度はドラゴンスピーチのほうが遅め。

ちなみに初期設定では句読点の入力が自動入力にはなっておらず、上記動画では「てん」などを発音していますが、設定を変更することで自動入力することもできます。

ーーー

ドラゴンスピーチの通常版は値段が高く、Excelのフルコントロールや音声コマンドの追加など、かなり使い込む人じゃないと使い切れないので、

ニュアンスコミュニケーションズ

↓ほとんどの人にとってはLite版で十分です。

ニュアンスコミュニケーションズ

※ちなみになぜかダウンロード版のほうがかなり値段が安いです。

あと、非常に気をつけないといけない点として、ドラゴンスピーチはWindows 10での利用は自己責任で、ということになっていて、サポートも対象外になっています。

一応公式ページにてWindows 10の動作確認を細かくしていて、全ての項目で「◯」になっていますが、不具合が起きても自己責任ということを覚悟して買う必要があるので気をつけてください。

AmiVoiceとドラゴンスピーチの比較

それぞれに強みがあるので、人によってどちらが良いのか違ってきます。

認識精度

上記の動画を見ればわかる通り、AmiVoice・ドラゴンスピーチ、どちらも十分な認識精度です。ソフトの性能よりも、マイクのセッティングのほうが認識精度に影響するので、レビューを鵜呑みにしないようにしましょう。

ちなみにドラゴンスピーチのほうが搭載辞書100万語、AmiVoice SP2が20万語で、一見してドラゴンスピーチのほうがかなり精度が高いんじゃないかと思うかもしれませんが、実際の認識精度は甲乙つけがたいので、辞書の搭載数で精度は決めきれません。

あと、認識精度はGoogle音声入力も非常に良いので、お金を出せば認識精度が高くなるわけではありません。

有料ソフトのメリットは自分に合わせて音声辞書を学習させられることなので、使い込む人ほど相性が良いはずです。逆に、たまに使う程度ならGoogle音声入力のほうがコスパは良いでしょう。

動作の軽さ

AmiVoiceは動作がかなり軽く、リアルタイムに文字に変換してくれる様子を味わえます。それと比べるとドラゴンスピーチは文章を読み切ってから一気に文字を表示されるので、画面を見ながら音声入力すると少し違和感を感じます。それ以外のソフト自体の動作も全体的にAmiVoiceのほうが軽快。これは動画を比較することで、どちらがいいのか判断できると思います。

エディターの使いやすさ

AmiVoiceは(例えば上記の動画では)Wordなどのアプリケーションに直接入力することができるので、(動作の軽さも手伝って)直感的で使いやすく感じます。ドラゴンスピーチはパソコンのスペックを要求されて動作が重いのが欠点。

音声での命令(音声コマンド)

ドラゴンスピーチは音声での命令(音声コマンド)が豊富で、文字の修正などがほとんど音声で命令できます。動作の重さと引き換えに多機能になっているようなものなので、こういう機能が必要でなければAmiVoiceのほうが軽いのでいいだろうし、どうしても必要ならドラゴンスピーチを選びます。

ーーー

結局どっちを選べば良いのか、大きな違いから判断すると、音声コマンドで文字の修正もしたいならドラゴンスピーチ。それが必要なくて(キーボード併用でも構わなくて)動作が軽くて音声入力に特化したいならAmiVoiceを選べば良いんじゃないかと思います。

まとめ

話はGoogle音声入力に戻ります。Google音声入力は不満な点や市販ソフトに比べて劣る点もありますが、無料でここまでできるというのはすごいこと、ということがわかります。

なので、まずは無料というメリットを活かして、音声入力というものが役に立つのかどうか、Google音声入力から試してみて、さらに活用したいなら市販の音声入力を検討してみてください。

ーーー

その他、入力作業で重要なタイピングについても書いてるのでこちらもどうぞ。

関連:タイピングソフトおすすめ10選

関連:タイピングの練習におすすめの無料ゲームとフリーソフトまとめ

関連:英語タイピング練習サイトまとめ

広告

このページのシェア・保存はこちら

広告

著者のフォローはこちら

名前:
Twitter
YouTube

ーーー

プロフィール
問い合わせフォーム
当サイトご利用時の注意事項

邪魔なサイトを除外する検索エンジンを運営しています。⇒ノイズレスサーチ

『Google音声入力の精度が半端じゃない(他の音声入力ソフトとの比較やおすすめのマイクも紹介)』へのコメント

  1. 名前:匿名 投稿日:2017/01/29(日) 15:10:05 ID:5f5501fa0 返信

    初めまして。興味深く記事を読ませていただきました。また早速音声入力を使ってみたところ非常に変換効率が高く驚いております。
    ひとつ疑問に思ったのが、誤変換されたときに辞書登録して次からの変換を間違えなように出来ないかな、と思ったのですが、うまくできません。
    google日本語入力の辞書に登録しても認識していないようです。
    すべてオンラインで処理しているのですね。
    これも無料版ですので仕方ない??
    もったいないですね。

    • 名前:パソ活 投稿日:2017/01/29(日) 16:36:12 ID:7579217b6 返信

      自分も音声を辞書登録できたら便利だなと思いますが、調べた限りでは音声の登録はできないようです。

      google日本語入力の辞書に登録しても認識していないようです。

      そういえば試したことが無かったですね。

      できない理由として考えられるのが、Google日本語入力の辞書登録は音声の登録ではなくて、どの文字をどの文字に変換するかという登録なので、別物なんじゃないでしょうか。

      今のところ、音声の辞書登録をしたい場合はAmiVoiceなどの市販ソフトを使うのがスタンダードかなと思います。

      「試しにやってみる」という程度であればGoogle音声入力で十分だと思いますが、仕事で使うようなら市販ソフトを検討しても良いんじゃないでしょうか。

      たぶん仕組み的には音声の情報をGoogleアカウントに保存して、音声の辞書登録も可能なんでしょうが、世の中全体に占める音声入力ユーザーの数は少なく、市販ソフトの値段もそんなに安くないのでコストがそれなりにかかるのかなと。

      Googleだとフリーミアムでやってしまう可能性もあるかもしれませんが。

  2. […] [ パソコンの音声入力 ] Google音声入力の精度・使いやすさが半端じゃない […]

  3. […] 具体的な使い方などはこちらのサイトを参考にしてみて下さい。 […]

  4. 名前:藤吉英徳 投稿日:2017/06/12(月) 12:51:53 ID:d97f78c3a 返信

    早く音声入力を使いたい。

  5. 名前:音声入力を使ってみた | Dr.朝比奈の神通力な日々 投稿日:2017/08/08(火) 04:19:47 ID:b3a1c08a9 返信

    […] ろ、 音声入力でやったらどうかとひらめきました。 出入りの業者に聞いてみた結果 Google の音声入力がかなりいいということがわかりました。 (出典:https://play.google.com/store/apps/details?i […]

コメント(本文のみでOK。URL含むコメントは承認待ちになります)

メールアドレスが公開されることはありません。