TOP > Google > title - Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ

ITやモバイル機器、iPhone、手帳や本など。
MENU

Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ

2018021500.png


情報管理LOGの@yoshinonです。
ここ最近は、「自動化」「音声入力」といったキーワードが、賑わっていますね。情報管理LOGでも、かなりこれについては激推ししています。さて今回は、文字起こしの自動化についてやってみたいと思います。文字起こしの自動化については、Macが先行していてWindowsの情報があまり見られなかったので、今回はWindowsについて深く掘り下げてみたいと思います。文字起こしの自動化が出来るようになると、議事録の作成などがほぼ自動化できるので、今まで苦痛だった仕事がとても楽になりますよ。

  
【 Windowsでも自動文字起こしができる!議事録はGoogleドキュメントに任せろ 】  

 1.Macでの自動文字起こしの事例

 2.物理的な解決方法

 3.Visual Audio Cableで音声の出力と入力をソフトウェア的につなぐ

 4.Googleドキュメントで自動文字起こしを実現する







checkmark.png 1.Macでの自動文字起こしの事例

ここ最近の自動文字起こし界隈(?)では、Mac勢がかなり優勢で盛り上がりを見せています。ここ最近の記事をいくつかご紹介します。

「神なの?」文字起こしが自動になる未来がやってきたとライター界隈が騒然 | 男子ハック
「神なの?」文字起こしが自動になる未来がやってきたとライター界隈が騒然 | 男子ハック


SoundFlowerとGoogle Docsで自動文字起こし機 - walkingmask’s development log
SoundFlowerとGoogle Docsで自動文字起こし機 - walkingmask’s development log


21世紀の文字起こし - the code to rock
21世紀の文字起こし - the code to rock





なるほど、こりゃすごい。




SoundFlowerって何だ??と思ったら、どうやら音声の出力と入力をソフトウェア的に接続できるMac用ソフトのようです。

Soundflower for Mac - ダウンロード
Soundflower for Mac - ダウンロード




これを、Googleドキュメントの音声入力で認識させて、自動で文字起こしを実現するという流れのようです。

でもこれ、どれもMacの情報なんだよな…。


というわけで、Windowsユーザーの皆さん!
Windowsでもやれるってことを証明しようじゃありませんか!




checkmark.png 2.物理的な解決方法

やり方は、2つあります。
1つ目は、泥臭い方法です。物理的に出力と入力をケーブルでつないでしまう方法です。この図は、Macの先ほど取り上げたSoundFlowerによる解説画像ですが、やることは同じです。




イヤフォンの端子とマイク端子を物理的につなげば、できるのではないか?
というわけです。
議事録ならば、ICレコーダーなどで録音していたりするので、それをPCのマイク端子につなげば、理論上は上手くいきそうですよね。



checkmark.png 3.Visual Audio Cableで音声の出力と入力をソフトウェア的につなぐ

とはいえ、自動化上等!と思っている身としては、そういう泥臭いやり方はあまり好きではありません。MacにおけるSoundFlowerのようなソフトウェア的な解決方法で実現したいと思います。

ちなみに、Windowsにはこの手のソフトは、案外たくさんあるんですよね。
むしろ、Macより多いような気がします。

今回紹介するのは、「Visual Audio Cable」というソフトです。
これは、まさにソフトウェア的に音声の出力と入力をつなぐことができるソフトなのです。まあ、これを使えば、色々ごにょごにょもできるのですが…今回は、文字起こしの自動化なので、皆さんも色々このソフトの可能性を試してもらいたいと思います。

まずは、ここからダウンロードします。

VB-Audio Virtual Apps
VB-Audio Virtual Apps




ここからダウンロードしましょう。

2018021501.png



ダウンロードしたzipを解凍します。
お使いのPCが、64ビットならば「VBCABLE_Setup_x64.exe」を、そうでなければ「VBCABLE_Setup_x64.exe」を管理者権限で実行しましょう。

2018021502.png



「Install Driver」をクリック。

2018021503.png



迷わずOK。

2018021504.png



インストールします。

2018021505.png



はい!できました。

2018021506.png



インストールが完了したら、次に音声の出力と入力をつなぐ作業をします。
タスクバーのボリュームアイコンを右クリックし、「再生デバイス」をクリック。

2018021507.png



その一覧の中に「CABLE Input」というのが、あるでしょうか?

2018021508.png



CABLE Inputを右クリックして、「規定の通信デバイスとして設定」します。

2018021509.png



次に「録音」タブをクリックします。

2018021510.png



これも、同様に「CABLE Output」を「規定の通信デバイスとして設定」します。

2018021511.png



これで、ソフトウェア的に出力と入力をケーブルでつないだことになりました。




checkmark.png 4.Googleドキュメントで自動文字起こしを実現する

では、Googleドキュメントで自動文字起こしをやっていきます。
すでに様々のところで話題に上がっているので知ってる方も多いと思いますが、Googleドキュメントでは音声入力ができるのです。
なぜGoogleドキュメントで文字起こしをするのかというと、iPhoneでは60秒制限があるからです。アプリによっては60秒を超えて音声認識ができますが、それでも1時間以上にわたる文字起こしには向いてはいません。その点、Googleドキュメントだと音声入力を時間制限なしでできるのです。議事録だと、どうしても長時間にわたった録音になってしまうので、Googleドキュメントの方が向いているのです。

では、やってみましょう。

さすがに、仕事上の議事録をこの場で見せるわけにはいかないので、YouTubeの動画を使ってやってみます。
使うのは、この動画です。
佐々木正悟氏による「のきばトーク」という面白い対談動画です。




この動画とGoogleドキュメントを横に並べておきます。今回は、説明画像なので動画もGoogleドキュメントも小さめですが、実際は画面の半分半分ぐらいで良いですね。ちなみに、音声の鳴るものであったら、VLC PlayerでもGOM PlayerでもWMPでもなんでもいけます。

2018021512.png



Googleドキュメントでは、

ツール→音声入力

で音声入力ができるようになります。

2018021513.png



まずは動画を再生して、すぐさまGoogleドキュメントのマイクのアイコンをクリックします。そうすると、すぐさま音声入力が始まります。こんな感じで、どんどん音声入力されていきます。まあところどころ誤字などもありますが、おおむね合ってますよね。

20180215014.gif



ここまでできるならば、もはや文字起こしという作業はほとんど簡略化できるのではないか?と思えますね。さらに、こういうソフトを組み合わせると、かなりの部分が、さらに自動化できるのでは無いかと思いますよ。



このソフトは、誤字・脱字や表記ゆれなどを自動で校正作業してくれるのです。
人間は、最後のチェックのみでよくなりますね。




 eyeglass2.png 情報管理LOGの眼
 退屈な作業をさらば!

私は、文字起こしという作業はかなり苦痛です。しかし、どうしてもやらなくてはいけない時というのもあるので、しかたがなくやっていましたが、これでほぼ自動化できそうな見通しが立ってきました。

それと、今回やってみて、これは耳が不自由な方にも有効なツールだと思いました。テレビなどをこれで流しておいて、自動で字幕が生成されるみたいな使い方としてできそうですよね?

少なくとも未来は、少しずつ良くなってきています。




関連記事

Zenback読み込み中です。

Leave a reply






管理者にだけ表示を許可する

該当の記事は見つかりませんでした。
SEO
loading
情報管理LOG