Macで writer-app + Soundflower を使った完全自動文字起こしを行う方法
こんにちは、エンジニアの五十川洋平(イソカワヨウヘイ)です。
文字起こし作業に苦労しているライターさんに朗報です。
2018年2月現在、writer.appとSoundflowerを使うことで、
これまで無理だと言われていた自動的な文字起こしが実現可能になりました。
そこでこの記事では、自動文字起こしのやりかたについて解説したいと思います。
writer.appとは?
writer.appは、ポップコーンで開発しているライター・編集者向けの文字起こしWebアプリです。
音声ファイルをアップロードすると、再生速度を変更しながらの音源の再生やPCマイクから音声入力での文字入力ができる機能が備わっています。
詳しい使い方は、こちらの記事を合わせてご覧ください。
【Windows/Mac対応】書き起こし用の音声再生アプリ「writer.app」を作りました
このwriter.appを、次に説明するSoundflowerというアプリケーションと組み合わせることで、自動文字起こしを実現します。
Soundflowerとは?
Soundflowerは、あるアプリケーションから他のアプリケーションへオーディオの受け渡しができる、Macのアプリケーションです。
(厳密にはMacOSのシステム拡張)
細かい説明は省きますが、Soundflowerをインストール・設定することで、Macのスピーカーから出る音をそのままマイクで拾えるように設定できます。
でも、Macbookで音声再生しつつ同時に音声入力もすればいいのでは?と思われるかもしれません。
その辺りMacbookはよくできていて、自分のスピーカーからの音をマイクは拾わないのです。
そこで、このSoundflowerでスピーカー→マイクへのオーディオ設定が必要になります。
Soundflowerのインストールと設定方法
それでは自動文字起こしの前準備として、Soundflowerのインストールを行います。
以下のページの「Soundflower-2.0b2.dmg」リンクからインストーラをダウンロードします。
ダウンロードされたdmgファイルをダブルクリックでインストールしてください。
もしうまくインストールできなければ、インストールがブロックされている場合があるので、
システム環境設定 → セキュリティとプライバシー → 一般タブで、
ブロックされていないか確認し、必要あれば許可をして再度インストールしてください。
文字起こしの手順
文字起こしは次の3ステップで行います。
- システム環境設定からサウンド設定を変更する。
- writer.appの設定を変更する。
- writer.appで音声入力を有効にし、音声を再生する。
まず始めにサウンド設定を変更します。
システム環境設定 → サウンド を開いて 出力タブ、入力タブで 「Soundflower (2ch)」を選択します。
あわせて主音量は最大に設定しておきましょう。
これで、スピーカー→マイクへのオーディオ設定が完了です。
次にChromeブラウザでwriter.appにアクセスし、以下の設定を行います。
- 音声ファイルをアップロード
- 音量設定を 100 に設定
- 再生速度を 0.95x 程度に設定(任意)
※再生速度は、音声入力の感度に応じて後で調整してみてください。
そして、writer.appの音声入力ボタンをクリックして、音声入力をONにします。
最後に音声を再生すると、文字起こしが開始されます。
文字起こし時の注意点
音声データの雑音に注意しましょう
BGMが流れていたり、雑音が多いと音声認識の精度が落ちてしまいます。
あまりに雑音が多く認識されない場合は、audacityなどの加工ソフトで音声のノイズを除去してみましょう。
サウンド設定に注意しましょう
Soundflowerの設定を変更すると、スピーカーから音が流れなくなります。
文字起こし終了後は、サウンド設定の出力・入力設定をもとに戻しておきましょう。
また、音量を最大に設定することになりますので、音量設定にはくれぐれもご注意ください。
音声データをアップロードできない場合
writer.appへのデータアップロードでエラーになってしまう場合は、
データ容量が重すぎる可能性があります。
アップロードするファイルサイズは、上限50MBを目安としてください。
(上記はあくまでも目安です。PCのスペックにより変動します。)
エラーになってしまったら、音声ファイルを分割するか、
iTunesなどの音声プレイヤーをご利用ください。
SoundflowerとGoogleドキュメントとの組み合わせの欠点
ここで少し余談です。
実は以前から、SoundflowerとGoogleドキュメントを組み合わせて自動文字起こしをするというやり方がありました。
(Googleドキュメントにも音声入力機能があります。)
しかし、Googleドキュメントの音声入力は、原因不明で途中で止まってしまったり、Googleドキュメントを開いているブラウザがバックグラウンドになると、音声入力が勝手に止まってしまったりと非常に使いづらいものでした。
一方でwriter.appは、そこをカバーすることができました。
音声入力を一度始めると、止まることなくずっと文字起こしすることが可能で、バックグラウンドになっても音声入力は止まらずに文字起こしを続けます。
さらに、writer.appには再生速度の調整機能があるので、少し早口の会話であっても再生速度を落とすことで音声入力に認識させることができるのです。
さいごに
writer.appとSoundflowerの組み合わせで従来の文字起こし作業の負担を軽減できます。
少しでもお役に立てれば嬉しいです。
またポップコーンではこれからもwriter.appの機能追加を行っていきますので、今後とも応援よろしくお願いします。
【writer.appはこちら】 → https://writer-app.com
【writer.app公式Twitterはこちら】 → @writerapp_com