文字起こし実際のツールの効果的な使い方
=前編との共有事項=
今回は私自身が実際の講義や映像の文字起こしを行なっており、現在では多くの文字起こしに使えるツールが出ているので、人手による文字起こしとツールでの比較、そしてツール自体の比較を行いました。
それについてまとめていきたいと思います。
後編は実際のツールのそれぞれの効果的な使い方ということで、文字を打ったりが非常に楽になる、どんな人にも役に立つ内容であると思ってます。
その中でも特に学生のレポート作成や、会議の議事録、個人的に参加した講演会のまとめ、インタビューやブログ作成とかには効果抜群です。
==
前編では人手とツールに関して、主に音声認識に関わっている人、人工知能とかもそうですね。その辺りの人が見ると一つ参考になるのではと思いながら書きました。
そちらから見る方が理解は進みますので、時間のある方、興味のある方はぜひそちらもご覧ください。
それでは早速内容に入って行きたいと思います。
ツールの使い方に関しては、今回は「誰でも」「今からでも」「簡単に」できるものを!と思ったので、比較の際に用いたものはその条件を満たしていた以下の3個です。
のちに書くそれぞれのやり方を見ていただければその環境設定の簡単さがわかると思います(全て3工程以下でできることになってます!
・スマホのメモ(最近の大学生がインタビューの文字起こしをするのに「iPhone」と「iPad」の2台だけを使っている理由 - Togetter
・Google ドキュメント(https://azami-seisaku.com/works/20180109
・writer.app(【Windows/Mac対応】書き起こし用の音声再生アプリ「writer.app」を作りました - イソップブログ
*それぞれに関して参考にしたURLが後ろのURLです
それでは実際にやってみて思ったそれぞれの特徴、有効活用方法についてみていこうと思います。
◆スマホのメモ(今回はiphoneで
●やり方
・スマホのメモを起動
・キーボードの左下のマイクマークをタップ
これで完了です。
●特徴
・とにかく手軽でどこでもできる
これに関してはスマホの特徴そのままですが、文字起こしにおいてもこれが絶対で唯一の特徴であると思います。
もちろん可能であるだけで、人が多いところでは雑音という意味でも、一人でスマホに話しかけている人に見られるという意味でも問題はありますが。
後者に関しては通話してる風にすれば少しはマシかもしれません(実際にやって恥をかいたとしても責任は取りませんよ、笑
●効果的な使い方
出かけ先でちょっとしたメモに。
◆Googleドキュメント
●やり方
1、以下からGoogleドキュメントを開く
Google ドキュメント - オンラインでドキュメントを作成、編集できる無料サービス
2、ツール->音声入力(出来ない時はChromeで開き直してください
3、新しく出たマイクマークをクリック
これで完了です。
●特徴
・現在認識中の言葉が**みたいなマークで出るので、進行状況がわかりやすい。
これは、他のものではなかったため気になった部分ですね。実際あると音声を認識しているのかわかるので非常に便利です。
・機能や音声の対応言語が多い
機能はGoogleドキュメントそのまま(wordとかと同じ)なので、豊富なのは言わずもがなという感じですね。
対応言語は他のものと比べてということです。writer.appでは3言語だけなのに対して、こちらは100言語以上!(メモの方は詳しくわかりませんが、それでも同じぐらいあるのかな?
この辺りはさすがGoogle って感じですね。
・ドキュメントを共有できる。
こちらも普通にGoogleドキュメントとしての特徴であるわけですが、音声認識においてはこれが一番の特徴であると思います。
リアルタイムで他の人と共有できるので、お互いにPCさえあれば遠隔でも文字起こしできます。
もちろん工夫が必要そうですが、うまく使えば会議など同時に多数の人が入力する際においても有効活用できそうです。
●効果的な使い方
リアルタイムでの遠隔or同時文字起こし。遠隔の人とビデオ通話・音声通話をしているときに、ドキュメントを共有し用いることによって相手のセリフをリアルタイムで文字起こしできたりします。
◆writer.app
●やり方
1、以下からwriter.appを開く
2、マイクマークをクリック(これもChromeで。safariとかだと出来ないです
これで完了です。
●特徴
・録音をお好みに再生できる
ドキュメント機能は後付けで、元々はここが肝だったようなのでここが充実してます。具体的には音声の速度、音量、数秒戻るとかが出来ます。
・一定時間で自動で改行してくれる
これは後から見るときに非常に便利です。
実際音声認識をやったことのある人だとわかると思いますが、他のものだとずっと同じ行で文字が起こされるので、後からみた時に非常に見にくいし編集が面倒なんですね。
・マイクボタンを押さない限りずっと音声認識モードが続く
個人的にはここが文字起こしにおけるwriter.appの肝で、Googleドキュメントよりもいいところであると思います。
というのも音声認識を起動したままYoutubeをみていたら、Youtube内の音声を勝手に文字起こししていたということがありました(笑
これは形式がたまたまあっていたためと思われますが、この例のようなことになったのもずっと認識モードであったことのおかげと思ってます。
他のサイトを開いていても認識状態なので、他の作業をしながらでも出来ます。
●効果的な使い方
リアルタイムよりも録音の文字起こしに。音声認識を起動した状態で文字起こししたい音声を再生しておけば、あとは別の作業を行っていてもオッケー。
□最後に
ここまでいくつかの文字起こし用のツールを紹介しましたが、根本は同じでもそれぞれにちょっとした特徴があり、それによって活用しやすい事例が存在しました。
しかしこれは主に単体の使い方で、これらにPC内の音声を認識できるようにしたり( writer.appではYoutubeがたまたま出来ましたが笑)、ビデオ通話やそれの録画ソフトなど他のものと組み合わせることで、また文字起こし環境の構築などもっと実践的な工夫次第で、さらに便利で快適に利用することができると思います。
その辺りは色々と他の記事が出ているのでそれらを参考にしたり、また場合によって自分で工夫を考えてみてください。
音声認識関係者の方には人手による文字起こしに劣る点の改善、勝る点の向上、そしてさらなる使いやすいツールの開発の手がかりになっていたら幸いです。
今回は文字起こしについてまとめましたが、普段はゲーム作成等について実際のツールの使い方をわかりやすく説明しているのでよければそちらもみていただければと思います。
では今回はここまで、また別の記事でお会いしましょう。