◆NODで字幕サービスを試行
〜NOD字幕自動変換技術を開発〜
(平成22年3月31日)
NHKはNHKオンデマンド(NOD)で、人にやさしいサービスを実現するため、放送で使用している字幕素材をNODで利用可能な形式に自動変換する技術を開発※1しました。4月1日からNODでこの技術を用い、一部の番組でパソコン向け字幕サービスの試行を開始します。
NHKはこれまでに放送番組の字幕付与率を年々高めており、人にやさしい放送をお届けしています。NODでも、テレビ放送と同様に字幕付きで番組視聴できることが望まれていましたが、放送用の字幕素材をそのまま利用することができませんでした。
今回、放送用の字幕素材をパソコンの動画再生ソフトウェア※2で表示可能な字幕形式※3に自動変換する技術を開発しました。テレビ放送と同様にきめ細かな字幕表示を可能とするために、文字色、背景色、ふりがな、表示位置、点滅表示、下線表示、囲み文字などの設定ができるようにしています。
この変換技術では、新たに開発した汎用的な字幕言語※4を使用しています。この言語は、パソコンで扱いやすいXML※5構造であるため、例えば字幕からテキスト情報を抜き出すことで番組のシーン検索などでの活用も期待できます。
連続ドラマ小説や大河ドラマなど、一日4、5本程度から試行を開始します。今後ともNHKは、人にやさしいサービスの充実に取り組んでいきます。
※1) エル・エス・アイ ジャパン株式会社との共同開発。
※2) NHKオンデマンドでは、フラッシュビデオを使用。
※3) TTML(Timed Text Markup Language)。パソコン向けの一般的なビデオオンデマンドに適したXMLによる字幕形式。
※4) GCML(General Caption Markup Language)。放送用字幕と互換のあるXMLによる字幕形式。
※5) XML(Extensible Markup Language)。「タグ」と呼ばれる特定の文字列で情報の意味や構造、装飾などを記述するプログラム言語。
図1 NHKオンデマンドでの字幕サービスイメージ

図2 字幕変換の流れ
○ 放送用字幕素材から、XML形式である汎用字幕素材(GCML)に自動変換した後、フラッシュビデオなど、パソコンの再生ソフトウェアで表示可能な字幕形式に変換し、字幕用データを伝送します。
○ 字幕の形式を汎用化することにより、パソコン向けのNHKオンデマンドの字幕サービス以外にも、字幕をメタデータとして利用できるようになるなど、様々な活用が期待できます。
|