NII TV-RECS (NII TV Broadcast Video Research Corpus) は、国立情報学研究所内の共同研究として構築を進めている研究目的の放送映像コーパスです。近年の計算機技術の進歩により、大量の映像を処理・解析できるようになったことを受け、映像処理研究を一層発展させる方法のひとつとして、大量に映像を蓄積し研究資源として活用することを試みています。コーパスとは、文書や資料の包括的な集積を指す語で、文学における作家の全集や、言語学における言語の用例集がコーパスと呼ばれます。同様に、この放送映像コーパスは、放送映像を包括的に蓄積することで、映像の事例集や用例集となることを狙っています。
放送映像を蓄積するシステム(放送映像アーカイブシステム)は、約10テラバイトの容量があり、平成13年より稼動を開始しています。このシステムでは、東京地区の地上波
7 チャンネルの放送映像を同時に並行して 24 時間終日キャプチャしており、各チャンネルの映像ストリームを1 時間分ずつMPEG-1形式のビデオファイルの形で保存しています。また、映像ストリームに加えて、テキスト形式のメタ情報として、文字放送に含まれている文字字幕(クローズドキャプション)ならびに電子番組ガイドも蓄積しています。
このシステムでは、10テラバイトの容量を「24時間アーカイブ」と「特定番組アーカイブ」に分けて使用しています。「24時間アーカイブ」では、7
チャンネルの放送映像を並行して終日(24時間)MPEG-1 の形式で保存しており、容量の制限から、最新の 3 週間分(約3,500時間分)を蓄積し、常時更新し続けています。他方、「特定番組アーカイブ」としては、早くから文字字幕放送を行っている
NHK ニュース7を継続的に蓄積している他、各局の番組のうち、ニュース番組、料理番組、ドキュメンタリー番組など特定のジャンルの番組を継続的に蓄積しています。中でも、NHKニュース7については、平成13年3月より蓄積を始めており、システムの保守・拡張などのために格納できなかった日が一部あるものの、これまでに
2,000 日以上の映像を蓄積しています。この番組については、顔検出や動き解析などの高度な映像処理を可能とするために高精細のMPEG-2形式でも映像を格納しています。また、平成21年8月からは、千葉分館に100テラバイト超の容量を確保することにより、24時間アーカイブの長期保存も開始しています。
関連する研究者 |
氏 名 |
所 属 |
佐藤 真一 |
国立情報学研究所 コンテンツ科学研究系 教授 |
片山 紀生 |
国立情報学研究所 コンテンツ科学研究系 准教授 |
孟 洋 |
国立情報学研究所 コンテンツ科学研究系 助教 |
井手 一郎 |
名古屋大学大学院 情報科学研究科 准教授 |
Duy-Dinh Le |
国立情報学研究所 コンテンツ科学研究系 特任助教 |
武 小萠 |
国立情報学研究所 コンテンツ科学研究系 特任研究員 |
Copyright(C)2008-2012 National Institute of Informatics