ITmedia NEWS > STUDIO > Google、音声認識システム訓練用データセットをオー...
ニュース
速報
» 2017年08月28日 08時23分 公開

Google、音声認識システム訓練用データセットをオープンソースで提供

Googleが、クラウドソーシングで集めた6万5000件の短い英単語の音声録音のデータセット「Speech Commands Dataset」をオープンソースで公開した。Mozillaも年内の1万時間分のデータ公開を目指している。

[佐藤由紀子ITmedia]

 米Googleは8月24日(現地時間)、音声認識機能搭載アプリ開発向けの基本的な音声命令のデータセット「Speech Commands Dataset」をオープンソースで公開したと発表した。公式ブログ内のリンクをクリックすると圧縮ファイルをダウンロードできる。

 Speech Commands Datasetは、同社の機械学習ライブラリ「TensorFlow」を手掛けるチームと、人工知能(AI)向けハードウェアキット提供プロジェクト「AIY(Artificial Intelligence Yourself) Projects」チームが共同で開発したもの。

 データは、「Yes」「No」「Stop」「Go」など、音声サービスでよく使われる30個の英単語を、数千人のボランティアが読み上げたもので、長さ1秒の録音6万5000件が収録されている。

 この録音は、AIYが公開しているWebサイトを通じて集められた。このサイトは現在も公開されており、誰でも参加できる。Speech Commands Datasetには今後、公開後に録音されたデータが追加されていく。

 voice 1 AIYの単語録音ページ

 Googleはこうしたデータを収集するためのインフラもGitHubで公開している。

 同社が5月に立ち上げたAIY Projectは、AI搭載ハードウェアを自作する人のためにキットを提供するプロジェクト。まずは自然言語を音声認識する対話ガジェット「Voice Kit」の基本セットを英米の書店などを通じて提供している。今回公開したデータセットはVoice Kitでも使える。

 voice 2 Voice Kit

 GoogleやFacebookなど、音声サービスを提供している企業自身は、「Googleアシスタント」や音声チャットサービスで収集したユーザーの膨大な音声データを音声認識AIツールの訓練に利用できるが、小規模な開発者が訓練データを入手するのは難しい。こうしたオープンソースのデータセット公開は音声認識アプリ普及を後押ししそうだ。

 同じようなプロジェクトはMozillaも6月に「Common Voice」として立ち上げた。こちらはまだ録音を集めている段階で、1万時間分のデータ収集を目標にしている。データセットは年内に公開する見込みだ。

 voice 3 Mozillaの「Common Voice」プロジェクト

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

Special

- PR -

働き方改革、ただの流行だと思っていませんか? 本当の価値に気づかないと、あなたの会社は衰退してしまうかも。その理由を「働き方改革のプロ」と共に解説します。

「AIは万能だ」──間違った知識を身に付けていませんか? AIの現状をいち早く知ることで、他社に差を付けるチャンスを掴めるかも。ビジネス活用の今がここに。

ITmedia NEWS編集長は、まだ若いのに頭が固い。「仕事は会社に来てするもんだ」という上司を、岐阜県に連れて行ってみたら……?

タレントREINAの華麗なる経歴とCIA仕込みの交渉術

19分近くかかっていた業務を2分程度に短縮──AIの企業導入で得られる業務効率化効果は計り知れない。いち早く取り組んでいたソフトバンクがリアルな失敗談を紹介します。

Special

- PR -

「会社で仕事をしろ」という上司に、編集部員はどう打ち勝つのか!?

PULSENSE PS-600なら時計型で使いやすい!脈拍計測機能付きの活動量計を使う

ビジネスでAIを活用するために、今抑えておくべき情報を集めました。

ITmedia NEWS編集長が岐阜県に高飛び!? それでも仕事を継続できた理由とは?

遂に「働き方シンカ論」発表!今やワークスタイル改革は「経営戦略」です。

ニコニコ文化とマストドンの親和性とは? 詳しくは【先端(ギ)研】で

「現代の魔法使い」と呼ばれる落合陽一氏の『超AI時代の生存戦略』とは

これが知りたかった! ビジネス×テクノロジーの今が分かる、未来が見える

AIの企業導入で障壁となる「3+1の壁」とは? リアルな経験からヒントを紹介

メーカー以外の事業者が保守を行う「第三者保守」、そのメリットと品質とは

2020年1月に延長サポートが終了。今からWindows 10移行を着実に進めよう。

「働き方改革」の波に乗り遅れたら企業は衰退する!? その理由を専門家に聞く