Boaty McBoatface、こちらが「Parsey McParseface」だ。
Boaty McBoatfaceは結局、英政府の新しい極地調査船の名称にはならなかったが、それでも技術大手Googleは、それをもじった独自の名称を新たにオープンソース化された同社の英語構文解析器に採用することにした。
より正確に言うと、Googleは米国時間5月12日、「TensorFlow」で実装されたオープンソースの同社自然言語フレームワーク「SyntaxNet」をリリースした。12日にリリースされたのは、新しいSyntaxNetモデルのトレーニングに必要なすべてのコードと、基本的にSyntaxNet用の英語プラグインであるParsey McParsefaceである。
Googleによると、SyntaxNetは、「Google Now」の音声認識機能など、同社の自然言語理解(Natural Language Understanding:NLU)システムの基盤であるという。Parsey McParsefaceは、文における各単語と文法的な構成要素の機能的役割を理解するために言語構造を解析する機械学習アルゴリズムを基にして、構築されているとGoogleは説明した。
Googleはブログ投稿において、「構文解析を非常に難しくしている主な問題の1つは、人間の言語にかなりのあいまいさが含まれることである」と説明した。「20個か30個ほどの単語からなる適度な長さの文章に対し、該当し得る構文構造が数百、数千、さらには数万存在することもまれではない。自然言語構文解析器は、そのすべての選択肢を何らかの方法で検索し、文脈に照らし合わせて最も適切な構造を見つける必要がある」(Googleのブログ投稿)
Googleによると、Parsey McParsefaceは、英語のニュース記事に適用した場合に94%の精度を達成しているという。100%ではないもののその精度は十分に高く、多数のアプリケーションに役立つとGoogleは主張している。文の意味に対してコンピュータが適切に対応するためには、文の文法構造を正しく解釈することが不可欠だからだ。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。