Google、高精度の英語パーサー「Parsey McParseface」をオープンソース化 9
ストーリー by headless
RRS 部門より
RRS 部門より
Sraddy McSradface 曰く、
Googleは12日、オープンソースの構文解析用フレームワーク「SyntaxNet」をリリースした。ソースコードはGitHubで入手可能だ(Google Research Blogの記事、 The Next Webの記事、 The Registerの記事、 The Vergeの記事)。
SyntaxNetは自然言語理解(NLU)システムの基盤を提供するTensorFlow上に実装されたもの。今回のリリースには新しいSyntaxNetモデルを作成して独自データで学習させるために必要なコードのほか、学習済みの英語パーサー「Parsey McParseface」も含まれる。
Parsey McParsefaceは同種のモデルの中で最も精度の高いものだといい、英文ニュース記事のセンテンスを構文解析させたところ、94%以上の正確さで単語間の依存関係を抽出できたという。Webページに記載された文章の構文解析はより難しいと考えられるが、こちらも90%以上の正確さに達しているとのことだ。
構文解析していたことに驚愕 (スコア:0)
Google英日翻訳の驚異的なテキトーさは単語置き換えているレベルにしか思えなかった。
Re: (スコア:0)
Google の英日翻訳って否定文が肯定文になったり基本的なレベルでメチャクチャだったけど、この「高精度の英語パーサー」は使ってなかったのかな。
Re: (スコア:0)
正確さが94%ってことだから、そのダメな文章には17以上の
単語が使われていたにちがいない。
Re: (スコア:0)
ページの↓に書いてある
> Trademarks property of their respective owners. Comments owned by the poster.
をGoogle翻訳で日本語に翻訳してみると
> それぞれの所有者の財産を商標。ポスターが所有するコメント。
だそうな。果たして高精度のパーサーは役に立っているだろうか?
Re: (スコア:0)
Trademarks are property of their respective owners. Comments are owned by the poster.
だったらどうよ?
# 動詞ようもない
Re: (スコア:0)
商標はそれぞれの所有者に帰属します。コメントはポスターによって所有されています。
おしいあまりにも惜しい。
Re: (スコア:0)
> 正確さが94%ってことだから、そのダメな文章には17以上の単語
どういう計算ですか?
Re: (スコア:0)
対になる Composey McComposeface の実装がまだなのでしょう。
Re: (スコア:0)
英語わかる人が日本語喋れるとは限らないしー。