パスワードを忘れた? アカウント作成
12779898 story
Google

Google、高精度の英語パーサー「Parsey McParseface」をオープンソース化 9

ストーリー by headless
RRS 部門より
Sraddy McSradface 曰く、

Googleは12日、オープンソースの構文解析用フレームワーク「SyntaxNet」をリリースした。ソースコードはGitHubで入手可能だ(Google Research Blogの記事The Next Webの記事The Registerの記事The Vergeの記事)。

SyntaxNetは自然言語理解(NLU)システムの基盤を提供するTensorFlow上に実装されたもの。今回のリリースには新しいSyntaxNetモデルを作成して独自データで学習させるために必要なコードのほか、学習済みの英語パーサー「Parsey McParseface」も含まれる。

Parsey McParsefaceは同種のモデルの中で最も精度の高いものだといい、英文ニュース記事のセンテンスを構文解析させたところ、94%以上の正確さで単語間の依存関係を抽出できたという。Webページに記載された文章の構文解析はより難しいと考えられるが、こちらも90%以上の正確さに達しているとのことだ。

  • by Anonymous Coward on 2016年05月15日 16時46分 (#3012837)

    Google英日翻訳の驚異的なテキトーさは単語置き換えているレベルにしか思えなかった。

    ここに返信
    • by Anonymous Coward

      Google の英日翻訳って否定文が肯定文になったり基本的なレベルでメチャクチャだったけど、この「高精度の英語パーサー」は使ってなかったのかな。

      • by Anonymous Coward

        正確さが94%ってことだから、そのダメな文章には17以上の
        単語が使われていたにちがいない。

        • by Anonymous Coward

          ページの↓に書いてある
          > Trademarks property of their respective owners. Comments owned by the poster.
          をGoogle翻訳で日本語に翻訳してみると
          > それぞれの所有者の財産を商標。ポスターが所有するコメント。
          だそうな。果たして高精度のパーサーは役に立っているだろうか?

          • by Anonymous Coward

            Trademarks are property of their respective owners. Comments are owned by the poster.
            だったらどうよ?

            # 動詞ようもない

            • by Anonymous Coward

              商標はそれぞれの所有者に帰属します。コメントはポスターによって所有されています。
              おしいあまりにも惜しい。

        • by Anonymous Coward

          > 正確さが94%ってことだから、そのダメな文章には17以上の単語

          どういう計算ですか?

      • by Anonymous Coward

        対になる Composey McComposeface の実装がまだなのでしょう。

    • by Anonymous Coward

      英語わかる人が日本語喋れるとは限らないしー。

typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...