API

形態素解析API:日本語文字列を語句に分割する技術

2014/12/03

形態素解析APIを利用すると、日本語文字列を形態素と呼ばれる単語単位に分割するアプリケーションを作成できます。

形態素解析APIの概要

形態素解析APIはリクエストで送られた日本語文字列を、形態素と呼ばれる単語単位に分割します。
例えば”この商品はデザインが斬新だ”という文字列は、”この”, “商品”, “は”, ”デザイン”, ”が”, ”斬新”, ”だ”というように分割されます。
このAPIを用いることにより、自社製品のレビュー記事からどのような表現でよく評価されているかといった分析を行うことが容易になります。

リクエスト先URL

https://labs.goo.ne.jp/api/morph

リクエストパラメータ

application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。

パラメータ名 説明
app_id アプリケーションID。
必須項目。
request_id リクエストID。
省略時は”labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番”となります。
sentence 解析対象テキスト。
必須項目。
info_filter 形態素情報フィルタ。
form(表記)、pos(形態素)、read(読み)のうち、出力する情報を文字列で指定します。複数指定する場合は、”|”で区切って複数記載してください。
省略時は”form|pos|read”を指定したものとみなします。
pos_filter 形態素品詞フィルタ。
出力対象とする品詞を”|”で区切って指定します。
省略時は全形態素を出力します。

レスポンスパラメータ

JSONフォーマットのテキスト形式となります。Content-typeは”application/json”となります。

パラメータ名 説明
request_id リクエストID。
リクエストと同じ値となります。
info_filter 形態素情報フィルタ。
入力と同じ値となります。
pos_filter 形態素品詞フィルタ。
入力と同じ値となります。
word_list 形態素リスト。
形態素リストは文ごとに分かれた文単位形態素リストの配列となります。
文単位形態素リストは形態素情報の配列で、形態素情報には表記・形態素・読みのうち形態素情報フィルタで指定された要素が含まれます。
例:
形態素リスト: [[[“文”],[“1つ”],[“。”]],[[“文”],[“2つ”],[“。”]]]
文単位形態素リスト: [[“文”],[“1つ”],[“。”]]
形態素情報: [“文”]

入出力サンプル

入力例

{“app_id”:”[発行されたapp_id]”, “request_id”:”record001″, “sentence”:”日本語を分析します”, “info_filter”:”form”}

出力例

{“request_id”:”record001″, “info_filter”:”form”, “word_list”:[[“日本語”, “を”, “分析”, “し”, “ます”]]}

APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。
利用登録はこちらからお願いします。