API

語句類似度算出API:2つの語句の表記ゆれ度算出

2014/12/03

語句類似度算出APIを利用すると、発音内容を比較してその類似度を算出し解析を行うアプリケーションを作成できます。

語句類似度算出API

語句類似度算出APIはリクエストで送られた2つのキーワードについて、その語句の発音内容を比較してその類似度を算出します。
例えば、”東京”と”トーキョー”といった読みの似通ったキーワードの組に対して、高い類似度を算出できます。類似度は0から1の範囲となり、0.3以上ですとおおよそ似通っていると判定できます。
このAPIを用いることにより、人名などの記述内容に差異のあるデータベース間で同一内容を示すレコードを探し出す分析などが容易になります。また顧客からの問い合わせ情報で、自社商品名が多様な書き方で表現されている場合の集計作業などにも適用可能です。

リクエスト先URL

https://labs.goo.ne.jp/api/similarity

リクエストパラメータ

application/x-www-form-urlencoded、application/json形式でのPOSTを受け付けます。
※GETは受け付けませんのでご注意ください。

パラメータ名 説明
app_id アプリケーションID。
必須項目。
request_id リクエストID。
省略時は”labs.goo.ne.jp[タブ文字]リクエスト受付時刻[タブ文字]連番”となります。
query_pair 類似度算出対象配列。
必須項目。
配列形式で2つの文字列を入力してください。
ex: {query_pair : [“ウィンドウズ”, “windows”]}

レスポンスパラメータ

JSONフォーマットのテキスト形式となります。Content-typeは”application/json”となります。

名前 説明
request_id リクエストID。
リクエストと同じ値となります。
score 類似度スコア。
文字列間の類似度を0~1の範囲で出力します。(1に近いほど類似)

入出力サンプル

入力例

{“app_id”:”[発行されたapp_id]”, “request_id”:”record004″, “query_pair”:[“phablet”, “ファブレット”]}

出力例

{“request_id”:”record004″, “score”:0.484}

APIを利用するための手順についてはこちらで説明していますので、ぜひご活用ください。
利用登録はこちらからお願いします。