WEKO
-
RootNode
-
会誌「情報処理」
-
論文誌(ジャーナル)
-
論文誌(トランザクション)
-
デジタルプラクティス
-
DPレポート
-
研究報告
-
シンポジウム
-
全国大会
-
FIT
-
支部大会論文集
-
国際会議
-
JIP
-
英文誌
-
サプリコンテンツ
-
アイテム
共起単語間の関連性を考慮した文書重要度付与
https://ipsj.ixsq.nii.ac.jp/records/17758
https://ipsj.ixsq.nii.ac.jp/records/17758df606d97-ee5c-45bc-aac9-0722d79631c8
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 1999-11-15 | |||||||
| タイトル | ||||||||
| タイトル | 共起単語間の関連性を考慮した文書重要度付与 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Relevance Ranking of Documents Using Query Word Co-occurrences | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 研究論文 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 株式会社NTTデータ技術開発本部オープンシステムセンタ | ||||||||
| 著者所属 | ||||||||
| 株式会社NTTデータ技術開発本部北米技術センタ | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Open Systems Center, Research and Development Headquarters, NTT Data Corporation | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Technical Center of California, Research and Development Headquarters, NTT Data Corporation | ||||||||
| 著者名 |
高木, 徹
木谷強
× 高木, 徹 木谷強
|
|||||||
| 著者名(英) |
Toru, Takaki
Tsuyoshi, Kitani
× Toru, Takaki Tsuyoshi, Kitani
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 大規模な文書データベースを対象とするフルテキスト検索では検索ヒット件数が多くなる傾向があるため ユーザの検索作業を支援する観点から 検索結果に対して重要度を付与する必要がある.本論文では 重要度算出方法として文書内における検索語の出現共起情報を用いる手法を提案する.単語の共起情報として、近接出現距離 共起検索語間の関連性 および共起検索語の重要度を用いて共起重要度を算出し 単語頻度情報から得られる文書の重要度と組み合わせて重要度を算出する.日本語の情報検索評価用テストコレクションを使用し 単語頻度情報のみによる重要度付与手法と 共起情報を考慮した提案手法を比較した.この結果 提案手法の平均適合率が約0.098向上(従来手法と比較した場合の向上率37%)することを確認した. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Full text search from huge databases tend to give a great number of retrieved documents. To help user's retrieval work, it is necessary to rank them according to their relevance. This paper describes a relevance ranking method using information obtained from query word cooccurrences appearing in the retrieved documents. Distance between query words, their relative relationships in the database, and importance of query words are considered to decide the document relevance. Combined with traditional word frequency ranking, an overall relevance of retrieved documents is calculated. The traditional method alone and the combined method are compared using a test collection consisting of Japanese newspaper articles. Experimental results show that the proposed method improves retrieval recall about 0.098, or 37%compared to the traditional ranking method. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11464847 | |||||||
| 書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 40, 号 SIG08(TOD4), p. 74-84, 発行日 1999-11-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7799 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||