現代雑誌200万字言語調査語彙表 公開版(ver.1.0)
2006.8.11


 研究課題「現代日本語における書き言葉の実態解明と雑誌コーパスの構築」における「現代雑誌200万字言語調査」(2001年度〜2005年度実施)の成果として,学術研究・教育利用を目的として以下の語彙表を公開します。このページで公開しているファイルは,「現代雑誌200万字言語調査語彙表CD-ROM版」と同じものです。
 ファイルの形式は,利用の場面を考慮して,テキスト,エクセル,PDFの3種類を用意しました。
 なお、御利用に際しては、必ず「著作権・使用条件」をお読みいただき、使用条件をお守りくださるようお願いいたします。

■解説ファイル
ファイル名からそれぞれのファイルにリンクを張ってあります。
index.html今ご覧になっているファイル
hanrei.txt凡例(各語彙表の見方)
hanrei.pdf  〃(PDFファイル)
tyosagaiyo.txt 調査の概要
tyosagaiyo.pdf   〃(PDFファイル)
copyright.txt著作権及び使用条件(このファイルも一緒にダウンロードしてください)


■語彙表ファイル
 ファイル名からそれぞれのファイルにリンクを張ってあります。ファイルサイズが大きいものがありますので,ダウンロードの際にサイズをご確認ください。
goihyo_50_ver.1.0.txt五十音順語彙表(自立語)約5メガバイト
goihyo_50_ver.1.0.xls  〃(エクセルファイル)約18.1メガバイト
goihyo_50_ver.1.0.pdf  〃(PDFファイル)約5.5メガバイト
goihyoJ_50_ver.1.0.txt五十音順語彙表(付属語)約21キロバイト
goihyoJ_50_ver.1.0.xls  〃(エクセルファイル)約80キロバイト
goihyoJ_50_ver.1.0.pdf  〃(PDFファイル)約93キロバイト
goihyo_frq_ver.1.0.txt度数順語彙表(自立語)約5.7メガバイト
goihyo_frq_ver.1.0.xls  〃(エクセルファイル)約19メガバイト
goihyo_frq_ver.1.0.pdf  〃(PDFファイル)約5.2メガバイト
goihyoJ_frq_ver.1.0.txt度数順語彙表(付属語)約21キロバイト
goihyoJ_frq_ver.1.0.xls  〃(エクセルファイル)約83キロバイト
goihyoJ_frq_ver.1.0.pdf  〃(PDFファイル)約91キロバイト

 ※エクセルの各表は初期状態では,ワークシートが保護されていますが,「ツール」→「保護」→「シート保護の解除」で解除できます。

 ※以下の2つのPDFのファイルには,目次(しおり)を付けました。
  ・五十音順語彙表(自立語)のファイル:「ア」〜「ン」の目次(しおり)
  ・度数順語彙表(自立語)のファイル:順位ごと及び度数ごとの目次(しおり)

 上記ファイルの内容は,2006年3月末時点でのものを基に,それ以降に見つかったエラーの修正を施したものです。ファイルの内容は,今後,予告なくデータの更新を行うことがありますので,データのバージョンをご確認の上御利用くださるようお願いいたします。

 本ページについてのお問い合わせは,以下までお願いいたします。

〒192-8561 東京都立川市緑町3591-2
国立国語研究所 研究開発部門 言語資源グループ
山崎 誠
TEL:042-540-4550 / FAX:042-540-4333(代表)
e-mail: yamazaki@kokken.go.jp

更新日:2007.06.06

(c)2006 独立行政法人 国立国語研究所