Palmで「ロングマン現代英英辞典」を使う


1.はじめに
2.ハードとソフト
3.単語をレベル別に分割する必要性
4.作業手順
5.注意事項その他


 

1.はじめに

 先に、Longman Dictionary of Contemporary English (ロングマン現代英英辞典[第三版]、LDOCE or LDCE)付属のCD-ROMデータの利用法を「ロングマン現代英英辞典をEPWINGとして使う」・・・をさらに見やすくとして紹介しましたが、今回はこのデータをPalm OS搭載機で使う方法を紹介します。
 いつでもどこでも、ロングマンをポケットからさっと出して使いたいという人向けのページです。
 ただし、上記のページにも書いているとおり、CD-ROMからのデータの吸い出し作業は時間がかかります。

2.ハードとソフト

 辞書データが結構大きくなりますので、Palm本体はメモリースティック(SONYのCLIEシリーズ)やSDカードの使える機種(Palm m500,m505など)をご利用下さい(Sony の CLIE で動くことを確認しております。 PEG-N700C, PEG-S500C)。
なお以下に説明しますが、単語のレベルを限定すれば、これらの機種の本体側だけでも、あるいはこのような補助記憶のない機種でも利用できると思います。

 ソフトは、KDIC(シェアウェア) を使います。v1.30からはメモリスティックやSDカード上に 辞書ファイルを置くことができるようです。

3.単語をレベル別に分割する必要性

 
 (1) 一般に Palm はメモリが小さく、大きな辞書を一度にインストールすることが困難
 (2) メモリースティックなどに直接データを書き込む装置(SONYのVAIO、アイ・オー・データのPCMS-ADP メモリステックPCカードアダプタなど)があれば、大きなデータをそのまま書き込めます。しかし、KDIC は v1.30 の段階ではあまりに大きい辞書には対応していないようです(将来対応予定とのことです)。

 以上のような理由により、何らかの基準によってデータを分割する必要がありますが、アルファベット順に分割しても能がありません。
 そこで、ここではアルクの「標準語彙水準(SVL=Standard Vocabulary List)12000」を利用させていただきました。
 

「SVL12000」とは、アルクがこれまでの活動の中で30年間蓄積してきたさまざまなデータに先行資料などを合わせ、その中から選定を行った、段階別学習語彙リストです。全体は12000語で構成されています。

・・・というものだそうです。英単語を1000語単位で12のレベルにランク付けしてあります。SVL12000に関しては、アルクからCD付きの書籍やゲーム感覚で単語を学べるCD-ROMが発売されています。
 CD-ROMは、単語から意味を選ばせる三択問題、意味から単語を選ばせる三択問題、anagram形式による綴りの並べ替え問題などを中心に構成されています。間違えたら何度も同じ単語が質問されます。全単語 とも発音・例文を音声で確認でき、ゲーム感覚で単語を覚えることができます。オススメです。

 ちなみに KDIC は複数辞書の同時検索が可能ですので、辞書を分割しても一括検索ができます。
 



4.作業手順

途中までは、「ロングマン現代英英辞典をEPWINGとして使う」・・・をさらに見やすくと同じ作業です。
この作業を終えている方はV.から始めて下さい

  1.  矢吹さんの「ロングマン現代英英辞典をEPWINGとして使う」手順1〜3を実行します(かなり時間がかかります)。
      
  2.  下記のページを開いてページ全体をコピーしメモ帳などのエディタにペーストして、Tの作業でできた longmantmp.txt と同じディレクトリに指定されたファイル名で保管してください。
     
    掲載してある場所 保存するファイル名 説明
    henkan.htm henkan.pl 変換スクリプト1
    henkan2.htm henkan2.pl 変換スクリプト2
    hatsuon.htm hatsuon.pl 発音記号変換スクリプト
    (ただしPalm上では発音記号は正確に表示しません。前処理としてのみ使用します。)
               



  3.  perl5の実行環境をインストールしていなければ下記のサイトからActivePerlをダウンロードしてインストールしてください。
    (perl4やjperlでは正しく動きません。)
    http://www.activestate.com/Products/ActivePerl/Download.html


  4.  Tの作業でできたファイルを longmantmp.txt と仮定します。DOS互換窓(コマンドウィンドウ)を開きこのファイル(longmantmp.txt )と同じディレクトリに移動して次の順序でコマンドを実行してください。(perlの実行ファイルがある場所にパスが通っていることと、拡張子.plとperlの実行ファイルが関連づけられている必要があります。ActivePerlの場合は素直にインストールすれば、再起動後にはこの状態になっています。)

    henkan.pl   longmantmp.txt > ldce1.txt【エンターキー】

    henkan2.pl   ldce1.txt > ldce2.txt【エンターキー】

    hatsuon.pl   ldce2.txt > ldce3.txt【エンターキー】

     


  5.  もし、ActivePerlでないperl5の処理系で上のようにしても動かない場合はperlの実行ファイル名を先頭に付けて、例えば

            c:¥perl¥bin¥perl  henkan.pl longmantmp.txt  >  ldce1.txt【エンターキー】

    のように入力して実行してください。 

     


    ▼ここからが Palm 用に変換する部分です。

  6.  下記のページを開いてページ全体をコピーしメモ帳などのエディタにペーストして、II と同じディレクトリに指定されたファイル名で保管してください。
     
    掲載してある場所 保存するファイル名 説明
    mkpdictxt.htm mkpdictxt.pl PDIC一行テキスト形式の辞書を作成
    svl.htm svl.txt SVL12000テキストデータ

     

  7.  IV でできた ldce3.txt をもとにテキスト形式の辞書を作ります(KDIC v1.30 からは一行4089バイトまでのデータが許容されますので、Longmanのデータは全て入ります)。

     
    [ mkpdictxt.plの書式 ]

    mkpdictxt.pl  入力ファイル名  【開始SVLレベル】  【終了SVLレベル】  >  出力辞書ファイル


    ●入力ファイル名は上のldce3.txtになります。
    ●SVL12000の範囲の単語を抽出するのであれば
       【開始SVLレベル】  【終了SVLレベル】 に 1〜12の範囲の数値を指定します。
       【終了SVLレベル】 に 13 以上の数を指定すればSVL12000外の単語も含むようになります。
    ●SVL12000の範囲外の単語のみを抽出するのであれば
       【開始SVLレベル】  【終了SVLレベル】 に何も指定しません。
    ※引数のエラーチェックは厳しくしていないので、ご注意下さい。

    次に、具体的な例として辞書データを3つに分割する場合を示します。
    下の例では、SVLレベル1〜2、SVLレベル3〜12、SVLに含まれない単語の三つに分けて辞書を作ります。
    ※なお、引数に数値を指定する場合はリダイレクト記号'>'の前後にスペースを入れてください。



    mkpdictxt.pl   ldce3.txt  1  2  >  pdicldce1-2.txt【エンターキー】

    mkpdictxt.pl   ldce3.txt  3  12  >  pdicldce3-12.txt【エンターキー】

    mkpdictxt.pl   ldce3.txt   >  pdicldcehigh.txt【エンターキー】

     


  8.  次に KDIC 付属の gendic.exe で KDIC 用の辞書に変換します。以下のコマンドは、gendic.exeがVIで作ったテキストデータと同じディレクトリにあることを前提としています。



  9. gendic.exe -n KdicLDCE1-2 -o KdicLDCE1-2.pdb pdicldce1-2.txt【エンターキー】

    gendic.exe -n KdicLDCE3-12 -o KdicLDCE3-12.pdb pdicldce3-12.txt【エンターキー】

    gendic.exe -n KdicLDCEhigh -o KdicLDCEhigh.pdb pdicldcehigh.txt【エンターキー】

     

    手元の変換では、辞書のサイズは次のようになります。
     

    KdicLDCE1-2.pdb 2961K
    KdicLDCE3-12.pdb 2768K
    KdicLDCEhigh.pdb 1739K


        

以上で作業は終了です。 できあがったpdbデータをPalmにインストールしてください。
メモリースティックなどに直接書き込む場合は、

/PALM/PROGRAMS/MSFILES

というフォルダー(ディレクトリ)を作成して、その中に 辞書ファイルをインストールしてください。
 詳しくはKDICのドキュメントをご覧下さい。

 


5.注意事項その他

  1.  この変換では発音記号等、外字の部分は'.'に変換してあります。ただ、第一アクセントのみは識別できるようにしています。
  2.  SVL12000の範囲の単語には[L3]のようにレベルを表示してあります。
  3.  一行に多量のデータを入れられないため、語義番号ごとに別エントリーとなっています。
    例えば、
    go 2 # 5
    には、go 2 の第5番目の説明が入っています。