200はじめに

全書籍共通の過程である.ここでは皮膚疾患治療指針を例に説明する.


210複数検索画面

今日の診療を起動して複数検索画面にする.検索書籍選択画面で皮膚疾患治療指針のみを選択する.OR検索で.(全角),A(半角),1(半角),の3つのキーワードで検索.500件を超えました〜とかいうダイアログが出るがはいを押す.

複数検索キーワードの一例

書籍名 複数検索画面キーワード(OR検索にすること) ヒット数 備考 オススメ度
治療指針 治 A(半角) 1(半角) 1670件 Vol.16のレボメプロマジン以降は漢方やガイドラインの解説は,無駄にヒット数をあげる原因になるので私は切り捨てている.中身は勉強になるが.治療指針へ薬剤リンクを張れるようにしてある. ○○○○○
診断指針 ( (半角括弧) A(半角) 1(半角) 871 具体的な診断法を示す. ○○○○
整形外科治療指針 ( (半角括弧) A(半角) 1(半角) 641 図が多くてテキストだけ抜き取っても余り使えない印象.
小児治療指針 ( (半角括弧) A(半角) 1(半角) 1106 図が多くてテキストだけ抜き取っても余り使えない印象.
救急マニュアル ( (半角括弧) A(半角) 1(半角)  721 図が多くてテキストだけ抜き取っても余り使えない印象. ○○
臨床検査データブック ( (半角の開き括弧) 1073 データの異常値と鑑別診断に. ○○○○
治療薬マニュアル 2355 今日の治療薬はPDA版が出ている. ○○○○○
新臨床内科学 ( (半角括弧) e(半角) 1(半角) 860 日本語の成書が一冊まるまる手のひらに入るのは素晴らしい. ○○○○
内科診断学 ( (半角括弧) 428 違った視点で疾患の解説が読める. ○○○
皮膚疾患治療指針 ( (半角括弧) A(半角) 1(半角) 563 図が多くてテキストだけ抜き取っても余り使えない印象. ○○
医学大辞典 ( (半角括弧) a(半角) [(半角) 59934 条件検索が重くなる... ○○○

項目をクリックすると下に何件目なのかが表示される.

220テキスト抽出作業

さて,今日の診療は項目をクリックしてCtrl+Aを押すだけでその項目内容のテキスト全部がクリップボードにコピーされる仕様になっている.

ClipText.Exeを起動する.クリップボードに送られたテキストデータが次々後ろに追加されていく便利ソフト.

検索結果リストの1件目をクリックして,以後延々とCtrl+A→下矢印キーを繰り返すと次々に項目内容がクリップボード経由でClipText.Exeに送られる.(文字で書くと意味が伝わりにくいが,やれば分かる).あまり早くやりすぎると,文書の長い項目は取りこぼされることがあるようだ.またWindowsの限界なのか,あまりコピーを早くやると数千回程度でビープ音が出て挙動が不安定になるようである.

手動でやる場合はCtrlキーを押下固定して,A↓A↓A↓A↓A↓……を2〜3項目/秒くらいで必死に連打すればよい.キーボードマクロが組めるならもっと楽.医学大辞典だけは6万項目あるので,手動で3項目/秒で連打しても2万秒 (5時間半)かかる計算になる.

AutoRunner!などのソフトでキーボードマクロを組んで,セカンドPCで延々取込みをさせた方がいいかもしれない.私は医学大辞典はAutoRunner!で2項目/秒でのんびりとりこむようにしている.AutoRunner!をインストールして,AutoRunner!\ユーザーネーム\AutoRunner!\フォルダにTodaysDiagnosis.txtを放り込んでAutoRunner!を起動すればCtrl+A→下矢印キーのマクロが使えるようになる.TodaysDiagnosis.txtを右クリックしてプロパティで実行開始条件や実行終了条件を好きなように設定してOKして実行ボタンを押下.3秒以内に今日の診療の1項目目を選択するとあとは自動でCtrl+A→下矢印キーが繰り返されていく.

デフォルトは,実行開始条件は実行ボタン押下後3秒後からスタートする設定になっている.実行終了条件は適宜計算して欲しい.1200項目取り込むなら1200÷2+3秒で10分3秒後がピッタリの終わりになるはず.念のためさらに4-5秒余計に加えておいた方がよい.

医学大辞典は1項目あたりの文書量は多くないので,メインマシン(Windows XP,Pentium4 3.2GB,メモリ1GB)で10項目/秒の速さでも取り込めた.しかし1万回くらいするとコピーするたびにビープ音が出て取りこぼしや同じ項目が2重コピーされるようになるので,6千項目(600秒)ずつを10回に分けて取り込んだ方がよいと考える.

最後の項目まで取り込めたら,皮膚.txtというファイル名で保存.1.25MBくらいになるのでは.他書籍のファイル名は下記参照.

ClipTexe.Exeを終了し忘れないように.

全部取り込んでもよいのだが,最初に出る前書き系や後ろの参考資料一覧みたいのは無駄にヒット数を上げる原因になるので適宜除いてもよい.

また,比較的小さい整外・小児・救急・皮膚なんかはひとまとめに抽出してマイナー混合辞書.txtなどするのも一つの手である.

書籍名 テキスト抽出したファイル名
治療指針 治療指針.txt
診断指針 診断指針.txt
整形外科治療指針 整形.txt
小児治療指針 小児.txt
救急マニュアル 救急.txt 
臨床検査データブック 検査.txt
治療薬マニュアル 治療薬マニュアル.txt
新臨床内科学

新臨床内科学.txt

内科診断学 内科診断学.txt
皮膚疾患治療指針 皮膚.txt
医学大辞典 医学大辞典.txt

300HTML形式へ変換へ.