「MyDjVu」は,シナリオ・データと画像データを読んで,DjVu様式の文書を生成するための処理を行うプログラムです。DjVuは,AT&T研究所が1996年に開発した,PDFに似た文書表現様式です。
DjVuとPDFの機能の違いを下表に示します。
機能諸元 | DjVu | |
---|---|---|
画像 | ラスター図形(画像) ベクトル図形(文字,イラスト) | ラスター図形(画像) |
文字 | ラスター図形として | 文字符号からベクトル図形へ変換 |
見える文字とテキストの対応関係 | 文字画像へ対応するかどうかは 「隠しテキスト」による。 | 常に一対一に対応している。 「隠しテキスト」もできる。 |
フォント・データ | ビューアーは持つ必要がない。 したがって,ビューアーは軽い。 | ビューアーが持つ。 したがって,ビューアーは重い。 |
検索対象 | 「隠しテキスト」の文字 | 見える文字,「隠しテキスト」の文字 |
文書の暗号化 | 可能 | 可能 |
ファイル様式 | IFF | 独自 |
圧縮方法 | JB2,IW44 | TIFF G4,JPEG |
ビューアー | 単独のビューア Webブラウザのプラグイン 無償 | 単独のビューア Webブラウザのプラグイン 無償 |
作成・編集ツール | 有償(フリーもある) | 有償(フリーもある) |
プラットフォーム | Windows,MacOS,Linux | Windows,MacOS,Linuxなど |
DjVu文書を扱う基本ツールである「DjVuLibre」を使えば,DjVu文書を作成・編集できますが,すべてUNIXベースの単機能コマンドですから,誰もが容易に扱えるものではありません。「MyDjVu」は,なるべく多くの人々に「デジタル復刻本(digital replica)」の制作に関わっていただきたいために開発した,DjVu文書を簡単に作れるツールであり,すべてフリーウェアの組合わせで実現しています。制作の中核となる「画像」と「テキスト」の対応では,文章を表している画像の区画を自動的に検出することで位置合わせの省力化を図り,またテキスト・エディターだけで表現できるようにしました。
「デジタル復刻本」の代表例は,欧米の主な自然史博物館図書館,植物図書館,研究機関が合同で起こした生物多様性遺産図書館(BHL−Biodiversity Heritage Library)でしょう。そこでは各館が所蔵しているさまざまな文書をDjVuとPDFの二つの様式で表し公開しています。それらを比べてみると,DjVu文書の圧縮率がPDF文書よりも高い点がよく分かります。また,OCRで書籍の文字認識を行ってDjVuへ自動的に変換している様子がうかがえます。一方,わが国では,DjVuの応用がほとんど進んでおらず,国会図書館を始めとして,いくつかの大学図書館では,所蔵書籍の画像データだけの提供にとどまっています。その理由には,テキスト化の予算やOCRによる漢字認識の難しさなど,いろいろあろうとは思いますが,「MyDjVu」が一助となり,DjVu文書化が進むことを願っています。
なお,セラーテムテクノロジー社が扱っている,商用のDjVu文書作成・編集ツールを使えば,「MyDjVu」と同じようなことが実現できると思いますが,残念ながら,まだ確認しておりません。
MyDjVuプログラムはPerlベースからJavaベースに移行しました。さらに,書籍の著作権やその書籍の画像の所有権への侵害を未然に防ぐための機能や,使い勝手を向上させる機能といった拡張を行い,バージョン1.0となりました。これを機に,MyDjVuのホームページはここJAGATからdjvu.life.coocan.jpに移動しましたので,今後,MyDjVuについてはそこへ接続してくださるようお願い申し上げます。 |
ウェブ・サーバーにおいてDjVuコンテンツをプラグインを介して送信可能にする方法は,次の通りです。
例えば,DjVu版「羅生門」のファイル名が「Rashoumon.djvu」であれば,次のようなHTMLファイルを用意します。
<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=このページの符号系"> <title>羅生門</title> </head> <body> <embed src="Rashoumon.djvu" type="image/x-djvu" width="100%" height="100%" /> </body> </html>
このファイル名を「Rashoumon.html」とすると,「<a href="Rashoumon.html">羅生門</a>」という形で呼び出せます。
このHTMLファイルが送られると,エンドユーザのブラウザではMIMEタイプ「image/x-djvu」に対応するプラグインの実行が要求されます。プラグインがインストールされていない場合は,「http://www.celartem.com/download/」からのダウンロード,インストールが必要になります。
DjVuコンテンツを閲覧するためのプラグインは,WindowsとMacOSごとに,Internet Explorer,Safari,Firefox向けのものが無償で入手できます。詳細については「DjVuビューアーの機能対比」をお読みください。
ウェブ・サーバーにおいてDjVuコンテンツをアプレットを介して送信可能にする方法は,次の通りです。
例えば,DjVu版「羅生門」のファイル名が「Rashoumon.djvu」であれば,次のようなHTMLファイルを用意します。
<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=このページの符号系"> <title>羅生門</title> </head> <body> <applet code="DjVuApplet.class" archive="javadjvu.jar" width="1000" height="800" <param name="data" value="Rashoumon.djvu"> <param name="cache_archive" value="javadjvu.jar"> <param name="navpane" value="outline" /> <param name="zoom" value="page" /> </applet> </body> </html>
このファイル名を「Rashoumon.html」とすると,「<a href="Rashoumon.html">羅生門</a>」という形で呼び出せます。
このHTMLファイルが送られると,エンドユーザのブラウザが実行している環境ではこのアプレットの実行が要求されますので,Javaの実行を許可する必要があります。
このアプレットはウェブ・サーバー側にインストールする必要があります。詳細については「Java DjVu View」をお読みください。
Copyright 2009, KISI.