本の未来基金は5月30日、シナジーカフェGMOにて「Code for 青空文庫」アイデアソン #1 を開催しました。現地から可能な限りライブ更新します。
青空文庫の現状について
まず青空文庫の大久保ゆう氏から、青空文庫の現状について説明があった。
青空文庫はインターネット上の電子図書館。主にパブリック・ドメイン(著作権期限切れ)作品の配信をボランティアが入力・校正・配信している。以下の4つを基本思想としている。
Universal Texts
「日本語が使える人であれば誰でも利用可能なテキスト(※ユニバーサルデザイン)」
年配の方やお子様、目の見えない方でも読める、ということを大切にしている。日本語マークアップとして「青空文庫注記」を入れてある(マシンリーダブル)。
Open Air Shelves
呼びかけ人の故・富田倫生氏が書いたテキスト。
「青空で誰かが来るのを待っている本」
「自由な本棚に誰かが本を置いていき、誰かがもらっていく」
「自由にアクセス/コピーされる書架と蔵書」
「『青空文庫』の普通概念化:パブリック・ドメイン」
電子書店で「水増し」と揶揄されたが、富田氏は「どうも、水です」と挨拶。水であることは誇っていいと生前語っていた。
Digital Scribes
青空文庫ボランティアは「電子的な写本を造っている人々」
入力・点検・校正・素読み・ファイル作成をオンライン上で共同作業している。電子化作業は基本的にボランティアなので、やりたいものをやる(無理はしない・させない)。活動ペースにはそれぞれかなり波がある。
「データベース・サーバーが大変」なのは、活動の裏側を管理するアプリケーションが載っているから。データベースとアプリケーションは分けて考えたい。
「マイクロボランティア」これまでは作品1つを1人がやる形だったが、もっと気軽に参加できるような(Wiki形式?)
Homo Communicans
ラテン語で「共有する人」という意味。
人間は共有したがる生き物(感動とか)。だからやってて「楽しい」が重要。
他の人がデータを使って儲けるのは全く構わないが、青空文庫自身は作品から対価を得ないのが大原則なので、作品以外からのマネタイズが重要となる。
自由(free)は無料や私物化を意味しない。
青空文庫サーバの今と未来
続いて本の未来基金の香月啓佑氏から、青空文庫サーバの現状と今後について説明があった。
事前にシェアされていたスライドからの修正点で、左下は「データベース・サーバ」ではなく、「校正システムサーバ」とのこと。簡単に言うと、校正の履歴や作業中のファイルなどが管理されている。ユーザー向けの配信はウェブサーバで行っている。
現在のサーバ構成。ミラーサーバは運用終了している。
問題点
- サービスの全貌が把握できている人がいない
- 管理しているサーバ数が多い(のにエンジニアがいない)
- 校正システムサーバの老朽化
- ●
解決策(香月氏案)
管理するサーバを減らすため、DNSサーバとメールサーバを外部化。
本の未来基金だけでやるのは難しいので、助けてください!というのが趣旨。
やりたいこと
エンジニアコミュニティを作りたい。
現状の校正システムを維持するためのエンジニア。
新システム「実験版青空文庫(仮称)」づくり。
お金の話
本の未来基金には、ざっくり1000万円くらい寄付が集まった。追悼イベント、本の未来基金事業や手数料、青空文庫への移管などで、220万円くらい留保がある。
お金がないわけじゃないから、実作業にはお支払いをしたい。でも、発注能力がないので、まずはそこを助けて欲しい。
質疑応答
Q. ランニングコストは?
A. 恐らく青空文庫が負担することになるが、まだコンセンサスはできていない。別途、有償校正プロジェクトもあるので全額使えるわけではない。
Q. 青空文庫のランニングコストはペイできているのか?マネタイズは必要?
A. 必要。本の未来基金がやるべきところだとは思っている。ファンディングしなきゃいけない。こういった会を通じてパブリシティを高めていきたい。
校正システムサーバの現状について
香月氏の知り合いで、青空文庫のシステム的なところの調査を依頼した宇谷有史氏から、校正システムサーバの現状について説明があった。
2004年〜2005年くらいの構成のまま。
試しに他の環境へ移行してみたら、エラーなく取り込みができた。
今後の課題
- 移行に必要なものの洗い出し
- 移行先の確定
- 移行を手伝って頂ける方の募集
質疑応答
Q. 本文が外部参照されているようだが?
A. まだアプリケーション解析していないので細かいところは分からない
A. やりとりは基本、メールでやっている(青空文庫より)
Q. 校正履歴はどうやって残っている?
A. 情報として差分は残っていないが、できるだけ「何を変えたのか?」をベタテキストで残している(大久保)
Q. 校正システムサーバ上でどういうプロセスで動いてる?
A. まだ見てない
Q.
A. まずは移行が優先事項だと思う
Q. 移行してみたのはデータベースだけ?
A. データベースだけ。phpソースなどは移行してない。
Q. クーロンは見た?
A. まだ
Q. 文字コードはUTFに移行していく?
A. どっちがメインで使われているかわからないが、メインに合わせていくのがいい
Q. データベースの中身を確認できる?
A. 個人情報入ってるので、そのまま公開はできない。お時間いただきたい。
Q. 校正システムサーバが飛ぶと何がやばいのか?
A. 公開前(作業中)の作品が約1万点あり、それが飛んでしまう。
以下、更新中。