(cache) ＳＥＥＮファイルのフォーマット

ＫａｎｏｎやＡｉｒなどのＫｅｙのゲームをインストールしたフォルダの中の　DAT　フォルダを開いてみて下さい。 SEEN.TXT　というファイル（勝手にＳＥＥＮファイルと呼びます）があると思います。ゲームのシナリオはこのファイルの中に入っています。このファイルのファイルフォーマットを調べてみました。途中までしか分かりません（というか、これ以降調べる根気がなかった）でしたが、テキスト読める程度にはなります。
なお、テキストを吸い出すツールは既に存在します。テキストを吸い出すためにこのページを見る意味はありません。
また、このページの内容を確認したのはＡｉｒ通常版、Ｋａｎｏｎ全年齢対象版のみです。
あと、このページ内のファイルフォーマット関係の用語は私が勝手につけたものです。

１．ファイル概要

FILEHADER

DATAHEADER 1

DATAHEADER 2

DATAEHADER n

DATA 1

DATA 2

DATA n

ＳＥＥＮファイル中には複数のデータ（Ａｉｒで９９個）が含まれます。各データはそれぞれ圧縮されています。圧縮よりも、データを読めなくする意味の方が大きいようです。
ＳＥＥＮファイル全体の構造は左の用になっています。先頭から順に　FILEHEADER、データ個数分の　DATAHEADER、同じくデータ個数分の　DATA　です。
リトルエンディアン（上位バイトと下位バイトが逆）で保存されています。

２．FILEHEADER

３．DATAHEADER

これは、データ個数分繰り返されます。１つにつきサイズは３２バイトです。

これも、特別なことはないです。データは圧縮されて保存されているので、圧縮前と後のサイズが記録されています。

３．DATA

ファイルの残りの部分は　DATA　です。DATA　はそれぞれ　DATAHEAD　と　DATABODY　に分かれます。

３（１）．DATAHEAD

各　DATA　の先頭に存在します。長さは１６バイトです。 DATAHEADER　と紛らわしいですか？まあ、私が適当に付けた名前なんで……。

signature　がある以上、他の形式も考慮されているのかもしれません。私は、PACL　以外は見たことがありませんが。 orgsize　と　compsize　は　DATAHEADER　と一緒です。順番が逆になっていることだけ気を付けて下さい。

３（２）．DATABODY

DATA　の残りの部分です。問題はここです。ちょっと分かりにくいので例を出して説明したいと思います。
FC 54 50 43 33 32 00 0F  00 0F 00 85 01 1F 01 0F
Ａｉｒの１番最初の　DATABODY　の先頭１６バイトです。これを実際に解凍してみます。

まず、FC　です。２進数で書けば　1111 1100(2)　です。
それぞれのビットが、立っている場合は１バイト、立っていなければ２バイトの以降のバイトに対応します。
例えば、FC　(1111 1100)　の最上位ビットは　54　に、最下位ビットは２度目の　0F FF　に対応します。
FC 54 50 43 33 32 00 0F  00 0F 00 85 01 1F 01 0F

ビットが立っている場合、対応するバイトをそのまま出力します。６ビット目までを処理すれば以下の用になります。
54 50 43 33 32 00

ビットが立っていない場合、対応する２バイトを入れ換え（リトルエンディアンなので）１２ビットと４ビットに分けます。 0F 00　の場合は　00 0F　になり、000　と　F　に分かれます。これをそれぞれ、d　と　l　とすると、今までに出力した最後のバイトの位置を０として　d　バイト前から　l + 2　バイトを出力する意味になります。
この場合、d = 0、l = F　なので　00　から　F + 2 = 17(10)　このバイトを出力します。
残っている２つの寝ているビット（どちらも　0F 00　を指す）を処理すると、下の様になります。
54 50 43 33 32 00 00 00  00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
となります。くどいですが、00　を１７バイトではなく、00　から１７バイトです。出力したばかりのバイトも繰り返しの対象になります。

次の　85 (1000 0101)　も初めの　FC　と同じように処理します。
最初のビットは立っているので対応する　01　をそのまま出力。次のビットは寝ていて対応するビットは　1F 01　なので、011 = 17(10)　バイト前から　F + 2 = 17(10)　バイト出力……、と繰り返します。
出力したバイト数がヘッダの　orgsize　になれば終了です。

展開したデータはシナリオをエンコードしただけだろうから、解析すればシナリオの改変もできるかも。
誰かの役に（立つわけないけど）立てば、嬉しいです。
間違い等ありましたら、教えて下さい。
一応、プログラム書いてみました。上の処理を行うだけです。使い方は同梱の　readme.txt　を見て下さい。

オフセット	名前	サイズ	備考
0x00	signature	0x10	シグネチャです。先頭４バイトが　PACL、残りは　'\0'　です。
0x10	datanum	0x4	データの個数です。
0x14	unknown	0xC	使われていないようです。全て０です。

オフセット	名前	サイズ	備考
0x00	name	0x10	データの名前です。SEEN000.TXT　のようになっています。
0x10	offset	0x4	対応するデータのファイル先頭からのオフセットです。
0x14	compsize	0x4	対応するデータのファイル中でのサイズです。
0x18	orgsize	0x4	対応するデータを展開した時のサイズです。
0x1C	datatype?	0x4	分かりません。１です。

オフセット	名前	サイズ	備考
0x00	signature	0x8	４バイトが　PACL　残りが０です。
0x08	orgsize	0x4	データの展開した時のサイズです。
0x0C	compsize	0x4	データのファイル中でのサイズです。