世界記録遺産『日省録』、電子版はミスだらけ(下)
本紙は、古書のデジタル入力を専門に手掛けるA社に検査を依頼した。奎章閣の掲示板でミスが指摘された正祖10年1月21日(全5ページ)から22日(全16ページ)と、任意に選んだ正祖12年1月1日(全4ページ)から2日(全14ページ)に限って検査を実施。その結果、計39ページ、7389字のうち42字が間違っていた。毎ページ1件以上のミスがあったことになる。正確度は99.43%(1000字当たり誤字6字)。現時点で一般的な基準値とされる正確度99.9%(1000字当たり誤字1字)に比べ、ミスは許容値のほぼ6倍に達する。
ミスの類型はさまざまだ。最も多いのは、原文の文字と似ている別の文字を使用したケース。正祖10年1月21日付の記事の場合、原文では「處分之不」となっている部分を「處分之下」、「筵奏萬萬」を「筵泰萬萬」と誤って書き写していた。文字を連続して間違えているケースもある。正祖12年1月1日のテキスト2に出てくる「力有贍之之」の「之之」は、誤って「乏乏」と書かれていた。文字の順番を変えているケースもあり、正祖12年1月2日付の記事では「安進績」を「進安績」としていた。
奎章閣情報資料管理部の関係者は「規模が極めて大きいことを考慮すると、ミスの発生は避けられない。ミスの指摘は、年に1-2回、確認され次第反映しているが、根本的な問題解決には予算上困難がある」と語った。
安大会(アン・デヒ)成均館大学教授は「こうしたミスは、『日省録』だけの問題ではない可能性が大きい。この機会に、国史編さん委員会や古典翻訳院、奎章閣などに分散している古典デジタル化事業を、統合管理すべきではないかと点検してみる必要がある」と語った。さらに、原文入力だけでなく、オンライン翻訳事業に対する点検の必要性も提起された。パク・ヒョンム韓国学中央研究院教授は「『朝鮮王朝実録』のような古記録類をオンライン翻訳する場合、古語をそのまま使うケースが多く、市民や外国人が読めなかったり、読みづらかったりする。原文の正確な入力だけでなく、翻訳にももう少し体系的な関心を向ける必要がある」と語った。
全炳根(チョン・ビョングン)記者