【重要・緊急】ウェブ魚拓のバージョンアップを行います

ウェブ魚拓のやや大きいバージョンアップを行います。
5/1 AM 7:00~、2~3時間ほどを予定しておりましたが、一旦終了を未定とさせていただきます。再度の修正ご容赦ください。(APIと本番環境との連携がうまくいかないため)

追記 同日19:30終了いたします。


影響は通常サーバー・有料専用サーバー両方となります。
急な予告となってしまい申し訳ございません。

なお取得に影響がありますため月額料金をお支払いいただいているご利用者様におきましては期待通りの結果が出なかったという場合を考慮し、翌月2024年5月末日までご利用停止の際、1か月分の返金請求を理由不問で承ります。

バージョンアップの一つに関しましては、現時点では問題ないですが、今後運用していくにあたって弊社のシステムに影響が起こるかもしれない脆弱性を含みうると考えられる部分があったためです。
予防措置となりますので影響はアップデート以外ございません。

この変更は技術的にはパラメータ1つの変更ですが、
別途事前に無関係な理由で準備しておりましたアップデートに適しておりましたため、そちらも適用いたします。ご要望に関しましては取り入れたものや代替となるものを用意したつもりです。

  1. 取得とその内容に大きな影響があります。
    • 高速化します。
    • 取得中にページを閉じても取得は継続されます。
    • 魚拓を取れるページと取れないページが異なる可能性があります。弊社テストでは現時点で、レンダリングまで到達でき、サイズも時間もオーバーしていずに保存が失敗するページは確認できていません。しかしあくまで試験的なものであるため、問題は出ると思われます。今後ともご意見お願いいたします。
    • HTMLのコンテンツの一部の取れるコンテンツと取れないコンテンツが変わります。特にHTMLElementの背景画像の類は取得ができない場合があります。改善予定です。
    • 画像はほとんどがAVIF(クオリティ60)に変換されます。200×400のエレメントで2000×4000等の画像をpng(クオリティ100)で表示するといったふるまいをするページが増えてきました。これは保存にも表示がかなり厳しいためです。ご容赦ください。なお、AVIFはすべてのモダンブラウザで対応が完了しております。取得の画像が表示されない場合、ブラウザのアップデートをご検討下さい。
  2. 調整中となりますが、取得制限が30回に減ります
    • 取得ミスの減少、コンテンツの肥大化がございます
  3. 試験的な機能としてSHA-256を表示します
    • 補足1 : 単一ファイルにまとめる時以前の保存方法の場合、documentcontentのみSHA-256になるため、期待した値にはなりません。
    • 補足2:これはWeb上のWARC形式等では少し実現が難しい機能と考えられます
  4. 「私はロボットではありません」による精度の向上により、robotの制限を終了します。
    • 主にno-archive等の制限です
  5. 削除に対するカウンタークレームの手続きと、削除済みの魚拓を資料請求をQAに明記します。
  6. その他、バグの修正、URL10000文字まで対応、タイトルの絵文字対応等の機能追加がございます。

以上どうぞよろしくお願いいたします。