消される前にウェブページを保存、「魚拓」の活用術
ウェブページ丸ごと保存術(6)
ウェブページの一部を画像としてコピーしたり、ページ全体を丸ごとパソコン内に保存したりしたいことがあります。その勘所を6回にわたってお教えします。「画面キャプチャーを撮って手書き」と「PDF保存」は必修ワザ。「HTML保存」「魚拓」「Excelのクエリ」といった別の手段も紹介します。
◇ ◇ ◇
ウェブサイトは突然閉鎖されることがあるし、一定期間を過ぎた記事は削除されるニュースサイトも多い。そうしたケースには、ページの丸ごと保存や「魚拓」で対応しよう。
ウェブブラウザーで「名前を付けて保存」を選ぶと、開いているページの素材データ(HTMLや画像など)を丸ごと保存できる(図1~図3)。これにより、オフラインでの閲覧が可能になる。HTMLと画像などが入ったフォルダーは必ずセットで管理しよう。
画像を個別に取り出す必要がなければ「MHTML」という形式で保存する手もある。Chromeなら図2で「ウェブページ、1つのファイル」、Edgeなら「Webページ、単一ファイル」を選んで保存すると、HTMLや画像などがまとまった単一ファイル(拡張子はmhtml)が保存される。
なお、ダウンロードしたMHTMLファイルをダブルクリックすると、初期設定ではEdgeが起動する。Chromeで開くよう変更するには、MHTMLファイルを右クリックして「プロパティ」を選択。「全般」タブの「プログラム」欄で「変更」を押す。開く画面で「その他のアプリ」→「このPCで別のアプリを探す」を押し、Cドライブ→「Program Files」→「Google」→「Chrome」→「Application」を開いて「chrome.exe」を指定する。
削除や改変に備えるなら、「魚拓」や「アーカイブ」
「ウェブ魚拓」はその時点でのウェブページを丸ごとコピーしてクラウド上に保存するサービス(図4~図6)。こうしたサービスで保存することを「魚拓を取る」という。時系列で保存でき、ほかのユーザーが魚拓を取っていれば、そのデータも閲覧できる。
インターネットをクロール(ロボットによる自動情報収集)して世界中のウェブページを自動保存した「アーカイブ」のサービスもある。公開が終了したページや、過去のページを閲覧したいときはアーカイブを検索してみよう。大規模アーカイブサービスの「ウェイバックマシン」は6900億以上のページを保存している(図7、図8)。
最後に、ウェブの表データをExcelでスマートに取り込む方法を紹介する。Excelの「クエリ」機能で取り込むと、元データとの連携を保てる。為替レートのように日々変動する表をボタン一発で最新版に更新できて便利だ(図9)。取り込み方は簡単で、ウィザード画面に従うだけだ(図10~図12)。
(ライター 岡本ゆかり)
[日経PC21 2022年8月号掲載記事を再構成]
関連リンク