【供養シリーズ】過去の教えて!gooへの投稿全てをカテゴリ別をオフライン保存するスクリプトを公開（有料）

shokuan

2025年9月16日 17:01

こちらはクラウドワークスで募集されていた内容を作成し契約を試みたが、
契約には至らなかったので、そのプログラムを有料で公開するという試みです。

ウーバー配達員より

冒頭：背景とモチベーション

「教えて!goo」が2025年9月で終了するニュース
数学カテゴリを全部保存したい需要
募集されてたので勝手に作り、応募したが買ってもらえなかった
せっかくなので供養として公開（ただし note 有料部分に）

できること

教えて!goo 数学カテゴリのQ&Aページを自動ダウンロード、数学指定のみではない全カテゴリにも対応
保存形式は プレーンHTML（リンク書き換え済み）
必要なCSSや画像もローカル assets/ ディレクトリにまとめるので オフライン閲覧可能
日付ごとにディレクトリが分かれるので、整理されてアーカイブになる
大量のURLを 並列ダウンロードして高速処理

保存されるフォルダ構成

site/
└─ 数学/
   ├─ 2015/01/01/8876310.html
   ├─ 2015/01/01/8876340.html
   └─ 2025/09/12/14126484.html
out/
├─ index.tsv   （処理ログ）
└─ logs/       （失敗リストや parallel の joblog）
assets/        （CSS, JS, 画像）

実行に必要なもの

環境：macOS または Linux
必須コマンド：bash, curl, grep, sed, awk, gzip, GNU parallel

実行方法

1. URLリストを作成

保存したいQ&AのID範囲を urls.txt に書く。

https://oshiete.goo.ne.jp/qa/8876310.html
https://oshiete.goo.ne.jp/qa/14126484.html

もしくは、

$ ./gen_url_list.txt

にて作成。START_IDを小さくすればするほど昔のものが対象になる。最小は当然1。

2. 単発テスト

./worker_math_only_local.sh https://oshiete.goo.ne.jp/qa/14126484.html

→ site/数学/2025/09/12/14126484.html が保存される。

3. 並列で一括保存

JOBS=12 ./fetch_math_only_local.sh urls.txt

JOBS は並列数（CPUコア数に応じて8〜32推奨）

注意点

サイトに高負荷をかけすぎないように、JOBS は常識的な値にしてください。
一部の古いページは既に404/410で取得不可能です。
公開終了後に閲覧できるのは ダウンロード済みHTML と 保存したアセットのみです。

終了するサービスの記録を残したい人はどうぞ、
まだギリギリ間に合うかも？興味ある人は自己責任で利用してください。

ダウンロード

ここから先は

24字 / 1ファイル

¥ 1,000

ログイン

この記事が気に入ったらチップで応援してみませんか？

購入者のコメント

コメントするには、ログインまたは会員登録をお願いします。

【供養シリーズ】過去の教えて!gooへの投稿全てをカテゴリ別をオフライン保存するスクリプトを公開（有料）

冒頭：背景とモチベーション

できること

保存されるフォルダ構成

実行に必要なもの

実行方法

1. URLリストを作成

2. 単発テスト

3. 並列で一括保存

注意点

ダウンロード

ここから先は

購入者のコメント

ネットケイバのHTML収集

ローカル音読ちゃん

3行日記 │ 捌いた…！捌ききったぞ…！

【コードあり】非エンジニアの自分がGoogleAppsScriptフル活用して、見積・請求書の自動発行システムを作れるようになるまで

PDF分割、PDF結合が、こんな簡単な方法で、無料でデキるなんて・・・

プログラミングをしないAIプログラミングの本、裏話を公開!

有料記事

先着10名様限定：5垢分のX素材を提供します｜すぐに使えるXの予約投稿ツールのAPI設定を代行します

NWONG-動画単品-その瞬間《とき》を待つ-shimashie-

【GAS初心者向け】Threads APIの動画投稿で沼るな！数日を溶かしたエラーの犯人と、一つの正解

（自作）Webページ内ファイルダウンローダーとは

開発環境（2025年9月版）

『ClaudeCodeで、流動的なローカルアプリ基地局を作ろう』講座「Sponsored by goukaku.ai」

個人でアプリ開発開始

2025-08-27 ハッカーニュースまとめ読み

【無事ログ】 くるっているかもしれないが

Pocket からの乗り換え先に最適？Self-host できる Wallabag の魅力

裏アカを開設したでゲス（ゲス顔）

0819

LP（ランディングページ）もAIでサクッと作れる話

フォーム入力は、もう自分で自動化できる時代

デジタルミニマリスト目指してアプリ作り

副業とギャンブルを辞めて空いたと感じる時間。

2025/08/25時点でのハンドボール人的実装のベストプラクティス

OpenAIのCodex CLIがスゴかったのでUdemyコースにしました【割引きクーポンあり】

モダンPHP開発の追体験 vol.4 ローカル環境への実装（管理ページ編）

クラウドワークス全滅

副業をはじめる

バイブコーディング初心者の為のおすすめ入門コーディング(chrome拡張編）

VPSにAI掲示板を構築してみた話（MVP公開）

簡単なことをAIに難しく書かせるのを辞めろ！！！！！

ChatGPT Plus/Pro専用「極楽プロンプト」用の指示文を販売してみたい方へのガイド。

Flow開発ログ2 2025-08-12

在宅フリーランスが体験！宮古島＆アメリカで学んだワーケーションのTips

Kaggleで銅・銀・金メダルを取るプロセス

DeepSeek-R1 の概要

【無事ログ】　くるっているかもしれないが