-
ネットサービス
-
Internet Archive総合 (web.archive.org) #5
-
UPLIFTで広告なしで体験しましょう!快適な閲覧ライフをお約束します!
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
http://archive.org/
インターネット・アーカイブ - Wikipedia
http://ja.wikipedia....wiki/InternetArchive
------------------
Twitter
https://twitter.com/internetarchive/
関連スレ
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.n...internet/1554553882/
前スレッド
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.n...gi/esite/1628793497/
https://twitter.com/5chan_nel (5ch newer account) - コメントを投稿する
-
【QA】
Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック
Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
Q.寄付したいんだけど?
こちらから金額,一度きりか毎月か,送金方法を選んで寄付してください
https://archive.org/donate
Q.すぐに保存したい場合は?
Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す
https://web.archive.org/save/
Q.アカウント作ったらなんかいいことあるの?
A.ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える
Q.spn@archive.orgにメールでURLを送ったら保存されるの?
A.1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい -
Q.インスタのURLが保存できないんだけど
A.ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます
Q.robots.txtでia_archiverをDisallowしても無視されるの?
A.中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともある。保存できることもあるので確認してみたほうが早い
Q.鯖落ちしてる?
A.ここで鯖状態を見れる
https://analytics0.a...ive.org/stats/wb.php
https://archive.org/stats/
Q.Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何?
A.たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています
Q.Save Page Nowの制限などの仕様は?
A.ここを参照
https://docs.google....tSgpKHu4mk0MnrA/edit
Q.Save Page Nowで保存完了しても保存されたページが表示されないんだけど
A.完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください
ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも -
Q.「The capture is estimated to start in XX minutes.」って何?
A.Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手
Q.The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes.
A.同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります
気になるなら1時間後ぐらいにもう一度保存してください
Q.The server didn't respond in time for https://(保存しようとしたURL)
A.極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります
Q.「You have already reached the limit of active sessions」が出た
A.同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで。1分ほど待てば制限解除される
Q.「This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.」が出た
A.1日に同じURLは10回まで保存できる制限に達したので、また明日(UTC) -
Q.「This URL has been excluded from the Wayback Machine. 」って何?
A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトリごと非表示化の申請をした可能性があります、
ただしURLの保存はできますし、将来的にブロックが解除されて見れるようになる可能性もあります
Q.「Cannot get status of spn2-乱数」のエラーは何?
A.Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください
Q.「404 Not Found」のエラーは何?
A.サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう
Q.「Sorry Job failed」が出た
A.このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください
保存できてない場合はやり直してください -
拒否URL関係まとめ
This URL has been excluded from the Wayback Machine.
https://note.com/
https://gigazine.net/
https://boards.4channel.org/
https://bokete.jp/
https://yoshidakenkou.net/
https://tanteifile.com/
https://motherless.com/
https://www.lancers.jp/
This URL is in our block list
https://finance.yaho...o.jp/brokers-hikaku/ 以下全て
https://movie.eroterest.net/
https://anime.eroterest.net/
サイトの仕様で取れないもの
https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
ArchiveTeamのexcludedまとめ
https://wiki.archive..._the_Wayback_Machine -
アーカイブ済のURL一覧を出力する方法
1. http://web.archive.o.../cdx?url=example.com*&output=txt にアクセス
2. example.comのところをアーカイブしたページのトップページURLに変える。*を誤って消さないようにすること
3. 大量のテキストが出るので全選択してコピー
4. Excel立ち上げてCtrl+Aで全選択して貼り付け
5. 「テキストから列へ」を選んでスペースを基準にセルを区切る
6. セル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりする
同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと
IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず
WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい
LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へ を選ぶことでセル分け可能
引用元: https://exposureninj...ct-urls-archive-org/
https://mevius.5ch.n...esite/1628793497/332 -
>>1おつ
Internet Archive総合 (web.archive.org) #2
https://mevius.5ch.n...i/esite/1475246713/5
5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/10/01(土) 04:24:53.46
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの? -
おつでありんす
-
todayだとヤフーニュースが保存できなくなってる
だからInternet Archiveで保存することが増えた
慶応vs横浜だけじゃない…甲子園目指す球児とファンを悩ます高校野球「パイア問題」とは?
news.yahoo.co.jp/profile/comments/55eb7cbd-6f69-41ed-ab91-6d7a3ebd5d16 -
私も19年前鹿児島県大会の夏、三塁塁審の誤審により三点本塁打となり高校野球を終えました。
主将を務めていた私は何度も三塁塁審へ抗議にいきましたが、塁審は「私が間違う訳がない」の一点張り。
その日に放送されたニュースでもしっかりファウルである映像が映し出されましたが判定が覆ったわけでもなく、
むしろその誤審をした審判は今や鹿児島県高野連の審判長まで登り詰めております。
ただ試合後主審の方が私を呼び出し、「審判も人間だから間違うときもあるからね」と声を掛けられました。
誰が見てもわかる誤審であっても審判長にまで登りつめるためには誤審を認めるわけにはいかない、
審判の方々も会社と一緒でそういったなかでされていて大変なのかもしれないとこの歳になって少しわかってきました。
todayでも↑のコメントを保存したかったなあ… -
盲人でも野球の審判を業務として行えるという実例ですね
-
twitterのプロフィールはwaybackmachineで保存できなくなった
個別のツイートは保存できるけど、コメント欄は保存できないし、いろいろ改悪されたなあ -
tubeupでひたすらサムネイルだけ上げてる奴って何が目的なんだ?
他の人がアップロード出来なくなるから普通に迷惑なんだが -
ニコニコとかYouTubeってarchiveで保存しても動画再生出来ないの?
-
動画サイトが動画直リン保存すればいける場合もあんのか
-
またTwitterのプロフィール取れなくなってるわ
あのさぁ・・・ -
あれ?また取れるようになってるな
非ログイン状態でも見れるプロフィールと見れないやつがある?
条件が分からん -
なんかtwitterのプロフィール保存すると、過去ツイがランダムに表示されるだけで、最新のツイートが保存されてない。
もう訳わからんわw -
archive.orgって画像複数を一括保存とか出来る?
いちいち一つずつURL入力保存しないといけないの? -
>>24
Have you ever wanted to archive all the web pages linked from an email message?
Well, you are in luck because now you can forward that email to savepagenow@archive.org”
and after a few minutes you will get an email back filled with Wayback Machine playback URLs. -
>>7
>
> サイトの仕様で取れないもの
> https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
> https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
>
↑今春までならtodayで取った完全アーカイブをarchive.orgへ再取り出来たんだが拒否URLにされたのか弾かれるようになってしまった。。
-
前スレ埋まってないんだから前スレに書きなよ
-
dclogもサービス終了
-
>>29
終了告知から終了まで1か月もないとはひどいサービスだな -
音楽レーベル、デジタル化されたレコードコレクションをめぐりインターネット・アーカイブを提訴
https://www.reuters....llection-2023-08-12/ -
Sheetsのbatch処理ここ数日ずっとqueuedのままや
そんなに使ってる人おるんか -
archiveってpornhubとかエロ動画直リン保存ってしていいの?
-
>>31
日本語記事も出た
ソニーら音楽各社、著作権侵害でInternet Archiveを提訴。SPレコード2749作品以上をデジタル化・公開
https://www.techno-e...2023/08/13/1742.html -
>>33
internet archiveの規約を見た感じ特にルールは設けられてなさそうだけど、
archive teamによるとコンテンツが削除されたり、アカウントが凍結されたりする可能性はあるらしい
余談だけど、archive teamは元々ポルノはネット上で最も分散保存されているコンテンツだからアーカイブしないという方針だったんだけど
wikiの編集履歴確認したら、今年8月からは通常のコンテンツと同様の扱いにするという方針に切り替えたっぽいな
https://wiki.archive...m.org/index.php/Porn -
最近フラッシュのページのアーカイブ見るとruffleっていうSWFエミュレータが起動してフラッシュを再生してくれるようになったな
-
xtubeの動画のアーカイブもなんとかなりませんか
どうせどっかにあるんだろ -
SPN2のAPIのドキュメントに、「anonymous user」って表記があるんだけど、anonymous でAPI叩くには何を指定すれば良いの?
authorizationヘッダを付けずにAPI呼ぶと、
"You need to be logged in to use Save Page Now."
ってエラーになっちゃう。
anonymousの制約で十分だから、APIキー無しで使いたいんだけどな -
>>39
それ、応答を HTML でも返せるところを
Accept ヘッダでわざわざ JSON 形式を要求すること自体が要アカウントっぽいんだよね。
どーしてまたそんな所に匿名ユーザ制限が入ってるのかは解らんけど。 -
現状のSPN2APIはよく分からん仕様が多くて「痒い所に手が届かない」感じなので
あまり深く考えない方がいい -
ヤフー知恵袋、SPNだと取れるのにoutlinksの方だけエラーになってるぽいな
-
ここ最近自動でアーカイブされてないこと多いよな。
御叱りでも受けたか? -
>>14 イーロンの仕業か。
-
久々に SPN2 API のドキュメントを見返していたら、
/save/ に新設のパラメータがあることに気づいたぁ。
use_user_agent=<XXX>
Use custom HTTP User-Agent value when capturing the target page.
2022-07-28 日付けの版で追加されてたのね。 -
Sorry Job failed
と表示されるarchive.orgのページが保存される謎バグに遭遇して笑った
ただの表示バグだと思いたい -
Atwikiってspn で取れなくなってる?
エラー吐いてる -
おま環じゃなかったか
アニオタwiki消えそうだから保存しようとしたんだけどなー
Archiveboxで自分でwarc取るしかないか
センキュー -
HTTP status=403
atwiki側が意図的に排除してる
エラー吐いてる、だけじゃ何もわからんな -
atwikiって前は取れた気がするけど
方針変えたのか? -
https://web.archive....wiki.jp/aniwotawiki/
403から200に戻ったw -
Googleだとなぜかhttpの方がインデックスされてるせいで繋がらないな
というかいい加減httpからhttpsに転送するようにして欲しい -
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.n...esite/1628793497/975
975 名前:名無しさん@お腹いっぱい。[] 投稿日:2023/07/24(月) 07:55:27.47
放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう
↑エアプ野郎w -
http://homepage2.nif...J-R/enjoy%20pich.htm
↑のアーカイブを見ようと思ったら「This URL has been excluded from the Wayback Machine.」となってて、つまり除外設定されてるんだけど
これの理由(誰が、いつ申請したか)を知る事って出来る?
禁止しているドメインの一覧は多分↓なんだろうけど、このページ自体は2019年くらいから作られるし、リストに追記される理由とか何も書いてないから詳しくがわからん
https://wiki.archive..._the_Wayback_Machine
個人が作るHPスペースをまるごと除外設定するのが通るのは、インターネットアーカイブの目的としてもちょっと勘弁して欲しいなあ
個人HPこそ後世に残したい -
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
https://web.archive....e/dat/1608930977.dat -
>>57
理由は公開されないけど基本的にサイトの管理者が除外申請した場合だね
確かにアーカイブの目的には反してるが、ここをしっかりしないと著作権侵害で突かれる可能性があるので
あとexcludedであってdeletedではないのでIAには残ってるはず、オンラインでアクセス不可になるだけ -
YouTUbeの再生ページがアーカイブされるの遅過ぎだろ。
何やってんだよインターネットアーカイブに保存する人は!全然チェックされてないじゃん!
やる気あんのか?寝てたのか?
どうして誰も保存しないんだ?自動アーカイブはどうした?
https://www.youtube..../watch?v=jjZEQ9Nocp4
https://www.youtube..../watch?v=lnlyZlIRO1U -
YouTubeの再生ページがアーカイブされるのがかなり遅いケースがもう10か月以上も続いている。
公開から10時間後とか。
自動アーカイブはどうしたのか? -
5chをアーカイブしてもエラーページになる事が増えたなぁ
重くなってるのか? -
一番上に書いてあるvideoとかmusicってなんですか?
いろいろありますけど保存してもいいんですかね? -
昔と違い私的理由で使う人が多すぎて
ゴミ集積場化が止まらない -
>>64
同感
たとえば「【文春砲】令和の米騒動、現場写真がリークされる」というスレッドも
8月31日の11:32:22は保存できているのに、それ以降はエラーが起きて保存されていない
web.archive.org/web/20230000000000*/https://nova.5ch.net...vegalileo/1693474206 -
同じスレを何度も保存する意味あるの?
-
1000までいってないなら意味あるんじゃない
-
もう「なんでも実況(ガリレオ)」板のスレは過去ログの魚拓とれないのかもな
【悲報】安倍晋三語録、「同意」を表すものが存在しない
nova.5ch.net/test/read.cgi/livegalileo/1693837620
IAではserver errorとなるしアーカイブトゥデイでも「Not Found (yet?)」となる → archive.is/I6WEN -
昔の魚拓見ようにも重いのかエラー出るな
-
>>71
nova.5ch.net は 7 月から継続的に DDoS 攻撃を受けているサーバのうちの一つ。
その対応で、おそらく日本以外の IP 向けに L4 レベルのアクセス制限を掛けている。
https://agree.5ch.ne...erate/1673084281/16- -
【悲報】17歳の上玉白人美少女ちゃん、交通事故の罪で終身刑を言い渡される
nova.5ch.net/test/read.cgi/livegalileo/1693978274
このスレもサーバーエラーで魚拓とれなかったからグーグルのキャッシュ経由で魚拓とった
archive.li/pGUd4 -
家のWi-FiでCONNECTION REFUSEDしか出ないから試しに携帯回線につなぎ替えたら普通に繋がった。
手動で取ってただけでアク禁にされたのか -
>>76だけど半日くらいで解除されたっぽい
-
>>73-74
eggもエラー起きるな -
Twitterまた取れなくなってね?
-
前スレのころ20分ぐらいつながらないことがあったが、
それ以上に長くつながらない・・・ -
81の件、ようやくつながった
-
twitter、じゃなくてX取れなくなってるな
個別のポストはtodayの方で辛うじて取れるが -
twitterで良くね
Xとか勝手に名称変えたアホ以外誰も言ってねえわ -
ジャスコ、ダイエー、サティ、ダイヤモンドシティ、イオン、
-
前スレ955への返信だがグーグルキャッシュなどを経由すれば
好き嫌いドットコムのコメント欄も魚拓とれる場合がある
webcache.googleusercontent.com/search?q=cache:syMmr8fOqbkJ:https://suki-kira.com/people
/result/%25E3%2582%2586%25E3%2581%259F%25E3%2581%25BC%25E3%2582%2593 -
ツイートと付随する動画像をCSVでまとめて落とせる国産ツールない?
イーロンになってからアーカイブサイトにいれるだけじゃ不安だから、自前で持っておいて必要に応じてアップできるようにしたい -
Batch process Google Sheetsがabort出来ないバグ何とかしてくれ
相手側に負荷がかかってたらどうすんだよ -
やっと止まったわ、遅すぎ
-
5ちゃんも有料化云々でヤバそうだし
スレアーカイブしといた方が良さそうだな…
そろそろ消えそうな予感 -
Attempts to archive this video failed.
はなんなんだよ -
savepagenowを実行したあとにgoogleのサポートページ?に飛ばされるのはどういう仕様?
-
twitterの記録取れなくなるのは将来に禍根を残すと思うわ。
数百年後に歴史を振り返った時にSNSは史料的な価値があると思う。 -
今のツイッターって?failedScript=vendorつけても無理になったの?
-
フウーεε=( ~ε~ )y-゚゚゚
-
teacup. byGMOレンタル掲示板あんま残ってねえな
-
もう5chの過去ログ課金しないと見れないっぽいね
-
>>99
現役鯖の分はまだ落ちてくるけどなぁ
https://mevius.5ch.n.../1628/1628793497.dat
/oyster/ 以下のディレクトリインデックスが掘れなくなってはいるが -
Sorry
Cannot resolve host ipv6.icanhazip.com.
IPv6 の名前解決ができなくなってる -
todayがちと重い
-
>>99
単純に重いだけじゃない? -
今繋がらないんだけど、私だけですか?
-
Wi-Fiに切り替えたら繋がった。
どうやらアク禁らしい。
普通に閲覧してただけだし、何も心当たりないんだけど… -
>>105
その「閲覧」もヤバい -
人間レベルの閲覧でアク禁になるなんて聞いたことないが
ただの勘違いじゃないの? -
画像が大量にあるページでそのほとんど取れてなかったりするとすぐ開けなくなる
-
>>109
> 画像が大量にあるページでそのほとんど取れてなかったり
その取れてない画像、全て/save/にリダイレクトされてるから
結果として大量にアーカイブ要求を発行することになるんだよね
んで、その時にアーカイブされるのは3つ程度であとは全て429エラー
運が悪いとそのままアク禁 -
>>99
過去ログについては一応、2chSCへも殆どがミラーされてるはずだけどな…。 -
油断は禁物
あとpink系は全部だめ
5ch新設板系も全部だめ -
scはクロールされてるなと思って後で確認すると途中でクロールが止まってそのままというのがかなりある
こういう状態になるとクロール再開しないケースが多く5ch側が飛んだ時に頭のほうしか控えが取れてなかったりする -
過去ログ、今年中は見れない可能性あるらしいな・・・
0119Ace ★
2023/10/13(金) 09:40:26.65ID:CAP_USER
過去ログについてですが、現状はアーカイブ圧縮状態で
展開再配置は相当に時間がかかる見込みです。
完了は年を越す可能性もあります。
https://agree.5ch.ne...erate/1697113482/119 -
たまに総アーカイブ数が294 billionって表示されるの何なんだ?
-
>>112
一応なんG板とか、2014年春以降に新設された板でもSC側のbbsmenu一覧ページに追加されてないだけで、
[ http://tomcat.2ch.(えすしー)/livegalileo/ ]
…の鯖名から開けばアーカイブされてたりするけど、PINKともども最近の過去ログについては本鯖のモノが未だ活きてる。 -
X保存できるようになってる
-
X保存できるようになってる
-
X保存できるようになってる
-
連投すまん
ミスった -
video.twimgとれなくなった?
-
>>123
普通に取れるけど -
こんなのがいつのまに
2022年11月18日 23時00分レビュー
無料&広告なしで個人サイトを作成できるGeocities風サービス「Neocities」を使ってみたよレビュー
https://gigazine.net...cities-free-website/ -
利用者の多いコンテンツの生殺与奪を特定小数人が握ってるのは危なっかしいよな
https://hayabusa9.5c...newsplus/1698901347/
まあつべはバックアップを隠し持ってそうだけど こんな金になりそうなもん手放さねえだろうし 一般人が直に利用できないだけで -
日本の書籍が著作権ありのもたまにいいのがアップされてたのが、騒動以後いっこもアップされなくなったなあ
結構暇つぶしにいいのに -
質問です
・今開いているサイトの魚拓をワンクリックで取る方法はありますか?
(いちいちInternet Archiveのサイトを開いてコピーしたURLをペーストして決定を押すのがちょっと面倒です
)
・サイト全体(orサイトの複数ページ)を自動で保存してくれる機能はありますか? -
>>128
公式のページで使えと書かれている拡張機能
https://chrome.googl...adcjpehmlllkndpkmiak
https://chrome.googl...hedmeklebabdgagipbia -
どうしてもすぐにアーカイブしたい動画があるならtubeupを使って自分でうpするか
Yt-dlpを使ってメタデータを含めてローカルに落とすのが理想や! -
ArchiveTeamは特定の動画(削除の危機がある, ニュース, 政治etc)に限定して保存してるから、保存したい動画は手動保存する必要がある
リソースは有限だからね
↓詳細
https://wiki.archive...ex.php/YouTube#Scope -
Wayback Machineに保存されてるそこそこ古めのページを表示すると、一部の画像が表示されない事ってよくあるよね。
あれって何でああなってるの?たとえば以下のページなど。
https://web.archive....rdriller/page01.html
このページは2002年保存だけど、比較的新しい2010年とかに保存されたページでも同現象になってたりする。
当時保存した人も、ちゃんと保存できてるか確認して、当時は問題なく表示されてたんだと思う。
今俺たちが保存してるサイトも、10年後には画像がところどころ抜け落ちて不完全な状態になるのかと不安。 -
確認されてないから画像が抜け落ちてる
-
>>134
そもそも Internet Archive でヘッドレスブラウザを実装したのがほんの数年前のことで、
それまでは指示された単一のファイルをアーカイブするだけだったから。
アーカイブされた HTML をクライアント側のブラウザで表示したときに
個々の画像等の保存リクエストが Internet Archive へ発行されるような実装が
なされたこともあったが、それ自体も 2010 年代中盤だったはず。 -
そうかなぁ?
俺はInternet Archive側にある画像ファイルが何らかの理由で勝手に消滅したと思ってる。
以下のサイトとかもそう。画像が1つも保存されてないのはおかしいだろ。
https://web.archive.....co.jp/fr/index.html -
昔のエッチサイトで自分が見たいところだけ抜け落ちてる悲しみ(´・ω・`)
-
IAのアーカイブって色んな団体のアーカイブがまとまったものだからな、SPNなんてごく一部だよ
画像も収集してる団体もあれば、HTMLだけを取得してる団体もあるのでアーカイブ次第
例えばウェイバックマシンを使ってるとよく目にするCommon Crawlはほぼ画像が取得されてない -
確実に保存したい時は
InternetArchiveとArchive.todayどっちもアーカイブしてるわ
それで大体残ると思うけどどうだろ -
>>141
それで精度だったり保存量にばらつきがあるんすね -
ここ最近自動アーカイブがされてないようだけど一体どうしたんだ?
-
>>145
クッキー喰ったことにすればアーカイブはできるな。
使うのは API の capture_cookie パラメータ。
https://web.archive....net/Games/hgames.php -
えっ?年齢認証のページも保存できたの?初めて知った。
以前、以下のページを保存したかったけど諦めたんだ。
https://www.konami.c...games/pcemini/jp/ja/
もしこのページ保存できるなら、上部メニューの8ページほど保存しといてほしい。もしくはそのAPIの使い方を具体的に教えてほしい。
まだ誰も上手く保存できてないみたいだし。 -
保存したい気持ち、解るなぁ
https://web.archive....games/pcemini/jp/ja/ -
>>146
すげえ、ありがとう -
If something goes wrong please click here to send us an error report.
ってやつ、下じゃなくて上に配置してくれないかな・・・
何回誤送信したか分からん -
twitter保存できないことが最近増えてるみたいだけど、archivetodayでも保存できない場合は、cacheリンクをぶち込むと保存できるでー
-
twitter以外の保存できないサイトも、
https://webcache.goo....com/search?q=cache:保存したいリンク
をWabackmachineに入れればキャッシュを保存できる。 -
認証要る系は無理
-
twitterならnitterで良くね?
-
リダイレクトページを保存して過去のアーカイブ上書きして使いづらくする問題
なんで放置されてんだよ! -
俺も基本nitterキャプってるなTwitter取得する時は
-
"The requested video has been archived but is not currently available for playback."と"Attempts to archive this video failed."が出たときが一番ダルい
-
イーロン・マスクのせいで、1tweetごとにarchiveしないといけなくなったけど、
より問題なのは、tweet群が本人の削除やアカウント停止などで消されてしまったら、
archiveがあってもtweet同士のつながりがわからなくなること。
以前はtweetを1カ所か何カ所かwayback machineで押さえれば、スレッド丸ごとarchiveできたのに。 -
何度保存しても「Hrm. The Wayback Machine has not archived that URL.」が出続ける。
-
SPNって一日1000ページ保存が上限なのか。初めて引っかかった。outlink込みでやってたからか。
あと最近頻繁にログアウトしてしまうんだけどこれも不具合なのかな。 -
>>162
戻る可能性もありそう。
ツイッターの閲覧制限 「経済的な理由という指摘もある」と辛坊治郎
https://news.1242.com/article/448206
Twitter閲覧制限 の理由:データスクレイピング の全てを わかりやすく 説明します
https://sotatek.jp/b...tter-new-view-limit/
「情報はタダじゃない」訴える意図? Twitter閲覧制限 “スクレイピング”…サーバー負荷にマスク氏不満か
https://news.ntv.co....4432a4ae38cecc2a2cf4
【解説】ツイッター“閲覧制限”なぜ? 考えられる2つの理由 マスク氏の狙いは
https://news.ntv.co....431889171d51800beb37
Twitterの閲覧制限が起きた理由|今後のビジネスへの影響は?
https://blog.formzu.com/twitter_limit -
イーロンの野郎また何かやらかしたのか。
-
どっとうpろだ.orgサービス終了かよ
知らなかった -
忘れた頃に消えてくれるからお世話になったなぁ・・・
長いことおつかれさんでした -
saveできない状態
-
普段は「Not Found」が出ても何遍か更新すると正常に戻るが、今は何遍更新しても・・・
-
マジか。保存対象URL側に問題あるのかと諦めて魚拓で済ましたけどIA側の問題だったのか
-
URL側の場合は「Not Found」というか普段から「このURLは保存不可」的なのが出るが、
今はどのサイトを入力しても「Not Found」 -
今日朝からnot foundだったから来てみたらおま環じゃなかったか
-
ようやくできるようになったが、4時間待ち(待ち時間は環境によるだろうが)
-
復活したけど、これじゃ今日のページ存できないな
The capture will start in ~7 hours, 39 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved. -
待ち時間未明よりは減ってるが、まだ1時間待ち(環境によるだろうが)
ただし、PDF絡みの取得は問題なし -
重い
-
14 hoursとか取得時間かかりすぎ
-
やっと直ったか
-
ページを保存しようとしたら
The capture will start in ~3 hours, 5 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.
と言われて、まだ終わらないけど、MP4動画単体を保存したら瞬時に保存された。
2023/12/03(日)19:39:14
URL: https://video.twimg....WJL1FSGpy8aLWnvc.mp4
Job: https://web.archive....7f4e7c9b1139d337b0d8 [success][0.29s][初]
成功: https://web.archive....WJL1FSGpy8aLWnvc.mp4 - 2023/12/03(日)19:39:15 -
>>183
.jpg とか .png とか .zip とか、ヘッドレスブラウザでレンダせず
ファイル単体を保存するだけで済むものはそんな感じ。
.pdf も outlinks の走査はされるけど何故か速い。 -
でた蔵の過去のテレビ番組のアーカイブ2022年12月以前の削除されちゃったんだな、最悪
gooといい価格コムといい削除するなら最初から公開しなきゃいいのに
NHKも一時期過去の番組表見れないようにしてたし何の目的なんだろうな
維持するのも金がかかるのかねえ -
更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。
https://wezz-y.com/archives/95862 -
更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。
https://wezz-y.com/archives/95862 -
こんな糞重いクルクルクルクルしてるだけのゴミクズサイト
すでに2億円も寄付されてるの糞受けるな
裏金アベノイミン党みたいな連中だ -
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.
saveできない
また逝ってるのかな -
またエラー吐いてる・・・
-
まーた404 NOT FOUNDだぞー
-
OH!! NO!!
-
やっと復旧した
┃ 午前9:18 ・ 2023年12月6日
┃ https://twitter.com/.../1732192819098292677
┃ Jason Scott @textfiles
┃ Power has gone out at the @internetarchive primary datacenter; waiting for it to return.
┃ 午前10:04 ・ 2023年12月6日
┃ https://twitter.com/.../1732204429066289608
┃ Internet Archive @internetarchive
┃ Sorry, http://archive.org and http://openlibrary.org will be back in a few,
┃
┃ but a short term power outage was long enough to make recovery take a little while.
┃
┃ We apologize.
https://twitter.com/thejimwatkins -
停電多すぎね?アメリカってそんな停電するの?
-
ここ何日か>>195のような表示がそのときそのときで出たり出なかったり
取得そのものができないよりは増しとはいえ・・・ -
>>196
やっぱそうだよね、自分の環境のせいかと思ってたけど -
Donateしまくらなきゃな
-
11 時間 42 分経過、結局アーカイブされてなかったからリクエスト発行し直した。
てゆーか 10 時間とか 20 時間とか言われても、数分後に同じ URL のアーカイブを
再リクエストしたらタイミングによってはすぐ保存してくれることもあるので
こういう時はやり直すのが正解だと理解することにした。 -
緑色の一日おき程度に取得した不完全なのを見かけるけどこういう事象の跡なのね
-
Save outlinksで取得出来るページ数減らされてる…
-
何個まで?
-
まあここ最近、調子悪いからな。
しばらくすれば元に戻るかも。 -
近い内にサーバー飛んでサ終かもな
-
Sorry
You cannot make more than 100 captures per day. Please email us at "info@archive.org" if you would like to discuss this more. -
なんかめちゃスムーズにspnリクエスト送れるようになってる
昨日ぐらいまでめっちゃ糞詰まり起こしてたのに -
Sorry
Job failed
ってIAの画面がアーカイブされてる?ときって失敗ってことなんかな -
せっかく>>206と思ったら今度は・・・
今までの1割とは落差がでかい -
何回やってもどのサイトでもsorryになって保存できない
-
ろくに英語も読めないのにここでアーカイブ取ろうとしてるからだよ
-
?
日本語のサイトしか保存した事ないけど…
つか1日100件なんて保存してないのに⇓が出る
前にキャッシュcookie消去したらarchiveでの履歴も消えちゃったから消すの嫌なんだけどなあ
Sorry
You cannot make more than 100 captures per day. Please email us at "info@archive.org" if you would like to discuss this more -
100件も取得してなくても出るとか・・・ますます謎
-
画像とか含めてじゃないの
-
>>207
同時実行可能なセッション数も微妙に調整してますね
2023/02/18(土) {"available":6,"daily_captures":0,"daily_captures_limit":100000,"processing":0}
2023/08/21(月) {"available":6,"daily_captures":0,"daily_captures_limit":80000,"processing":0}
2023/09/06(水) {"available":6,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/09/29(金) {"available":8,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/11/23(木) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2023/12/12(火) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0} -
一方、アカウントなしの場合は>>4にあるとおり1分あたり3件
昨年の途中まで4件、今年でもわずかに4件だったことも
https://mevius.5ch.n...esite/1628793497/453
https://mevius.5ch.n...esite/1628793497/637
https://mevius.5ch.n...esite/1628793497/729 -
「日付」が切り替わってカウント数が0に戻るのは日本時間朝9時です
-
SPN2APIでリファラーって送る方法ある?
-
無いね
ページ内で使われてる画像なんかには送られてるみたいだけど -
>>222
無いか〜・・・、サンクス -
nitter.net保存できなくなってる。
nitter.czならtodayの方で保存できるが -
Twitterはもう保存できなくなったのか?
保存した後、だいぶ経ってから保存されているはずの日付を見に行ったら中身が何もない。
そういうのばかり。 -
Twitter側の仕様変更のせいで見た目はアーカイブできなくなった
ソースを見るとツイート内容はアーカイブされてるっぽい -
本家のtwitter.comも、nitter.netもウェイバックマシンでは保存できなくなってる。
今は、nitter.czをarchive.todayの方にぶち込むしか方法がない。 -
今でも更新続ければ保存はできるけど、数日待たないとできなかったりで安定はしない
-
登録しても制限をかけるなら、有料プランを導入してくれ
-
最近すこし保存しようとして更新するとすぐアク禁されて駄目だわ
-
アク禁ってされたことないんだけど、どんな表示でるんだ
-
アク禁ってされたことないんだけど、どんな表示でるんだ
-
すまん連投になってもた
-
2〜3秒に1回位のアクセスに抑えておけばまずアク禁はされないと思うが
-
アーカイブチームの皆さんは自分の事しか考えてないの?
あれだけ顧客第一つったろ! -
次はアーカイブチームとインターネットアーカイブは無関係って事を覚えような
-
自動保存できなくなったの?
-
https://archive.is/rt7gI
Archive.org is DOWN for everyone. -
SPNとSPN-outlinksで結果が変わるの謎過ぎるな
SPNだと取れるのにoutlinksの方はエラーが出るサイトがたまにある
わざわざ別の環境使ってるのか? -
と書いておいて何のエラーか一切説明しない低能
-
archive.todayのほう死んでます?
-
一時間くらい前、ぐるぐるアイコンを表示したままリロードを繰り返す状態だったな。
-
アーカイブ開こうとすると実アドレスの方に飛ばされる症状が出てる
アーカイブに保存された形跡はある ただこれも保存済みアドレスが検索で出たりでなかったりがある -
既出だったらスマン
アーカイブされたページ自体をユーザ側のアクションで検索エンジンのインデックスに登録することって可能なんかな
検索してみるといくつかの日本のサイトのアーカイブがGoogleにインデックス登録されてるんだよな
でもWaybackが自分でクロール申請したはずはないから何か方法があるんじゃないかと思ってる
例えば自分で立てたサイトにアーカイブへの直リンクを貼っておいて、自分のサイトをインデックス登録してリンク先をクロールさせるとか -
うまいことpixivのアーカイブ取る方法はないものか
-
そんなにSPNの条件厳しくなったのか
-
昔このスレに居たスポーツ新聞野郎なら発狂してる事案w
-
ログインしても数個取るとすぐログアウトさせられるのはおま環?
-
クッキーを消した、有効期限切れ (一年間)、それ以外の原因でのログアウトは無いな。
-
Save Page Now browser crashed on http://naenara.com.k...main/index/ja/first.
-
IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?
-
IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?
-
ごめんダブった
-
>>260-261
タイムスタンプ部分とディレクトリ名末尾に "*" とか
https://web.archive.org/web/*/www.sqlite.org/2023/*
検索対象の母数が一万件を超える場合は CDX Server API でリストを出してから
ローカルで抽出とか
https://mevius.5ch.n...e/1628793497/332-333 -
>>263
リプありがとうございます。
せっかく教えてくださったのに、自分の説明が足らなくて分からなかったのですが、やりたいことはこんな感じです
たとえば、↓のshow allを開くとディレクトリ内のコンテンツが表示されますが
その中のG71-VNW1013.isoを検索して見つける事はできますか?
https://archive.org/...r-driver-and-utility
https://archive.org/search
に入力して検索をした場合、タイトルや説明欄しか拾わないので
どうしたものかと思っていました -
>>265
そっか…ありがとうございましたm(_ _)m -
検索システムはもっと強化してほしいよなぁ
一度も閲覧されてない化石と化したアーカイブとか大量にありそう
まぁあまり強化するとDMCA案件が増えそうなので悩ましいけど -
ログインしても同時保存制限厳しい…(4つまで)
あと、一気にまとめて取得する方法ってないの?一個一個やってると面倒臭い -
>>268
savepagenow@archive.org に電子メールを送信/転送するとメール中のURIをアーカイブした結果のメールが数~数十分後に返信されてくる -
「ウェブ魚拓」や「archive.today」では保存できるのに「wayback machine」ではできないということは、
Xは「wayback machine」を嫌がっているということか?
ウェブ魚拓
https://megalodon.jp/
archive.today
https://archive.md/ -
別に今でもX保存できるけど
-
>>272
保存した日付のところを見に行った?
たとえばこれ。
Saved 1 time January 13, 2024.
https://web.archive....g/web/20240000000000*/https://twitter.com/.../1745945126793626064
https://megalodon.jp.../1745945126793626064
https://archive.md/clxnV
https://twitter.com/thejimwatkins -
「保存」は出来てるよ、表示が崩れてるだけ
CTRL+Uでソースを見ればツイート内容は保存されてるのが分かる -
https://web.archive..../1747091305128477149
これなんかは動画まで含めてちゃんと取れたことを確認した
https://twitter.com/thejimwatkins -
>>274
見られないなら保存した意味がない。 -
インターネットアーカイブのブログ、ずっと同じ糖質に粘着されてるの笑う
それでも削除しないのは流石だがw -
スラドのアーカイブを取ろうと思ったら、このサイト記事一覧ページって無いのか?
ajaxでmore moreで辿るしか無いんだろうか・・・
もう終わりだよ -
>>278
日付別の一覧、例えば昨日 (2024-01-26) のストーリー一覧なら
https://srad.jp/story/24/01/26/
から
https://mobile.srad....ry/24/01/24/2339228/
https://mobile.srad....ry/24/01/24/2346248/
https://it.srad.jp/s...ry/24/01/24/2351254/
https://srad.jp/story/24/01/25/1337233/
https://it.srad.jp/s...ry/24/01/25/1340217/
・・・
と記事番号とカテゴリ名を含む URL は得られるかと思います。 -
>>273
https://web.archive..../1723541214925029490
これもそうだけど、スマホでなら見られるのにPCだと見られないのはなぜだろうか?
>>275
それはPCでも見られた。
https://twitter.com/thejimwatkins -
あと3日半だから絶望的じゃん
-
月曜日に発表があって週末が1回しかないって急すぎるよ。
しかもスラドってコメント欄がperlのajaxで読み込んでるからアーカイブだとまともに表示できないだろうし -
savepagenow@archive.org に取得したいページのURL送ったんだけど、ほとんどError! Capture timed outになる・・・
これってサーバー重くて失敗したのかな? -
Save Page Now browser crashed
なんかエラー吐いて来るね・・・
取れてる奴もあるけど違いがわからん -
それ Linux バイナリをアーカイブさせると良く出くわすな。
force_get=on を指定すると問題無く行けてるから、おそらく
コンテンツをヘッドレスブラウザでレンダしようとして失敗してるんだと思う。 -
Srad はアーカイブチームが動いてるって見たけど
個人でバックアップしている人もおるんか -
スラド閉鎖撤回したな
まぁ不安定な状況である事には変わらないからアーカイブはした方が良い -
The capture will start in ~1 hour, 1 minute because our service is currently overloaded.
また1時間後とか言われるようになっちゃった・・・ -
個人的に巡回ソフトでアーカイブ出来てたシンプル極まりない頃が懐かしい
-
Save Page Now browser crashed
ヤフオクのページを取得しようとすると出る -
アーカイブしても画像が保存されないのキツイな
昔から収集方法変えてないみたいだけど
運営陣は変えるつもりないんだろうか
色々相性問題とかあって変えられないのかな? -
>>293
大ぼら乙 -
サイトによるのでは
-
今でも画像はアーカイブ開いて取得しないといけない
-
【2020 年頃まで】
画像の保存は完全にユーザ任せ
(クローラを使っていたり、或いは
普通のブラウザでも保存開始後にすぐ閉じたりすると保存されない)
【それ以降】
ヘッドレスブラウザを実装、ある程度の画像は同時にアーカイブできるようになった
>>293 の言う昔って、いつの話よ? -
動的サイトを取ろうとして取れないと勘違いしてるパターンじゃない?
画像は4年前から取れてるし、最近だと自動でアウトリンクまで辿ってくれるようになってるが -
Google検索のキャッシュリンクが廃止で過去のページが閲覧不可に
https://pc.watch.imp...cs/news/1566730.html
>Googleは、検索結果ページで利用できたWebページのキャッシュへのリンクを削除した。
これまで検索結果の各Webページのキャッシュにアクセスできるリンクが用意されており、Webページの過去の状態や削除される前の状態などが確認できたが、このリンクが削除されたかたち。検索演算子「cache:」を使ったアクセスはまだ行なえるが、将来的にはこちらも利用できなくなる予定だという。
これにともないGoogleでは、キャッシュへのリンクに代わって、Internet Archiveへのリンクを追加したいとも考えているという。 -
オープンになったことで話題のBlueskyはarchive.todayで昔のTwitterみたいにスレッド丸ごとアーカイブできるようだ。
ところがWayback Machineでは保存できないみたい。 -
>>300
IAにリンク貼るならGoogleから多額の寄付金もらえそう -
流れをぶった切って済まんが
https://download.sysinternals.com/ 配下の URL にて >>251 に遭遇。
ソフトウェア配布サイトをターゲットにした措置だとは思うが
Sysinternals のようにファイル名にリビジョン番号を記載せず
同じ URL のまま中身を差し替えていくサイトでは、
短期間で更新が繰り返されると保存されないリビジョンが出てくる。 -
This URL has been already captured 6 times today, which is a daily limit we have set for that host. Please try again tomorrow.
10回制限からなんか減った? -
>>306
いや以前は10回制限だったのに6回になったなってだけ -
Wayback Machineってdoc形式のファイルやdocx形式のファイルも保存できるんだね
ホント便利だな -
一日一回のみとか10回のみのエラーってAPIドキュメントには無いよね?
特別に指定されてるんだろうか -
X(twitter)はnitter.czにリンクを変えて、archive.todayにぶち込んで保存してる。
他にも方法あるかもしれんけど -
そういやnitterの開発終了したんだってな
今のところ動いてるインスタンスはあるけど、これからどうなんだろ -
これからどうやってtwitter保存すればいいんだろう
-
youtubeの動画保存って無くなったのか?
youtubecrawlのコレクションは増え続けてるから動いてるはずなんだが、未だに保存されん・・・
国内メディアのニュース動画だからブロックされてる訳でも無いと思うんだがなぁ -
>>315
ホンマや -
>>281 が PC でも見られる、ってことは保存し直しの必要は無しか。
しかしアーカイブの表示内容が変化するってのは、別の意味で気持ち悪い。 -
ページ数、なかなか9000億超えないな
-
今もだけど、たまにアーカイブ数が減るのは何なんだろうか
しばらくすると元に戻るけど -
取得時間がまた2時間とか伸びて面倒
-
ヘッダー部分の下からが表示されないんだねど自分だけかな。キャッシュ消したり再起動しても直らん
-
ブルースカイは、アカウントの設定(ログアウトしたユーザーからの可視性)よっては取得できないから注意
-
セッションハイジャック耐性の無いサイトなら
capture_cookie パラメータ辺り使えば行けるんだけどなぁ -
数日前からtodayの調子が悪くて調べたらcloudflareDNSと相性悪いのか
-
ページを保存させて完了画面も確認したのに、そのページが表示されないな
カレンダー形式の一覧に反映されるまでにはこれまでも時間がかかっていたけど
保存ページ自体が数十分待っても出てこないのは初めて -
今もう一度見てみたら、既にカレンダー形式の日付には青丸が付いているのに
さっき保存した保存時刻(UTC)をクリックしてもその内容が表示されないという現象が起きてる -
最近はよくある
半日くらい待つと出てくる -
i.imgur.comのページは一瞬で保存できるのなんでなんだろ
-
ニコニコ動画のフォロワー欄が途中までしか保存されない問題ってどうすれば解決できますか?
www.nicovideo.jp/user/23396749/follow/follower
https://archive.is/4Efzj
上記のユーザーならフォロワーは僅か40なので情報量が大きすぎるという訳でもないはずなのですが -
5chのnovaサーバーだけ取れなくなってる?
-
今日調子悪い?
-
今日調子悪い?
-
https://nova.5ch.net/livegalileo/
https://nova.5ch.net/novatr/
各板のトップは国外から見られるが、個別スレを開こうとすると 520 エラーが返る。
Internet Archive のサーバは米国にあるから当然エラーとなる。
-
今日は一日繋がらなかったな
-
>>331
じゅんじゅ@\( ・ω・)/ www.nicovideo.jp/user/41124243
元グリーンベレー user/13675361 ・ lalala user/2765923
蘭‐Ran‐ user/18878661 ・ めざすくん user/27507212
わるよい user/3953893 ・ ゆ〜の user/2915294
sou user/11352489 ・ モッチチ user/6511183 ・ 海鼠 user/4114082 -
イモグラの画像、保存できてない時有るな
-
ビタミーナ王国物語以外でイモグラなんてワードを見かけるとは夢にも思わなかった
-
【保存・記録】ウェブアーカイブ総合 Page.02
https://mevius.5ch.n...internet/1700519014/ -
imgur 画像のリファラ検査が始まり、直リンが禁止されてアーカイヴできなくなった。
https://i.imgur.com/8oRShxz.jpeg
↓
https://imgur.com/8oRShxz
ページ内の埋め込み画像はリファラが送られるが、この URL では駄目。
↓
https://imgur.com/8oRShxz/embed
この URL のアーカイヴを保存させればよい。
↓
結果
https://web.archive....gur.com/8oRShxzl.jpg -
dotupがやたらと嫌われてたけど俺はimgurの方が嫌いだわ( ´_ゝ`)
-
Loadingでずっと進まないんだけど
今archive.todayってTwitter保存できないの?
archive.orgの方は出来るみたいだけど
アドレスが長くなるからtodayの方を使いたい
>>342
関係ないけど
リファラ検査で出始めたJaneのimgurサムネイルエラーは
https://egg.5ch.net/...ware/1708963746/185n
で回避した -
>>346
なんだ山下の犬か -
NHKが運営するネット上の特設ページ、続々と運営終了。放送法改正を見据えた動きか
https://internet.wat...yajiuma/1577805.html
2024年4月1日10:00をもちまして、以下特設ページの掲載を終了(番組ストリーミングを含む)いたします。(NHKゴガク)
https://www.nhk.or.jp/gogaku/
NHK、「政治マガジン」など6サイト更新停止へ 新サービスを検討(朝日新聞デジタル)
https://www.asahi.co...75VHPS36UCVL04P.html
NHKやばいな。どんどんデジタルサービス終了させている。声調確認くんとか、凄く良かったのに。デジタル頑張っていた中の人たちが気の毒。(Togetter)
https://togetter.com/li/2334548 -
特許や意匠権の参考文献にURLが記載されてる事って多いんだけどさ
昔のホームページだと404かつ何処にもアーカイブされてないとかざら何だよな
せめてその辺は国がアーカイブしないと将来的に困ったことにならんのか?と思う -
今死んでるな?
-
>>349
この国の政府って困ったことに未来にも過去にも興味が全くないですよ -
>>352
これ特許庁自体は保存されてるけど、参考文献URLまで保存されてるってどこかに書いてある? -
https://archive.org/...es/icon_savePage.png
なぜか "Save Page Now" の前のアイコンが
https://archive.org/about/404.html へリダイレクトされてしまっている。
-
現在繋がらない?
-
15分くらい前まで繋がってたけど今は繋がらないね、Temporarily Offlineだからメンテ中かな
-
503エラーちょこちょこ出るけど、復帰したね乙でした
-
Queue-Itの待合室経由みたいに、いったんリダイレクトされてJavascript動作してから本サイトにリダイレクトされるようなサイトはどうやってアーカイブするの?
save page nowではなくて、自PCでアクセスして表示したページをそのままアーカイブできる機能とかあればしりたい。 -
詐欺紛いのサイトがアーカイブを徹底的に拒否しているのは笑える
https://www.sotwe.com/DuceTCG -
>>360
拒否してるのはサイトじゃなくてTwitterWebViewerの方だった。俺の勘違い -
UAによって弾いてるぽい
-
imgur、画像の直リンは無理だとしても postpagebeta=0 というクッキーを食べたことにして
こういうアーカイブを取れば行けるなぁ。
つまり capture_cookie パラメータを使用。
https://web.archive..../1/imgur.com/EwuqXZU -
これは失敗。
https://web.archive..../1/imgur.com/sBfrwVv
imgur でアダルト判定を食らった画像を表示させて "Yes, I'm over 18" をクリックしたときに追加されるクッキーの中に
over18=1 ってのがあるけど、それも食べたことにすれば行けるかな。 -
おお、行けた行けた。
https://web.archive..../1/imgur.com/fb5LVDx -
SPNではできないやつ?
-
どうも postpagebeta=0 のクッキーだけ送っておけば、
リファラ無しの画像直リンでも OK っぽいな。
>>367
スクリプト使うのも Save Page Now のページを使うのも、やってる事は全く同じなんだけど
後者では入力できないパラメータを送る必要があるんだよね。
https://web.archive.org/save/ を表示させて、次のブックマークレットで入力欄を追加してから
上の欄に imgur の画像 URL、下の欄に postpagebeta=0 を入力してボタンを押せば
たぶん保存できる。
https://pastebin.com/uEZ1Dbqi -
>>368
保存できていたのに保存できなくなったぽい? -
imgur の画像直リンが、クッキーを付けてあってもリダイレクトされるようになってしまったかも。
それでも拡張子の無い https://imgur.com/xxxxxxx 形式の URL を
クッキー付きでアーカイブさせれば、画像にはリファラが送られるので保存はできている。 -
APIでリファラも送れるようにしてくれないかな
cookieやUAは送れるのにリファラは対応してないの何で? -
大文字小文字違いかw
uTKdi8x
UtKDI8X -
archive.today
数日前からX(旧Twitter)のアーカイブできなくなってる? -
>>377
自分も、ここ最近X(旧Twitter)のアーカイブが取得できなくて困ってる。 -
404だ
-
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again. -
またイモグラ保存できなくなったんじゃないだろうな
もうイモグラは使わないでくれ -
OutLinksを使うと保存できてる時もあるっぽいな。
これが原因か? -
いや関係無いっぽいな。
試しにスクリプトが上げてるグ□画像を保存してみたらOutLinksなんて無くても一発で取れた。
取れる画像と取れない画像があるのか? -
ゲッ、いつの間に同一URLの保存回数が一日5回までに減ってやがる…
https://web.archive....atbox.moe/xei3k9.PNG
19年の頃は保存回数制限もなく保存再開出来る時間も10分間隔だったんだがなぁ… -
保存回数上限がホスト毎に決められているけど、回数はURL毎に数えているってことか。
-
そろそろやばいやばいっていわれてるけど、Archive.liがなくなる事ってあるのかね。
そもそもあいつの資金源どうなってんだ? -
運営費がかさむかさむって言ってたし、ロシアでの運営じゃ厳しいだろ。
国を出ないなら、このまま吹き飛びそうだな。 -
【質問】Wayback machineで既に誰かがウェブサイトをアーカイブしていたときサイトのアーカイブは更新されるのか
拡張機能web archivesでwayback machineを選択する→既にアーカイブされている1年前のものが表示される
画像などが保存されていないので現在の最新の状態で完全なものをアーカイブしたいんですが可能なんですかね?やり方がわかりません
gyazo.com/2dea0146024edc6952878c8d25b9b572 -
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると? -
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると? -
アーカイブチーム、いや、いつもアーカイブしている人たちは全員本当にやる気を感じない
YouTubeの動画のページが公開された時、すぐに保存されないケースが多いし。 -
あー重い重い
-
https://www.courts.g...95/088995_hanrei.pdf
グリーの弁護士、Wayback MachineのURL日付部分を日本時間基準だと勘違いして日付が一致しないとか言ってて草
検証の部分でUTC時間だから問題ないとちゃんと反論されていてよかった、ついでに裁判も負けてる -
さっきまでめっちゃ調子よかったのに503
-
てかメンテの表示出てるじゃん。今夜はもう無理かな。
>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。 -
てかメンテの表示出てるじゃん。今夜はもう無理かな。
>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。 -
>>387
そういえば、ちょっと前にyoutube.comの1日の保存上限で8万回?ってエラー出てた。2年ぐらい前にエラー出た時はもっと数字が大きかった気がするけど。
確実に保存したいなら上限がリセットされるはずの日本時間午前9時から早い者勝ちで保存するしかないみたいだが。 -
Tor Browser が Internet Archive の .onion 版が利用可能と検出してるけど
繋がらないんだよね・・・コード 0xF2 のエラーが返る
https://archive6zg5v...mhnyblq4h3ead.onion/
-
またメンテか
次はいつ復旧するのやら -
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。
確認用コード
curl -I "https://web.archive....mg/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。 -
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。
確認用コード
curl -I "https://web.archive....mg/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。 -
Save Page Now browser crashed on https://imgur.com/p5BPbjq.
-
archive.todayってMicrosoftのサーバー経由してるのなんで?
MSのサーバーをhostsで遮断したら保存できなくなった -
>>7
quoraもサルベージできない -
全然違うfaviconが表示されるのってなんなんだろ
-
なんだこのエラー?
task_id must not be empty. Got None instead. -
archiveのアニメをWEBで見てたがすごく遅くて適当にVPNで日本で見たらすぐ見れた
IP規制してる?? -
X(twitter)やインスタを保存するのにオススメの方法があったら教えて。
-
すみません。
twitterアカウントを削除する前に、ツイート削除した場合、該当のツイートは見ることできますか?? -
>>417
ありがとうございます! -
Amazonの商品ページの過去を見ることできますか?
-
>>419
見れる(保存されていれば) -
今落ちてるか?
-
/save/status 以下の状態取得 API が生きてたりしてるけど他は 503
まぁそんな事もあるさ -
現在503になって繋がらないけど他の方々はどうだろうか?
-
一瞬繋がったり503に戻ったり
ダメな日だね -
>>420
確かに昔ブックマークしたのは見れた。 -
最近archive.orgは繋がらないことが多いな
imgurの直リンはarchive.orgでは不可だったけど
archive.todayでは問題なく撮れた
ここ今、運営が頭狂でURLが貼れなくなってるね -
テレビ、ねぇ。
あまり見んからなぁ・・・ -
Yahoo!テレビの番組コメは長年特別扱いのテレ東もしっかり叩かれてたのが良かったのに3月で終わってしまった
-
昨日繋がらなかったのはどうやらDDOS攻撃食らってたからみたいね
https://gigazine.net...e-under-ddos-attack/
そして今現在また503や504になってるがまたDDOS攻撃食らってるのか…? -
今日は増しだと思ったら結局
もはや「まぁそんなことも」なんてレベルではない -
なんでこの時期に突然DDOS…
-
>>430
https://x.com/intern.../1795451463465845141
Internet ArchiveのTwitterを見れば状況が判ったな
archive.orgで撮れなくてarchive.todayで撮れるサイトが近頃多い
Instagramもarchive.orgでは不可だったけど
archive.todayでは問題なく撮れた -
>433
使い方の差ではあるのだろうが個人的にはwebarchiveで出来てtodayで出来ない点として
・大容量zip等とかが保存可能かどうか(todayじゃそもそもzipどころかmp4やmp3すら保存出来なかったような…)
・検索エンジンで足がつくか否か(todayの場合割りと簡単に足がつきやすい)
・そしてwebarchiveで言う所のSave outlinks機能があるかどうか
というのが引っかかってね…(ほぼ鯖側に負担がかかるのばっかじゃねえかって話ではあるが…) -
today運営の素性がわからんしいつ消えるかもわからんしなー
-
>>427
ギャーーーー!!これ今知った!!!
こういうのも貴重な情報だったのに…なんてこった。・゜・(ノД`)・゜・。
でた蔵はちょくちょく、表からのリンク先のページが無かったりするし
起こされた内容もだいぶ偏ってて不完全なのがどうもなあ… -
wayback-gsheetsにアップデートはいってて驚いた
-
>>434
archive.orgで撮って
撮れなかったらarchive.todayを使ってる
todayで撮れてorgで撮れないってどうなのかなって
>>435
それが問題
魚拓サイトなのに魚拓サイトが消えたら元も子もないw
todayはドメインが代わったりして大丈夫なのか感がある
archive.todayはURLがarchive.orgみたいに長くならないのが
5chなんかで使う時には良かったりもする
archive.orgを利用してて思うのは、
全く同じキャプチャが重複して何個も何個も撮られてて無駄だなって事と
セーブ時のSave error pages (HTTP Status=4xx, 5xx)の☑はデフォルト外しといた方が良いんじゃないかって事 -
視野が狭いな
-
todayのURL、916132832超えたらどうなるの
-
>>441
アルファベットが6桁になる、今の所は半分程度が使用されてるって数年前のブログに書いてた気がする
てかtodayって毎月30万近くかかってるらしいんだが、どうやって個人で維持できてるのか謎すぎるな・・・ -
度々すみませんm(_ _)m
一部のツイートを削除してからTwitterアカウントごと削除した場合、waybackmachineに収集されていれば削除した一部のツイート内容も見ることできますか?? -
少なくともXに関してはtodayで取れるようになった
-
https://archive.is/XV7ro
Web.archive.org is DOWN for everyone. -
いつの間にかx.fc2が取れなくなってるし…最悪
-
えっちなコンテンツが後世に残らなくなってしまう・・・
-
そろそろアップデートして欲しいなぁ、今風のサイトは取れないのが多くなってきた
-
archive.todayでもTwitter(𝕏)が
>Something went wrong. Try reloading.
で記録されてしまって撮れなくなった模様
Twitterは、archive.orgで撮ってたのが見れなくなってたりしない?
表示されないのが多過ぎる気がする
Facebookは
archive.todayは撮れて
archive.orgでは撮れなかった
>>449
以前は普通に撮れてたのに
現在は撮れないサイトが多すぎるんだヨネ -
特殊な構造のサイトが増えているということなんだろうな
-
Save Page Now could not capture this URL because it was unreachable.
-
youtubeの動画は取れてるんだけど、コメントが全然関係ない動画のやつになっている
-
それ、あるある
-
今日はだめな日
-
なんか新規取得しないな・・・
-
無くなる前にアーカイブ
過去ログ見れなくなる前にやっとけばよかったんだがね
https://i.imgur.com/jiMjBYa.jpeg
無くなったら無くなったでURLがわからないと辿れないから
過去ログβが無くなったら辿るのが困難になるのが困るな
一周回ってリンク集の需要が高まるかもしれない -
獣姦する女・・・(;`・д・´)
-
もうずっと不調
-
Twitterのプロフィールまではいけるんだが、そこから画像欄とかいいね欄が見られないのは仕様?
Something went wrong. Try reloading.のエラーが出て不便 -
502 Bad Gateway
-
>>461
そもそもログインしないと見れなくね? -
見たいWebページが「404エラー」になっていたとき、元のページ内容を見る方法はないの?
https://otona-life.com/book/235219/ -
また不調か
-
10分前から
「Sorry
Cannot start capture」
10分ぐらい前までなんてことなかったのに突然 -
まだ
Sorry
Cannot start capture
のままだな -
俺もSorry Cannot start capture
-
復旧した…か?
-
直ったっぽい
-
インスタは保存できなくなった?
-
取得に失敗したurlもデイリーリミット300にカウントされるようになってて草
40台しか取れてねえ笑 -
リンク集は自分で持ってないと困る&
冗長的に野に放たれてないと価値がない&
リンク先消されたらあまり意味がない
インターネット暗黒時代近づいてるというかもう既に始まってるのかもしれんな
アーカイブも1個や2個じゃ足りないだろ
国は頼りねえし明日はどっちだ -
始まってるな
右から左にコピペしたかのようなキュレーションブログの乱立と
誤情報や嘘、政治的活動で溢れるSNSの台頭 -
既存のブログやショッピングサイトなどをコピーしたものにマルウェアを仕込んでいる外国ccTLDのサイトとかもだな
そんなのが検索サイトで検索結果上位に出てくる始末 -
今必死にフォレストページの好きなサイトアーカイブしてるけど、一日200回の制限がキツいわ...
-
スプシでアウトリンク有りにして1000個くらいアーカイブすればあっという間に5万件の制限かかるぞ
-
typoした4万件だわごめん
https://i.ibb.co/z5r.../20240705214230.webp -
アカウント作れよ
-
>>484
アウトリンクってjsとか画像とかしょっちゅう取り逃がすからあんまり使えないよな -
ページの数が多かったらだるいけどそうじゃないなら適当な拡張機能でページ内のリンク全部取得すればいいだけだから使いようによってはかも
アカウントにあまりあったから482のやつ手伝おうかと思って試したんだけど、検索結果にでてくるHPがおくれて描画されるせいでアウトリンクにかからないのがしんどくてやめた
数千ページもちまちまURL取得するわけにもいかんし
こういうときにささっとスクリピングのスクリプト書いてURL取得するスキルが有ればずっと楽なんだろうけどね(泣) -
今って一日4万件だけなのかもっと多くなかったっけ
-
>>489
Save Page Now 2 Public API の User Status 応答の変遷(日本時間午前9時過ぎ)
2023/02/18(土) {"available":6,"daily_captures":0,"daily_captures_limit":100000,"processing":0} この日から記録を始めた
2023/08/21(月) {"available":6,"daily_captures":0,"daily_captures_limit":80000,"processing":0}
2023/09/06(水) {"available":6,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/09/29(金) {"available":8,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/11/23(木) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2023/12/12(火) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
2023/12/17(日) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2024/02/24(土) {"available":7,"daily_captures":0,"daily_captures_limit":40000,"processing":0}
2024/02/29(木) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
2024/03/14(木) {"available":7,"daily_captures":0,"daily_captures_limit":40000,"processing":0} -
503出てる
-
メンテか
-
メンテ終了したようだ
-
イモグラはどうでも良いグロ画像をキャプチャしたら取れた。
肝心なヤツはいつも取れない -
あぼーん
-
ネットサービス板にスクリプト荒らし登場、か。
-
あぼーん
-
5ch取ったらitestに飛ばされるようになったのか
-
またつながらない
-
つながった
2日前ほど時間がかからずに済んだ -
数時間前にアーカイブを表示しようとURLを検索したら503エラー。今も直らない
-
wayback-gsheets のキューが進まない。。。
-
866 billionから更新されんな
-
Vector がホームページサービスを終了だとよ。ダウンロードサービスは継続。
https://www.itmedia....2407/18/news117.html -
hpの方に詳しい情報を載せてる作者もままいるから損失もそれなりの規模だなぁ
なんもかんもなくなる日本 -
まるで日本以外ではなんもかんも残ってるかのようだ
-
あら?503になって繋がらない…
onion版も一昨日から繋がらないしどうしたんだろ… -
いま復活してるけどちゃんと取れるか心配だ
-
取れないよ
-
除外URLって異議申し立て出来ないの?
noteとかメルアドが漏洩した当時はログを消すのは理由があったけど
今でも出来ないのはビジネスの都合なだけじゃん -
まぁどうしても保存したきゃ手間がかかって七面倒な上に証拠能力としての価値はスクショ同然になる問題点はあるがmht保存機能やらを使ってページをローカル保存して足が付きにくいように無関係な適当なファイル名やらに変更した上で難解なパスワード入れて圧縮したzipやら7zやらを適当なロダに上げて直リンをwebarchiveや20MB以内ならウェブ魚拓に保存すると言う奥の手も無くもない。
-
重いからか知らんけどCollections情報見えないな
-
1週間近く接続終わってるな
-
xを保存したいんですけど、archive.orgは方法ありますか?
archive.phはいけるんですけど… -
今はarchive.phへ取ったTweetのURL( archive.ph/〜 )で、再びorgへ取れるようになってるんじゃない?
-
・・・今春辺りまで1年以上、ph内のアーカイブ済みページはorgへ再取り出来ない不便が続いてたみたいだけどさ。
-
ページ取得ミスする頻度が最近高すぎる・・・
そのくせに再取得まで時間空けなきゃいけないから面倒 -
寄付少なくて維持が大変なのかな
-
画像が取れないうえに何度やっても失敗する
-
Archive制限が多いな、結局mdへ取るしかなかったり。
-
https://www.itmedia....2408/01/news124.html
カカクコムは8月1日、アニメやゲームなど“アキバ系”のカルチャーを紹介する情報サイト「アキバ総研」を9月30日に終了すると発表した。
2002年8月の開設から22年の歴史に幕を閉じる。
終了後、記事やレビュー、投票など各種コンテンツはすべて閲覧できなくなる。
https://akiba-souken.com/article/66874/ -
ページングが生きてるけど、最古のが2012-01-13。それより前の記事は一覧取れないのかな
https://akiba-souken...m/article/?page=2566
https://akiba-souken.com/article/14614/
タグ検索すると2010-05-21のも取れるから、どこかでインデックス切れてるのかな
https://akiba-souken...%97%E8%88%97&page=69
https://akiba-souken.com/article/9017/
番号全部漁るしか無いのかな -
22年も続いたのかあ・・・
-
>>525
元々アキバ総研の使ってた古いドメインは( http://akiba.kakaku.com/ )。
しかし最古のTopアーカイブが2007年なんで、もっと前はさらに別かな?
《 アキバ(秋葉原)の最新情報がわかる!アキバ総研
http://web.archive.o...://akiba.kakaku.com/ 》
-
2002 年 8 月 26 日開設、その 3 日後のキャプチャ。
https://web.archive....03/kakaku.com/akiba/ -
比較的単純だから取りやすそう
-
>>529
J-Sky H" Palm PDA Lモード って時代を感じるな… -
YouTubeで消えた動画見ようとしてもCookieの認証が云々って出てそこから進めないんやが
Cookieはどうやって対策するのか、誰か教えてくれると助かる -
再生画面すら保存しきれていない動画で
動画本体までアーカイブされているもんかねぇ -
【 ■5ちゃんねる■過去ログ・過去ログ倉庫■運用情報・不具合報告■
http://agree.5ch.net.../operate/1697962402/
93 名前:[sage] 投稿日:2024/03/07(木) 13:54 ID:
https://kohada.5ch.n...i/kankon/1369777130/
だめだ みれない
97 名前:[sage] 投稿日:2024/03/08(金) 14:12:29.76 ID:zwv+kDuO0
>> 93
http://mimizun.com/l...h/kankon/1369777130/
120 名前:[] 投稿日:2024/04/02(火) 13:04:41.44 ID:
ジムが何年前のインタビューで匿名掲示板バブルは過去の話しだと語っていたから今の5chでは現状維持が精一杯で過去ログ復旧にまで回せる資金はないだろね
153 名前:[sage] 投稿日:2024/05/01(水) 15:59:47.12 ID:
みみずん検索で我慢だな 】
-
最近サ終したサイトってでんファミwiki以外になにかある?
-
トップにリダイレクトされるのって仕様?
https://web.archive....ken.com/vote/v_1111/ -
>>536
view-source:https://web.archive....ken.com/vote/v_1111/
144 行目にホスト名が akiba-souken.com かどうかのチェックが入ってる。
-
>>537
つまりリダイレクトされちゃうからアーカイブとってもweb.archive.org上では閲覧できない? -
>>538
ページ内画像が低質化してしまったり省略されてしまう場合があるけど文章メインで読めりゃいいならCano-Lab等、PC2m系の携帯端末変換スクリプトを通すなり…。
強制リダイレクトを弾ける(無力化)ブラウザがあれば素で開けるだろうけど
―――
http://www.cano-lab....ken.com/vote/v_1111/
http://www.cano-lab....ken.com/vote/v_1111/
-
CloudFlareの認証画面を使うサイトも増えてきたなぁ
Cookie送れば突破出来るんかな、めんどい・・・ -
>>539
uBoでweb.archive.org##+js(aopr, String.fromCharCode)のルール追加して対処しました! -
archive.today死んでるね
-
>>536
disable javascriptすれば見れるけど… -
ドメイン毎の統計情報見れるようになったって事かこれ?
https://web.archive.org/details/tld:com
https://web.archive.org/details/tld:jp -
vectorもったいないよなぁ
-
archive.todayが一部の回線やブラウザを使うとアクセスできないかwelcome to nginxになる状態なんだけどこれどういう状態なんだ…
-
>>549
回線は関係ないやブラウザの問題だわ -
>>549
archive.today は、Cloudflare DNS Resolver の利用を拒否しているのでDNSの設定を自分でいじったのなら他に戻す -
>>551,552
ありがとうクッキー消したら一旦は普通にアクセス出来るようになったわ
ちょくちょくタイムアウトするのはまた別の問題かしら
あと特定のサイトの画像を保存しようとするとまたwelcom to nginx状態になった -
>>549
> archive.todayが一部の回線やブラウザを
>
取得済みアーカイブを開く時にブラウザUAが Internet ExplorerだとTopへ飛ばされるんで他へ設定変えなきゃならなくなってる。
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
あぼーん
-
ついにここにもスクリプトが来たのか
-
あぼーん
-
あぼーん
-
IAで、久しぶりにとある人のアカウントを見に行ったら
Uploadsの欄にThis patron has not uploaded any items yet.ってなってるって事は
全部消したか、消されたかってことなんかな?
他のタブを見るとReviewsには1件レビューの履歴があったけど、それだけだった -
鯖落ちてる?
-
つながらなくなった
-
つながった
そこまで長引かなかったのがまだ増しか -
今日は全然取れないな
-
ここしばらくちゃんと取得したページが表示できるようになるまで1週間以上かかることがザラ
-
Job failed
-
ミルダムは無理だよな・・・
-
ミルダムって今見てきたけど、アーカイブは元々ほとんど残らないのかな?
何人か見たけど、アーカイブ 動画が0件の人ばっかり。
一人だけ2週間分のアーカイブが残ってる人が居たけど、そんな訳ないし -
2024/09/01 閉鎖 ミルダム https://support.mild...icles/36550955435161
2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505
しかも閉鎖がほぼ10日後?急すぎるし・・・ -
ミルダムって初めて聞いたw
運営企業とか辿っていくと、単にチャイナリスクが発現しただけにしか見えんな -
ミルダム懐かしすぎる
まだあったのか
>>581
作成したアーカイブの保存期間
15日間保存※された後、期間中に一定数視聴がない場合削除されます。
※公式番組や他企業さまとの協賛案件など、運営が必要と判断したアーカイブは除きます。
https://support.mild...A4%E3%81%84%E3%81%A6 -
サーバー落ちてるな
-
複数窓すると制限かかるのな
-
オリエント工業が廃業とのこと。
https://web.archive....m/newsSingle/?no=436
昨晩よりテキトーに巡回してアーカイブをとってみたけど、取りこぼしがあるかも。
年齢認証が入ってるので、個別の画像などを除きそのままでのアーカイブは不可。
Web ブラウザで認証を通した後のクッキーを capture_cookie に喰わせれば行ける。
30 分くらいの無通信でセッションが切れるので、その場合は再認証の必要あり。 -
連日Job failedばかり
-
重くて使い物にならない
ゴミでしかない -
Save outlinksにチェックを入れてsave pageするとJob failedになるくさい?
表向きはログが残らないどこぞの生まれたばかりの掲示板のスレを元画像ごと保存しようとしたら上記のエラーになった…
Save outlinksが導入された当初は垢無しでも出来たのにどんだけ鯖への負担になってるのよこの項目 -
Job failed と unreachable は数分おきに同じリクエストを繰り返したら
だいたい 3 回か 5 回くらいでアーカイブ成功するね -
wayback-gsheetsはまあまあ問題なさそう
https://i.postimg.cc/gjDx3Gcm/image.png -
アキバ総研について色々調べたんでシェア
2002/08/29 頃にサイトがオープンして、当時のURLはこれ
http://kakaku.com/akiba/
当時の記事URLはこんな感じ。
http://kakaku.com/ak...61229_Opteron290.htm
http://kakaku.com/ak...1229hobby_newcos.htm
2007年頃からサブドメインになった。
http://akiba.kakaku.com/
http://akiba.kakaku....y/0701/11/185503.php
http://akiba.kakaku....c/0701/12/204420.php
ここまでの記事は、今は多分全部アクセス出来ない?
akiba-souken.com は2011/09/13 にオープンしたけど、当時はアニメの感想がメインだったっぽい
2012/09/13からニュース記事が配信されるようになって、この頃から記事のURLは以下の形式になった。
https://akiba-souken.com/article/67324/
当時はサイトリニューアル!ってプレスリリースも出していたみたい。
https://corporate.ka...ess/release/20110913
https://corporate.ka...ess/release/20120913
kakakucom配下の記事はもうアクセス出来ないから
今クロールを頑張るなら https://akiba-souken.com/article/[0-70000]/ って感じになるのかな -
>>596
過去のURLは>>529,527 に書いてあって
後はその中で最古の記事はどれか、最後の記事は何かをチマチマ調べただけ。
"2011年" "アキバ総研" でググったり。
あと、↓のapiでarchiveされてるURLの一覧がドメイン指定で一気に取得出来るから、それをローカルでDBに突っ込んでURL一覧を眺めながら過去どんなサービスがあったのか調べた。
http://web.archive.o...ilter=statuscode:200
APIの仕様は以下のページ。
https://github.com/i...r/wayback-cdx-server
limitパラメーターを外すと全件出力されるから、curlとかでローカルにファイルとして保存して、それを色々解析するのがいいと思う。 -
連日重たい・・潜在的なバグでもあるんかな
-
大昔の5ch過去ログも無料では復活しないかもしれぬから、みみずん鯖で保管されてる分だけでも一括アーカイブされればいいけど…。
《 携帯5chブラウザ ぬこ Part181
http://lavender.5ch....hakumelo/1721834468/
186 名前:携帯電話情報通知[] 投稿日:2024/09/01(日) 22:38 ID:
久しぶりに過去ログ見ようと思ったら、5chサーバ混雑またはサーバ落ちのため、レスを取得できませんでした。しばらく待ってリロードしてください。ってずっと出てくるんだけどもう見れないの?
192 名前:携帯電話情報通知[sage] 投稿日:2024/09/02(月) 06:41 ID:
>> 186
大昔の分はヌコの過去ログ検索でも板の綴りとスレッド数字列まで判明するから mimizunサービスにバックアップされてれば見れる。まあ実況系板はかなり補完漏れ生じてるようだが
〈 WOWOW 17
http://mimizun.com/l...h/weekly/1058205020/ 〉 》
-
いつの間にか2chの過去ログ見れるところが無くなってるんだよな
5ch公式はシステム作り直してます乞うご期待!とか年単位で言ってるし
他の過去ログサイトは全部潰れたし
こういう時にこそscの出番だろ と思って初めてアクセスしたけど、嫌儲みたいな人が多い板はともかくマイナーな板は繋がりもしなかったから全然駄目だ
https://agree.5ch.ne.../operate/1697962402/ -
>>524
ニュース WEBメディア「アキバ総研」が9月30日でサービス終了へ、惜しむ声続々
WEBメディア「アキバ総研」が2024年9月30日(月)15時をもってサービスを終了することを発表した。
「アキバ総研」ではアニメの最新ニュースのほか、各クール毎に放送されるアニメ一覧の公開やレビュー機能、投票企画や秋葉原の地元ネタなどの掲載で親しまれている。
「アキバ総研」サービス終了のお知らせ
「アキバ総研は、『アニメ&アキバ系カルチャー情報』を発信するメディアとして2002年からコンテンツ提供を続けてまいりましたが、この度、2024年9月30日(月)をもちましてサービスを終了することとなりました、
サービス終了に伴い、記事及びレビュー、投票などはすべて閲覧できなくなります。
改めまして、アキバ総研は2024年9月30日(月)をもちましてサービスを終了いたします、これまでご利用いただき、誠にありがとうございました。」
突然の終了発表を受け、SNSには「サービス終了は正直言って残念です。」・「サービス終了だなんてさみしい。」・「サービス終了と聞いて衝撃を受けた。」・「また一つの時代が終わる。」・「アキバ総研までなくなっちゃうなんて。」と、惜しむ声が続々と上がっている。 -
もうこれ半分インターネット考古学だろ
-
サ終する時、サ主がIAにデータ提供してから閉めればこっちは保存しなくて済むから楽なんだけどな
-
公式にそれをしにくいのはまあ分かるけど
せめてURLの一覧をどっかに置いておいてくれたらこっちで登録するんだけどな
例えばアキバ総研の記事は /article/66874/ の数字の部分を上げていけばいいけど
1記事で2ページ目があったり、記事の中に画像があったりするとそっちのURLも登録しないといけない。 -
TVerプラス【サービス終了のお知らせ】
https://plus.tver.jp/
平素より「TVerプラス」をご利用いただき、誠にありがとうございます。
2024年9月30日をもちまして「TVerプラス」はサービスを終了させて
いただくこととなりました。
長らくのご愛顧、誠にありがとうございました。 -
ねとらじもいつの間にか終わってた発表から数日で終わりは悲しいな
-
5ちゃんの過去ログ見れないのは辛い
-
大昔のはmimizunで開け。
-
mimizunってまだ生きてたんだな…
試してみたけど、datは取れない感じなのかな
https://mimizun.com/...012/02/post-694.html
http:// mimizun .c om/log/2ch/newsplus/1268106381/ はhtmlで見れるけど
$ curl -i -A "xxx Monazilla/1.00 xxx" "http:// mimizun. c om/log/2ch/newsplus/1268106381.dat"
を指定してもhtmlが返ってくる。
2024年にTwitterで御本人に質問している人が居るけど反応無いっぽい
x[.]com/1010Kui/status/1748324729457639583 -
from:mimizun 過去ログ とか dat で検索すると過去ログを調べるのに有用な情報が盛り沢山だな
-
みみずんのデータもいずれ手動登録しなきゃダメなのか
-
twitterとるには結局どうすりゃ良いんだ
todayしかないか -
《 http://yomoyama-bbs....est/read.cgi/2/2817/
3 名前:名無し[sage] 投稿日:2024-09-10 13:21 ID:
Twitter運営はUI改悪しまくりやがって会話ログも検索結果群もアーカイブ不良きたすに堕した。
ミラークライアントのMovatterとか、Nitter鯖の復活増を願うしかない 》
-
pythonでテキストファイル読み取って
SPNにURL送るようなスクリプト作ったんだが
送る感覚ってどれくらいがいいんだろう
1分に1URLとか?
流石にもっと早くしても鯖負担かからないだろうか -
>>615
一年くらい前は立て続けにアクセスすると TCP セッション自体がブロックされたりしてたけど
今は一秒間隔でも多分大丈夫。
とは言っても一分あたりの受け付けリスエスト数の上限があるから
随時 user status を読み取って、上限を超えてたら暫く (※) 待つような仕組みを入れないと
まともに動かないよ。
(※)
上の「一分あたりのリスエスト数」を管理しているカウンタは毎分 00 秒にリセットされる。
マシンの NTP 同期の精度にもよるけど、余裕を見て時計が次の 01 秒とか 05 秒とかになるまで
待たせておけば充分。 -
それとは別に、同一サーバの長大ファイル群を連続してアーカイブさせる場合などは
向こうの並行ダウンロードセッション数があまり大きくならないように
こちらで抑えてあげないと、途中でちょん切れたものがアーカイブされてしまうのは
困った話。 -
アーカイブ職人
-
既にほんの僅かだから復活鯖が増えぬと死んだ時点でオワコンへ…。
-
Google検索でキャッシュ復活へ Internet Archiveとの提携で
https://www.itmedia....2409/12/news085.html -
>>621
URL貼ったついでにアーカイブしておくとか、そういうのは頭に無いんだw -
ググルキャッシュは無くなると言われてたけれどリンクが無くなっただけで今もずっと機能してたしこれがIAに変わるなら今まで知らなかった人たちの削除申請が始まりそうです
-
消されたページは検索結果に出ないからキャッシュまで来れないだろうし大丈夫じゃね
その辺調べてIAまで辿り着ける人はもともと削除依頼してるだろうし -
グーグルキャッシュだと数時間前のキャッシュということも多々あったけど
Internet Archive だと数年前のキャッシュということもありそうだ -
試してみたが、そもそもキャッシュ自体が分かりづらい場所にあるなw
知らない人は見つけられなそう、まぁそっちの方がいいか -
従来のキャッシュが廃止だと「テキストのみ表示」の機能も喪失となって不便出そう。
-
グーグルがキャッシュを保持しなくなったら検索すら機能しなくなるだろ
それがアクセスしやすい場所で公開されるかどうかとは別の話 -
archivetodayというゴミサイト開けないが
-
初歩的なこと聞いていい?
クレカで寄付の時に入れる名前って支援者一覧みたいに公開されたりしないよな? -
>>631
基本的にこういうサイトで寄付者を公開するときは本人の同意が必要なはず -
何でそんなに謙虚なんだよ
-
実名掲載されるのが嫌
同姓同名なんて腐るほどいるだろうけど気分的に -
Wayback Machineで呼び出せな…、つまり死んでる
気になる記事があるときに限って -
archive.today数日前はキューが1万件以上あって保存まで数時間かかる惨状だったが復調してきたね
リキャプチャ要求される間隔はかなり短くなった -
>>624
> ググルキャッシュは無くなると言われてたけれどリンクが無くなっただけで今もずっと機能してたしこれがIAに変わるなら今まで知らなかった人たちの削除申請が始まりそうです
>
↑今日で旧来のGoogleキャッシュが完全に終わっちまったみたいだ…。
不便増えるわ。
-
503か
-
X(旧Twitter)のポスト(ツイート)が取得できない
強制的にZachXBT/status/1425569468755890180?mx=2に飛ばされる -
ちなみにarchivetodayだと取得可能
-
いつも重いなと思ってたら平日の昼間なら軽くて夜が重かったんだな
-
Twitter運営にBANされるからもう晒さんでほしかった。
-
nitterはもう・・・
-
todayでインスタ取れるようになったな
-
意外とIAって知られてないよね
まあ知られたら知られたで色々規制厳しくなって
アーカイブ消えまくるんだろうけど
アーカイブを増やそうと有名にすればするほど
騒がれてアーカイブが消えていくジレンマ -
【 【ネット】ついにGoogle検索のキャッシュ提供が完全終了
http://egg.5ch.net/t...enceplus/1727269320/
――
ついにGoogle検索のキャッシュ提供が完全終了
http://asahi.5ch.net...newsplus/1727231285/
116 名前:名無し[] 投稿日:2024/09/26(木) 05:12 ID:
各大学レポジトリの歴史論文とかPDFだから、HTMLへ変換されたGoogleキャッシュが便利だったのに…。 】
-
>>601
大昔のスレ参照(共有)するのにスレタイとアドレスは最低持ってないと大変 それでも外部のまとめがヒットするとは限らんし
scは太古のログを持ってない 結構深刻な問題 archiveに入れたかどうかで命運分かれてしまってる
sc発足以降のクロールはまばらだが時々チェックしておくと参考になる 5chのドメイン部分を雑に2ch。scと打ち替えてもリダイレクトされる
実況などのスレ落ち早い板のクロールは苦手だが専門板はわりとまともに動作 メモ用にも使える
5ch新設板とpink系はクロールしない(2chではないため ただ一部例外あるっぽい)
スレ立てスクリプトの被害は5chよりも2chのほうが多大なのでメモスレなどを形成した場合は注意
またクロールしたスレをスレタイ検索で探すのは困難(対応している適当な検索があまりない)なので必要なものは控えをとる -
>>547
魔法のiランド 2025/03/31にカクヨムに統合
https://maho.jp/info..._no_longer_available
手動でエクスポートインポートする機能が提供されてるけど全ユーザー自動ではないから消える作品も沢山有るんだろうな
コンテンツ本文はjavascriptで書いてるからアーカイヴするには工夫が必要そう
軽く見ただけで2007年とかの作品あるから、消えるのは惜しすぎる…なんとかしたい -
IA上で適当ながら作品のURLを入れてみたら、ページの保存はされてるけど本文は読めない状態だった。
本文は動的にgraphQLから取得してる。
スクレイピンク時にURLをシャープ込みで正しく指定して、javascriptが実行されれば保存出来そうだがどうかな… -
【 600 名前:名無しさん[sage] 投稿日:2024/09/02(月) 21:40
大昔の5ch過去ログも無料では復活せぬかもしれんから、みみずん鯖で保管されてる分だけでも一括アーカイブされればいいけど…。
《 携帯5chブラウザ ぬこ Part181
http://lavender.5ch....hakumelo/1721834468/
186 名前:携帯電話情報通知[] 投稿日:2024/09/01(日) 22:38 ID:
久しぶりに過去ログ見ようと思ったら、5chサーバ混雑またはサーバ落ちのため、レスを取得できませんでした。しばらく待ってリロードしてください。ってずっと出てくるんだけどもう見れないの?
192 名前:携帯電話情報通知[sage] 投稿日:2024/09/02(月) 06:41 ID:
>> 186
大昔の分はヌコの過去ログ検索で板サーバ名の綴りとスレッド数字列まで判明するから mimizunサービスにバックアップされてれば見れる。まあ実況系板はかなり補完漏れ生じてるようだが
〈 WOWOW 17
http://mimizun.com/l...h/weekly/1058205020/ 〉 》 】
-
>>650
明らかにデジタル焚書だよね -
ついにGoogle検索のキャッシュ提供が完全終了 [おっさん友の会★]
https://asahi.5ch.ne...newsplus/1727231285/ -
せめてスレッドのホスト名、スレッドキー、タイトルの一覧くらいはどこかで確保したいんだよなあ
-
去年あたりの規制前に5chのアーカイブしとけば良かったなぁ・・・
まさかこんな事になるとは思わなかった -
去年に頑張って5chの過去ログを過去サーバー含めてスレタイ一覧スクレイピングしたよな…githubの自分のレポジトリにスクレイピング用のソース残ってるし
と思ったらその後CドライブのSSDが吹っ飛んだからその時に一緒に消えたんだった…
なんJがスレッド数がめちゃくちゃ多くてページ数がすごい事になってた記憶 -
国家事業での保護も民間での保護も法整備も必要
だが当面何一つ進みそうにない我が国
海外勢がやみくもに取得して利益独占しそう(IAも一応これ) 原本がないものの権利の主張は難しいし -
↓だってさ。
「状況どう?」って聞いたその日にこの書き込みがあったから、まさか「今日ぶっ壊れた」って事は無いだろう。
「アーカイブを展開するところからやり直している」とは一言も書いてないのが気になるんだよなあ…
"アーカイブの展開"は手間がかかってまだ着手してない。つまり本当にアーカイブの中にデータが揃っているかも現状不明で
下手するとアーカイブ出来てませんでした も全然あるよなあ…
■5ちゃんねる■過去ログ・過去ログ倉庫■運用情報・不具合報告■
https://agree.5ch.ne...erate/1697962402/357
357 名前:Ace ★[] 投稿日:2024/09/27(金) 14:50:10.24 ID:CAP_USER
残念なお知らせです。
過去ログ鯖は着々と作業をしていた模様ですが、物理的にぶっ壊れたそうです。
アーカイブ等はバックアップしているのでネットの彼方に消えたわけでは無いですが、
アーカイブを展開するところまで「振り出しに戻る」という状況です。
363 名前:Ace ★[] 投稿日:2024/09/27(金) 16:39:08.02 ID:CAP_USER
>>362
バックアップはアーカイブ状態なので展開しないと見れません -
ここの運営の言う事なんかまともに信用できないんだから全部ぶっ壊れてる前提でいなきゃだめ
-
mimizum(みみずん)のログを archive.org へ保全するほうが先決じゃないの?
あすこも何時まで鯖の維持出来るか分からぬだろうし( 既にログ速も Unker も亡くなった… )
-
自分だけかもしれないけどアキバ総研のアーカイブした記事を見ようとするとトップに飛ばされる
(魚拓とtodayのは普通に見れる) -
>>664
みみずんって
・datの取得はできなくなっている
・htmlは取得出来る
・ただし、htmlの一覧が無いから総当りするしかない?
と思ってるんだけどどうよ
特にページの一覧が無いとどうしようもない -
強制リダイレクトを無効化するブラウザ無かった?
記事文だけならテキストブラウザなり読む方法は色々あるが -
>>667
かころぐjp の検索結果か、Archive.org 内の各板・過去鯖スレッド一覧アーカイブから末尾キー拾わせてくしかないかもしれない…。
〈 かころぐ kakolog.jp
http://mevius.5ch.ne...gi/esite/1725790523/ 〉
-
>>668
アキバ総研はjsを無効化してもページ内容読めるから、devtoolから無効化すればchromeでも見れる。
それ以外だと、インターネットアーカイブのリンクをクリックするだけで見れる!とはならないけど
iframeのsandbox属性でjavascript無効にすると見れる。 -
>>669
とにかくまずはスレッドの一覧を作る所が一番大切だよな…
個人的にはbbspinkも救出したいんだけど、
とにかくサーバー名・板ID(esite)・スレッドキー(1690465133) の3属性があれば特定は出来るか -
URL貼ってもアーカイブが出てこないで直接今のURLが開かれるだけになっているのだが?
-
アキバ総研もうアカンわ…
どこか引き取れやー! -
>>610
みみずんはhttpsだと開けないからhttpを指定しないといけなくて面倒 -
こういうサービスの終了を見るたびにXanaduが実現していればと思う
ハイパーリンク同士を参照し合う原理上リンク切れが起こらないからアーカイブももっと楽になるはず -
>>673
記事が全部InternetArchiveに記録されてるから、一覧表示サイトを作ったで。twitterで検索よろしく -
すげえぇeeeーー!
あなたが神か -
アキバ総研は今日の15時に閉鎖
各々思い残しがないように -
インターネット上に放たれた情報は
2度と制御できない不滅って認識だったが
・検索できなくなって埋もれる
・サービス終了して消される
・作者が消す
ほとんどの情報はこの3つのどれかに行き着くのかもしれないな -
アキバ総研オワタ「\(^o^)/」
-
TVerプラスの保全お願いに来たかったんだけど
間に合わなかった…😭 -
zakzakが閉鎖するらしい
ああいうニュースサイトって過去の記事けしまくってるから積極的なアーカイブする必然性は薄いと思ってるんだけどどう?
全記事一覧ページって無いよね? -
hxh.rakuwiki.com にあるコンテンツ(特に画像)を保存したいと考えています
例 http://hxh.rakuwiki.com/card/2436/
スクショ(青矢印) https://i.ibb.co/QXzjV4g/Screenshot.png
書き込みがエラーでうまくいかないので、内容のスクショとテキストをpastebinに記載しました
内容のスクショ https://img.imagerid...2024/10/07/image.png
pastebin https://paste.gg/p/a...990260d2a507e002/raw
なにかよい方法が有りましたらぜひ教えて下さい -
・・・と思ったら、無しでも行けることがあるな。
404 を返す条件がよく解らん。 -
>>680
AI使ってるせいなのか検索結果がばらばらで本当に困る -
20時くらいからずっと↓の画像みたいな感じ
https://archive.is/u...d8bca29ecc49c16.webp -
503になってやんの
https://archive.is/E...01ca2486bf80f39.webp -
サイト改竄?により情報漏洩を示唆する謎メッセージが出現
https://i.imgur.com/EdA0dPj.jpeg
↓
セキュリティ大手情報サイト Bleeping Computer によると
3,100万人分のユーザデータの流出していて、本物であることも確認済みとのこと
流出したデータ
・メアド
・表示名
・パスワード変更時間
・Bcryptでハッシュ化されたパスワード など
Internet Archive hacked, data breach impacts 31 million users
https://www.bleeping...ts-31-million-users/ -
情報漏洩との関連性は不明だが、BlackMetaを名乗るハカーがDDoS攻撃仕掛けてるらしい
-
【時系列】
9日前:
何者かが流出データを情報流出確認サイト"Have I Been Pwned"の管理人に共有
3日前:
管理人は内容を精査しInternet Archiveに通知するも音沙汰なし
今朝:
サイト改竄 & 報道でお祭り騒ぎ
IT系ニュースサイトも続々と報道し始めてる
大変なことになったな
https://www.theverge...ttack-pop-up-message
https://www.pcmag.co...it-suffered-a-breach -
「Wayback Machine」のInternet Archiveから3100万人のユーザーデータ漏えい
-
つまらん
過去全データとバックアップ削除して復旧不可能にならんと祭りじゃないよ -
IA設立者Brewster Kahle氏、情報流出・サプリチェーン攻撃によるサイト改竄・DDoS攻撃があったと発表
https://twitter.com/.../1844183111514603812
https://twitter.com/thejimwatkins -
酷い連中だわ
-
ライブラリの方は元々メタデータからメールアドレスが取り出せる仕組みだったし、
パスワードだけでなくメアドも他所のアカウントとは分離したりとか
対策できる人はやってたでしょ -
今繋がらないのは落とされてるのか・・・
-
昼間は普通に繋がったんだけどね
-
何か繋がらないなと思ったら、ハッキングされてたのか・・・
-
今日つながらないなぁと思ってここに来たらハックの情報を知って
慌ててIAのログインに使ってたメアドのパスを変えてきた -
>>699
2・3日前からつながったりつながらなかったり -
知識不足でよくわからないんだが、Wayback Machineのユーザー情報漏洩って、
Wayback Machineにユーザー情報とかあったの?
URL貼って日付け選んで、削除前のHPに行くくらいしか使ったことないんだが・・・
削除前のHPでログインした情報とかが漏洩したって事? -
ハッキングされたって事はウイルス仕込まれた可能性もあるのか・・・?
-
ちょくちょく利用してたけど、ここがなくなったら困るんだが、復活するかな?
-
誰がどんなサイトを保存したのか、バレるのか
-
各リンク先
Twitter/X
https://twitter.com/internetarchive/
Bluesky
https://bsky.app/pro...znbu4wqwtcyurwbiulov
Mastodon
https://mastodon.arc...eck/@internetarchive
うんこ
https://twitter.com/thejimwatkins -
DDoS攻撃してる奴が飽きるか対策するかだけど改竄までされてるからもう無理かなあ・・・
-
アーカイブのデータは壊されていないとのこと
https://x.com/brewst.../1844485102312751421
サイトを改竄してお漏らしさせる事案って本当に多いんだよね
一週間前のタリーズオンラインストアもそれでしょう
それともアーカイブ自体の破壊が目的だったのか -
壊されたらハッカーも困りそう
-
ミソがついた形だが、アーカイブが改ざんされていないかどうかの信用評価はこれから
-
Internet Archive の場合、今までは非SSL端末や非SSLブラウザでも自由にPageアーカイブ保存したり開いたり出来たのが利点だったけど、今回の鯖ダウンを契機としてセキュリティ引き上げを口実に非SSLの締め出し強行されたら嫌だなぁ…。
《 【悲報】新浪人のUPLIFT、httpsがTLS1.0→TLS1.2になった為に一部の専ブラでログインできない事が判明 [487816701]
http://hayabusa9.5ch...ews/1693635036/?v=pc 》
-
archiveの代替サイトまとめて
-
なんだこの改行野郎
頭悪そう -
>https://x.com/brewst.../1844790609573277792
>Estimated Timeline: days, not weeks.
マダァ?(・∀・)っ/🍵⌒✨
復帰してくれないとarchive.orgを使う次のレスが打てん
5chでリンク張ると横に文字数が長くなるキライがあるけど、
こういう時にリンクにアドレス名が入ってると
元のアドレスが何か判るのは良い(archive.todayだと何のリンクか判らなくなる)
ユーザー登録ログイン機能って必要性あったのかな?
それと、
Twitter(𝕏), Instagram, Facebookなど(5chのレスも鯖によって執れない処があった記憶)
執れないと判明してるサイトを無駄に執らせる仕様も改良してほしい
archive.todayの方では執れたりするから
技術的に🉑能と想われるのでなんとかしてほしい -
webページのキャプチャだけならログインは不要かもしれんけど
ファイルのアップロード機能もあるからな
まあweb割れの総本山のイメージしか無いけど。 -
archive.todayのアーカイヴされたページの「シェア」を押すと長いリンクを見られる
https://archive.toda...web.archive.org.html
日時は下記のようにもできる
https://archive.toda...web.archive.org.html -
have i been pwnedで調べたら見事にメルアドとパスワード抜かれてたわ
普段使ってるメルアドじゃなかったからまだマシかも -
流出したパスワードは平文じゃなくてハッシュだけどな
まぁ不安なら変えといた方がいい -
ようずんにこすたことはないね
-
しかしまぁいつ頃復旧すんだろうね?
どっかの国産動画サイトよろしく2ヶ月弱とか勘弁願いたいが -
これで閉鎖したらアキバ総研の呪いという事にする
-
目的がわからん
大企業狙えよ -
新興宗教も
-
これアーカイブするか→IA開く→そういや落ちてたわ・・・
ってのを繰り返してる -
とりあえずは閲覧限定だが仮復旧したか
全面復旧はいつになるのやら -
見られるようになったね
とりあえずデータは破壊されていなかったようで一安心 -
アキバ総研アーカイブも無事動いてよかった。
セキュリテイ強化と言い出して仕様変わったら見れなくなってた -
まだ新規に取れるわけではないのか
-
サイト見ちゃって大丈夫かな?
なんか変なスクリプト埋め込まれてたら嫌なんだが
まあみるだけなら大丈夫か -
>>738
取得のページに一応アクセスはできるが、残念ながら・・・ -
ウェブアーカイブは仮復旧、こちらは何時になるかな
https://archive.org/details/software -
正直こっちのほうがKADOKAWAへの攻撃よりも個人的には衝撃を受けたわ
-
同じく
-
テスト
-
6/8にニコニコがハッキングされてさ
8/8ぐらいに復旧したんだけど
Switchで観るかスマホで観るしかなかった
それで最近になってWebCast使ってここの動画をまぁ…いろいろ観て楽しんでたわけよ
それで一通りそれらを見て落ち着いたあたりでこれだ
PS5も値上がりしてモンハン買う気起きなくなったし厄年すぎる -
WebCastでChromecastのキャスト伝ってiPhoneに変なもん送れるならやってみろって感じ
Google様とApple様に手を出すのが怖いチキン共だから
脆弱そうな角川やらここを狙うしかねえんだろ? -
そういやニコニコは復旧後コメントの過去ログが取れなくなった。
復旧予定項目にも無いし、無かったことになりそう
それか過去ログはデータが本当に消えちゃったか。 -
ニコる履歴で俺のコメントだって紐付けされてたぞ
-
無関係すぎて知らんがな・・・
-
過去の英語の記事をたくさん見るから困ってます。代替え手段はありますか?
-
504 Gateway Time-out
こればっか -
まだSPNは復旧してないか
-
10日位にダウンしたからもう一週間位のアーカイブ全部吹っ飛んだか・・・悲しい
-
毎日なんかアーカイブしてるの…?
-
>>755
個人的には半日位でスレ落ちして原則ログが残らない某画像掲示板とかいつ消えるかもわからんSNSの元画像とかそんな所か
魚拓やarchive.isでいいじゃんって言われそうだが一件一件チマチマ登録すんのが面倒でタイパ悪いしwebarchiveに比べて色々制限があんのが… -
試しにCNNとか有名どころのurlで探してみると毎日アーカイブ取得されてるのが分かるな
古いアーカイブは探せるようにはなってるから -
waybackmachine閲覧できるようになったらしいけどアクセスして大丈夫かな?ハッカーになんか仕掛けられてたら怖いんだが
一応そこも確認したのかな?
誰か教えて -
真面目な話期待したんだけど
-
三角木馬ならちょっとは笑えたのに
-
IAが潰された事によって他のアーカイブサイトにIA勢が湧いてきて糞重くなってんの怠い
-
パスを変えたいがログインのページどこ?
-
アーカイブサイトって
・IA
・archive today
・web魚拓
ここら辺しか知らないんだが
他のサイトってあるか?
情報一覧とか載ってるサイトとかあるのかな? -
んで、結局今アクセスするのは安全なん?
-
https://x.com/waybac.../1846656653799895283
The Wayback Machine @waybackmachine
午前5:57 ・ 2024年10月17日
Wanted to share an update from Team @waybackmachine
The archives are safe & the Wayback Machine is up in read-only mode.
We hope to turn on more web crawling within a day to make sure our web collections remain whole.
Next up: Save Page Now.
Thank you for the support!
チーム@waybackmachineからの最新情報をお伝えします。
アーカイブは無事でWayback Machineは読み取り専用モードで稼動しています。
1日以内にさらにウェブのクロールを開始し、ウェブ・コレクションが
完全な状態で維持されるようにしたいと考えています。
次は、Save Page Now です。
応援ありがとうございました! -
>>765
ログイン周りは全く動いてないね
パスワードどころか、メールアドレスごと早く替えたい
こういうサイトの捨てアドで作ったアカウントがあるから
アドレスさえ判っていれば誰でも乗っ取れちゃうw
https://www.txen.de/ -
IA以上に信頼できるアーカイブサイトって無いからなぁ
web魚拓は営利企業だから収益が悪化すれば消える可能性あるし
todayに至っては運営者がよく分からん -
SAVEがしたいです…安西先生…
-
個人的に保存したいだけならossのアーカイブツールが最強だけど
不特定多数に公開、もしくはアーカイブを証明として使うなら選択肢は片手で数えられるくらいしか無いよな -
保存はスクショでとも思うが
博物館がないと厳しい -
IAってエロ動画保存は駄目なの?
-
成人エロでしょ、これまたどうして
ナチュリスト系のサイトはドメインごと排除されてたりするな
見る側は児○として見てるからねぇ -
アクセスしたけど、アクセスしない方が良かった?
サイトにウイルス仕込まれてたら、サイトにアクセスしただけでアウト? -
そんなこといちいち気にするくらいなら使うなよ
-
流石に復旧する前にチェックしてるはず
だから大丈夫じゃない?
てか今どき見ただけでウイルスかかるってあるんか? -
>>766
アーカイブサイトの一覧はこの辺が参考になりそう
・Wikipediaで使われているウェブアーカイブ一覧
https://en.wikipedia...rchives_on_Wikipedia
・ウェブアーカイブの取り組み一覧
https://en.wikipedia...rchiving_initiatives -
進展あった
-
>>723
なるほど、これならarchive.Todayもリンクを遣い別けられる
>>783
archive.Orgは真ん中の日付を省略して最後に執ったものを表示させることが出来るのは知ってたけど、
・/web/0/ =Oldest
・/web/2/ =Newest
は知らなかった!
⚠︎Newestの方は最後がミスキャプチャーになるとミスキャプチャーを返すので使えない
e.g. 🆖https://web.archive....com/internetarchive/
archive.Orgの画像の直リンを使う事が多いのだけど
その場合の/web/**************if_/や/web/**************im_/のアドレスにも
・/web/0if_/
・/web/0im_/
でOldestが効く模様
e.g. 🇬https://web.archive....oogle.com/google.jpg
>>724
それは5chのUIを構築してる無能の不手際
ミラーの2ch(sc)の方ではそういう文字列もちゃんとリンクとして表記される
引用で5chの書き込みを使う時はscの方のリンクを使う様にしてる
e.g. 🔗https://toro.2ch.s%E.../win/1642086530/352n
※scは名前欄のレス番がsc増加レス分だけズレる
https://twitter.com/thejimwatkins -
・/web/1/ ≠Oldest
e.g. 🔂https://web.archive....oogle.com/google.jpg
微妙に指定アドレスとは違う最古のものが表示されるけど
何だろうね1のパラメータは -
Stanford Web Archive Portal
-
レトロPCのカタログとか雑誌切り抜きとかマニュアルを見ようと思ったら…全滅。そのうち復活するのかな
-
ニコニコもハッキングされてたけど
海外のサイトはセキュリティ万全のイメージあるけど
日本と大して変わらないのか -
海外のサイトって主語がデカすぎるな
そもそも基盤ネットワークまで侵入されたニコニコとは比べ物にならん -
今のOS豊富な機能のバグ潰しきれてなくて穴だらけだから、
そこ悪用するだけだし
パスクラ(懐) -
URL 中の日時数字列、現在の取り扱いはおそらくこう:
1. 14 桁に満たない場合、後ろを 9 で埋めて 14 桁にする
2. 月、日、時など、それぞれ有効範囲外の値を正規化する
(99 月 → 12 月、99 日 → 31 日、99 時 → 23 時、など)
3. 出来上がった日時数字列に最も近いタイムスタンプのアーカイブを提示する
例: web.archive.org/web/20100/... を指定した場合
2010 年 09 月 99 日 99 時 99 分 99 秒 → 2010 年 09 月 30 日 23 時 59 分 59 秒
この時刻に最も近いアーカイブが出てくるはず。
https://web.archive....0100/www.google.com/
1 が最古、って言うのは archive.org 上のどこかのドキュメントに書いてあったんだよね。
でもそれも 20 年近く前の記憶。
-
SPNが出来なさ過ぎてそろそろ禁断症状が出そう
-
先週から休みを取らずに対処してるってスタッフが言ってるし、近いうちに直ると信じたい
あとこれを機に色んなシステムをアップデートしてるから時間がかかってるらしい -
vectorのHPってurlが連番かと思ったら大昔は?そうじゃないページもあったんだな
https://hp.vector.co...jp/authors/tfuruka1/
https://hp.vector.co.jp/authors/yohko/
こっちは連番だからこっちからスクレイピングすれば補足出来るか…
https://www.vector.c...person/an001687.html -
vectorみたいなフリーのHPスペースってどうやってアーカイブすればいいんだろう?
トップページのURL一覧は機械的に作成出来るだろうけど、その中のサブページ? は地道にhtmlをパースするしか無い?
配置されてるhtmlの一覧が見れれば嬉しいけど、そんなのあるわけ無いし -
Internet Archive、盗まれたアクセストークンを悪用され再び被害
サポートメールのシステムに侵入して、そこから攻撃者がメールを送信してきたらしい
削除リクエストを含む80万件以上の問い合わせ情報が流出か
Internet Archive breached again through stolen access tokens
https://www.bleeping...tolen-access-tokens/ -
マジで復旧後にwaybackmachine使ったらやばい?ページ改ざんされてる可能性ない?
-
>>799
もうこれ作り直さなきゃダメなやつでは -
ゼロデイじゃなくても信頼出来るサイトのアーカイブが改竄されて怪しいサイトのリンクに書き換えられたりするのも充分にリスクだと思うけどね
サンドボックスを理解してる技術者ならともかく、一般人はサイトにアクセスするのと、
出て来るダイアログを何も考えずにok押して勝手にダウンロードされたexeを開く行為の区別なんか無いし -
アーカイブが改ざんされたって情報はどこにもないけどね
妄想を元に推論していくならアクセスするなとしか言えない、それが一番安全
ゼロクリックでPCを壊すマルウェアを仕込むのも「技術的には可能」なので -
アクセスするなというか復旧後にすでに使ってるんだけどね。
もうちょい待てば良かったか
てかよく見たら新しくやられたというより9日にハッキングされた時にとられた奴を利用された感じみたいね
流石に復旧する時にサイトは念入りにチェックしてると思いたいが -
祝復活?ためらいがちに使ってみるか
-
ためらいがちとか生ぬるいこと言わず、
金輪際使うのをやめるって方法もあるんだぜw -
多少怖いよね。ハッキングされました→復旧しました。→昨日のニュースみたいなことが起きましただからね
おれはもう使っちゃたけど閲覧目的なら一旦様子見もありかもな -
多少怖いって何だよ
ちょっと怖かったり絶大に怖かったり変化するのかよ -
取る方がメインで見る方は元サイト消えた時だから今のIAに用無いわ
-
アレ?また見れなくなった?
これ書き込んでる現在、こっちの環境だとこのサイトにアクセスできませんって出るのだが… -
こっちもアクセスできない
また何かあったのか、それとも完全復活の兆しか・・・ -
落ちたはりますなぁ
-
またハッキングされたんかな?
だとしたらもう復旧後に使ってるから勘弁なんだが
Xみても情報ない -
IAハッキングしたのってニコニコと同じやつ?
-
いいえ
-
なんたるちあ
-
waybackmachine復旧しても使わないほうがよさげ?
こうなるのわかってたら復旧後にアクセスしなかったよ。
検索閲覧程度なら大丈夫かな? -
てかあれから進展あったの?
お知らせらしきもの探しても見つからんしハッキングされたときみたいにニュースになってない -
公式Twitterに書いてあるでしょ
-
一覧にアクセスしようとすると
Wayback Machine failed to return archive information. -
感染したんだろ
あーあ -
>>828
あほが無理してレスせんでええんやで?w -
あーこわいこわいw
-
早くSPNを摂取させてくれ、体が震えてきた
-
2024はサイバー犯罪元年だな
全世界で両手指を切り落とす刑罰の制定が必要だわ -
元年ではねぇだろwターニングポイントかすら怪しい
-
archive.orgが生き返った模様
-
だとしても様子見するわ。
-
保存系のサイトまとめろよ
-
503が出たので飛んできました
ハッキングの余波が収まらないのか -
ネットわかんないけどWayback Machine使ってるそこの君
常日頃IA使ってるだろうここへの書き込みがズレてるから知識をつけて半年ROMるといいぞ
まずはURIやHTMLやJavaScriptとDNSやGETリクエストの仕組みを入門とか初心者で調べて
スマホでもJavaScript(Kiwiの開発者モード)やPython(Termux)動かせるから手探りで色々やってみるんだ
https://chatgpt.com にバンバン疑問を投げかけるのも心がけろ
ばかにしたり煽る人もいるけど専門性が高いコミュニティは少なからずこれが当たり前だから気に病まず頑張れ -
復旧まだ?
-
ずっと「Temporarily Offline」で取得不能
-
使えるようになったら使いたいんだけど有名人のXじゃなくて一般人のXの削除ポストって見れる?
自分の1年前のポストなんだけどXのアーカイブだと消えてて。 -
IAでアーカイブされていれば見れる
-
それって事前に自分でやってなきゃだめってことです?
-
アメリカの図書館がTwitterの公開ツイートをクロールしてるって話があったけど
イーロン体制になっても維持されてるのか、
そのアーカイブはwebで公開されているのか
は知らん -
復旧マダァ?(・∀・ )っ/凵⌒☆チンチン
-
どっちみちイーロンになってからはまともにIAでは取れなくなってるし
-
恒久的なアーカイブ方法って何があるんだろうな
電子の海にデータを放出すれば消えないはずだったのに -
ネット上の情報のほうが恒久的に消滅する可能性が非常に高い
だなんて15~20年くらい前には思いもしなかったよな -
アーカイブ冗長的に整備・一般化>
レアデータの争奪>
生成偽書が大量に出現>
収拾不能に -
15年前でも大好きだった個人サイトの小説やニコニコの動画やコメントがある日突然跡形もなく一瞬で消えてもう二度と見れなくて泣いた事何度もあったからネットの儚さは気づいてた
それ以来少しでも気に入ったものはすぐにローカル保存できればアーカイブもするようになった
ネット情報は10年以上残ってるのですらほとんど無いってだいぶ前の調査記事で見たし
ある事件について調べようとしてもどんなに探しても不気味なほどネットには何も残ってなくて分からないのだと
この時代の情報は実は後の時代から見たらほとんど残ってなくて空白の時代になるんじゃないかとも危惧されてたり
自分の昔ブックマークしてたサイトもほぼ全滅
昔の情報あさっても2ちゃんの過去ログしかない事ばかり
デジタル情報ほど残らない諸行無常を感じるものもない -
繋がらないよ
-
お漏らし告知メール届いた
-
登録してたん?
-
捨てアドでしか登録してないから知る由もなし
-
IAって無料でメアド登録したら
ファイルアップ出来るようになるの? -
こらぁいよいよ以てニコニココースかねぇ…
全面復旧すんのとこのスレが埋まんのはどっちが早いんだか… -
貴重な記録だよね
そのうちアメリカ政府が管理してくれたりしないだろうか… -
ケチな黄猿は黙ってろとか言われるぞ
-
ファイルを圧縮してまとめてダウンロードする機能が死んでてイライラするんだけど、いつ復旧するとか情報ある?
代わりにtorrentで落とそうとしてみたけど、なんかバグってるみたいでダウンロードはしてるんだけどずっと0%のままみたいな感じになるし……。これ、なんかトレント側の設定で回避できたりする? -
いくつか μTorrent で試してみたけど、トラッカーも配信サーバもどちらも動いてる模様。
あれって .torrent の形はしてるけど、中身は P2P ではなく
GetRight というダウンローダによる BitTorrent プロトコル拡張、
トラッカーがダウンロードを指示する先は IA のサーバの HTTP 80 番ポート。
そのまま GetRight を使うか、BitComet や μTorrent のような
同じ実装を取り込んだ torrent クライアントでなければ落ちてこないだろうね。
https://web.archive....archive-bittorrents/ -
>>863
ありがとう。Bittorrent使ってました! μTorrent使ったら問題なく落ちてきました。失礼しました。 -
選挙速報とかもアーカイブしたら
時間軸でどう変化したか見れるのかな -
時間軸で見られたところで、あれって
(本来あってはいけないはずの) 個々の選挙区内の有権者数の差と、
開票作業に手当てできる人員の差でああいう流れが生じてるだけなんだよなー -
選挙で思い出したけどアメリカ大統領選って来月の5日だよね
それまでにはSPNも復旧してるといいが -
破産状態にあった取引先のIA魚拓がごっそり消されてた
グレーなうわさも聞いたが管財人が消す動機も無いし隠滅工作かなあ? -
"Wayback Machine failed to return archive information."
アーカイブをURLで検索しても、このメッセージがずっと出てくる -
書き込んでから気づいたが>>826で既出だね、すまん
-
>>870-871
まだ直っていないという報告乙 -
Firefoxだとアーカイブされてるページに飛べないのだが
Chromiumのブラウザだと飛べるが
Firefoxだと404 Not Foundが出てくる -
>>850
「ネットなら残る」「紙なら残る」というのが間違い
ネットだろうが紙だろうが、残す努力をしたものは残るし、
逆に誰も残そうとしなかったものは残らないってだけのこと
(稀に偶然残ることもあるが) -
>>853
ここだって昔の全然見られなくなってるからな
専ブラ使う人多いからウェブアーカイブには残されにくいし
運営のゴタゴタと荒らしと利用人口減で存続が怪しくなってきてる5chの未来考えるとすごく不安 -
5ちゃん閉鎖するとなったら
5ちゃんのアーカイブごと消えたりして
削除申請出されてね… -
HTMLを気軽にDAT化する方法ってないの、逆じゃなくて
以前はあったと思うんだけど -
dat化ってなんの意味があんの?
-
>>877
html2datみたいなツールがあるけど、半角スペースが連続した場合とかhtmlの段階で情報が抜け落ちてる場合があるから完全な変換は出来ない。 -
KADOKAWAグループサイト、4か月半ぶりに復旧
www.itmedia.co .jp/news/articles/2410/29/news186.html
ここの本格復旧(取得機能の復旧)は果たして・・・
ちなみに>>870の件は、数時間前は直ってなかったが、今見られた -
此閒のDoodleの🌗http://archive.Today...://www.google.co.jp/
Orgでコレクトされてればアーカイブからプレイ出来たのかな?
▶https://doodles.goog...se-of-the-half-moon/
からプレイできるのはEnglish ver.
今日の🫧http://archive.Today...://www.google.co.jp/
も日本語版で後でもプレイしたかった
⬆
↕https://web.archive....s://web.archive.org/
例のイースターエッグは2019/08/09から仕込まれていた模様
他のページにも在るのか??w
⬅https://web.archive....s://web.archive.org/
2017/04/21からのはスライドの最後が置いてけぼりになる仕様
➡www.nhk.or.jp/ohayou/digest/2018/10/1018.html
のアドレスに置いてけぼりの画が在った記憶
だがアーカイブし忘れて又かくの如し。 -
セキュリティチェックのため機能は一時停止する事もあると前から説明されているのだが
誰も公式発表を見ていないのである -
アカウントでログインできるようになったけど
Account settings のページは白紙のまま -
なんかsaveだけ出来ないがサイバー攻撃でも受けてるんか?
-
/save/ 以外にも色々と出来てない
先月初旬のサイバー攻撃からの復旧作業中 -
ハードディスク不足
-
>>885
近日には動きがあるようなことがいわれてるが、果たして・・・
>-Save Page Now coming soon
blog.archive .org/2024/10/28/internet-archive-services-update/ -
大統領選までにSPN普及は厳しいか・・・
-
>>890
煩わしいからリンクは直リンにして
🔜https://x.com/intern.../1851021456928305647
優先するのはログイン機能の方なのか?
流出って騒がれる割に、フィッシングメールが来る以外に実害に遭ってる奴いるのかな?
登錄者で何か被害に遭ったらこのスレにレポ4649
>>884
💳カードのセキュリティコードって
保存してるサイトばかりだヨネ
>>889
📊https://web.archive.org/web/*/https://web.archive.org/
同一のスナップが毎日毎日何百回も執られてるけど
完全同一の重複分をリダイレクト処理してなかったら容量が幾ら有っても足らん詰みゲー
>>882↕を査べる時も差分が判らなくて手閒だった
🆙
読み出し速度が遅いので速度の向上も期待したい
のと
archive.Todayには在るショートリンク機能をオプションでほしい
Orgのアドレスでは5chのメアド欄にリンクを仕込めんw
𝕏
archive.Todayは現在、Twitter(𝕏)は執れてるみたいだけど
画像直リンのpbs.twimg.com/media/*
が⥁Loadingから進まずに執れなくなってる
※Twitter(𝕏)の画像直リンアドレスは🔒 ⇄ 🔓でアドレスが変わる -
済まない、気持ちはわからないではないが、ちと前に直リンだか先頭だけ省略で書いたら規制に引っかかってさ(100%断定できるわけではないが)・・・
-
>>893
あーなるほど。
今規制は敷かれてない模様
ディープリンク張りまくってる私がソースw
ドメインの . の閒にスペース入れてるでしょ
それだと
・半角スペースだと入ってる場所がフォントによってはパッと見判り難いのと
・右クリックから検索に掛けた時に該当アドレス(記事)が引っ掛からなくて
🖲から手を離して空白を消す作業が入って二度手閒になる -
Save Page Now!
-
[ Save Page ]ボタンは押せる様になったけど
503 Service Unavailable
で執れないな
⛓💥
🌗https://web.archive....se-of-the-half-moon/
❔https://web.archive..../l_koya_ibmfont5.jpg
以前からこの様に、サイトの一部の画像が表示されないパターンがあるのだけど、
・読み出しエラーで時間を置いて後からアクセスすると画像が表示されるパターン
・取得ミスで画像が撮られてなくて表示される事は無いパターン
2パターンがあって紛らわしい -
動作は遅いし不安定だけどSPN動いてるっぽいな
-
割れダウンロードしすぎなんだよ
-
Save Page Now による保存が心なしか速くなっているような気がするのは気のせい?
-
恐らくリクエストの総数が減ってるからじゃないかなぁ。
クッキーも S3 API Key もユーザ認証は機能してないらしく、
https://web.archive.org/save/ で URL を入力する分には非ログインとして動作するけど
JSON を使う方は 401 Unauthorized となって何もできない状態。 -
>>903
認証に失敗するので「再開にあたって今までの key を無効に
したのかな?」と思って Get Your S3-Like API Keys ページに
行ってみると secret key が変更されていました。
書き換えて認証に成功しました。 -
>>904
あーほんとだ、ありがとうございます!! -
復帰してすぐに元通りになるわけないじゃろ
-
マンガ図書館閉鎖!
閉鎖ばっかりだ -
IAみたいに規模のでかいミラーサイト他にないの?
-
🔙https://x.com/intern.../1853545508121567287
(発表が)後手後手な広報w
>Web pages archived since October 9 will start being added to waybackmachine.
November 4じゃないのはどういう意味?
🗓https://web.archive....g/web/20240000000000*/https://www.google.com/
空白期間は 2024/10/10 ~ 11/4
だけど2日に執られてるの在るな
>>896の❔
画像が表示されてなかったんだけど
昨日 /20241104065933/ が執られた後に表示される様になって、
2022年の /20220524034952/ に表示されてる画像は
2024年の📁https://web.archive..../l_koya_ibmfont5.jpg
となってる。(※右クリックメニューの「画像を新しいタブで開く」から画像だけを表示できる)
これって
・取得ミスで画像が撮られてなくて表示される事は無いパターン
の過去スナップは、
同一アドレスの当時とは違う未来画像がオーパーツされてしまう仕様では?
𝕏/🖼
archive.TodayのTwitter(𝕏)画像直リンアーカイブ不可は、
画像直リンアドレス🔗「pbs.twimg.com/media/~」を𝕏内でポストして
そのリンクを右クリックから[リンクをコピー]したTwitter(𝕏)のショートリンクアドレス🔗「𝑡.𝑐𝑜/~」
で保存を懸けるとリダイレクトしてアーカイブする事がreached for the moon
📫
5chのメアド欄リンクは専ブラからしか見れない模様
2ch(sc)の方ではメアド欄リンクが再現されない仕様だった -
ログインできてアカ削除しようとしたら読み込みが終わらずメアドだけでも変更したら変更を受け付けなかったよ
-
>>909
https://warp.ndl.go..../world_wa/index.html
閲覧だけで良かったらいくつかあるようだが、取得までできるのはarchive.todayかウェブ魚拓ぐらいしかないかと
ただ、後者はIAより厳しい1日60件まで
前者が1日何件までなのかは特に見あたらないが、少なくとも後者よりはゆるいか(最近60件どころではないレベルを取得したことだし) -
・大規模アーカイブ
・閲覧・保存が可能
・運営元が明確
の3つを満たしてるのはIAくらいしか無いだろうね -
archive.todayは同じドメインのURLを17000以上アーカイブするとNginxに飛ばされる
-
ログインからアカウント設定に入りパスワードの変更はできるようになったけど
メールアドレス変更がまだできないね。
新アドレスを入力して、認証 URL の記載されたメールが届く所までは良いけど
その URL を開いてもエラーとなって機能していない。
アカウント削除と表示名変更は試してないので判らない。
(一度使用した表示名は「使用済み」となって、元の所有者ですら戻せないシステムだったはず・・・) -
4日の再開後に執れてたアーカイブ、
再アクセスすると
>𝐇𝐫𝐦.
>The Wayback Machine has not archived that URL.
>Click here to search for all archived pages under ~
となってて表示されなくなってるarchivedが存在する模様
今⛓https://mevius.5ch.n.../win/1642086530/879n
の2番目の🔗がその状態 (⬆>>786の /web/0if_/ を活用)
🌌のno+eのは
>a snapshot was captured. visit page: 🌌https://web.archive....opko/n/n37d8740b2f84
>there was a delay in registering this snapshot with the wayback machine.
>you may be redirected to a previous version right now.
>this snapshot will be available later.
からずっと𝐇𝐫𝐦.で一度も表示されない
>>896の❔は、
ウェブ開発ツールから視れる画像のURLが✅https://web.archive..../l_koya_ibmfont5.jpg
となってるけど
存在してなくてリダイレクトで>>910📁になってる模様
復旧の調整でのthis snapshot will be available later.じゃなかったら
Orgはシステム的にTodayよりぁゃιぃ
🆜https://archive.Today/9VIeR/image
ロングリンクがほしいTodayの足元がおるすなスクリーンショット機能
>>917
Sign upで使ってたらどんなメリットが或ったのかkwsk -
糖質はスルー推奨
-
IAでアカウント作るメリットって何?
-
糖質はスルー推奨
-
アーカイブチームが図書館zのプロジェクト開始してるっぽいな
というかveohも閉鎖するんだなアーカイブチームのwikiで気づいた -
IAってマンガ図書館Zみたいな電子コミックサイトの画像ちゃんと保存されるのかね
-
絵文字は読みづらい
情報は嬉しいんだが普通に書いてくれ… -
糖質はスルー推奨
-
HTML フォームからアーカイブを採る際の縛りプレイ状態、このままでは埒が明かないので
HTTP ヘッダを操作するブラウザアドオンで Authorization ヘッダを挿入することにした。
Outlinks もちゃんと拾ってくれる。
https://web.archive.org/save/status/user もエラー無く保存件数等が確認できる。
https://web.archive.org/save/ のページ自体はクッキーしか見ていないので、
この入力フォームを使う場合はクッキーも喰っておく必要あり。
-
>>926🔗🔵𝐇𝐫𝐦.の件は、
本日早朝に復旧された模様
こういう細かいトラブル情報もTwitter(𝕏)で発信してくれヨナ
無駄ァに二つスナップを執ってしまった
『https://web.archive....on/74-07-jojo2-3.jpg』
>>910❔📁オーパーツ化問題はそのまま
画像部がミスキャプチャで読み出せない大過去のアーカイブは多い
>>927
普通=オールドタイプ
なので無理
絵文字は
・引用用のタグ
・リマインダー(リンク先に何が在ったかの要約)
で用いてる
使わなかったら更に説明文が入って無様ね
読んでもらう為にレスを書(置)いてるのではないので
無理に読まなくても大丈夫だ、問題ない
絵文字は元Twitter社員のtwemojiがエモいので
🔀https://github.com/1...1/twemoji-color-font
で置き替えておいた方がベネかもね -
糖質はスルー推奨
-
所でarchive.orgのコレクションの新規アップロードってまだ出来ない感じ?
特に上げるもん無いけど物の試しにアップロードページへ行ったらこんな画面になるんだが…
https://archive.is/k...7dede9a81e685dd.webp -
>>933
https://archive.org/about/403.html ですね。
>>917 のメアド変更の認証 URL も同じリダイレクト、
まだ復旧していない機能を使おうとするとそこに飛ばされるのだと思います。
>>932
アーカイブリクエスト時のユーザ認証が完全に死んでるかと思っていたのですが、
>>904 さんに API key による認証が機能していることを教えていただいたので
(パスワードが変更され認証失敗していただけだった)
ブラウザからもそれを使うようにしてみた次第です。
ここで API key の送信に使っているのが Authorization ヘッダ、
Save Page Now 2 Public API Docs (>>3) の Capture request の項に説明があります。
-
米国インターネットアーカイブの目指すこと――その理念、著作権という現実、AIとの関係
https://internet.wat...cs/news/1491372.html -
へぇ
-
ニコニコ静画を取ろうとしたらhttps://www.nicovide...p/region_restrictionにリダイレクトされてしまった
エロ系以外でも地域制限かかるのかよ・・・ -
☑https://web.archive....s.stackexchange.com/
☑Save screenshot機能ってのは☝らしい
現在、そのスクショのアーカイブアドレス: 🔲https://web.archive....s.stackexchange.com/
はアーカイブではない元のURLにリダイレクトされてしまう仕様になってる然様
こういう時の為に使うのか?
・スクリーンショット ⇄ アーカイブの切り替えがTodayの様に出来ないのと、
・Orgのスクリーンショットは足元は居留すけど画質がjpgで劣化しててリテラが低い
Todayは無劣化のpng(>>918🆜)
>>933に使われてるGoogleの新規格のWebPは
圧縮率がpngよりも高いけど、
可逆(VP8L)と不可逆(VP8)で拡張子を別けて定義できないGoogleは理念が低い
SEOにページ表示速度を入れてるが、
速さよりも質
速度は後から改良が見込めるけど質は上げ治さない限り不良(WebPには上限も在るらしい)
♊
2ch(sc)のアーカイブがOrg, Today共に執れなくなってる
2ch(sc)は1000落ち後のdat化をミスって
>[エラー]
>datが存在しません。
になるスレが在ったから、アーカイブを執れないと🜄物
この近頃多発な執れないドメイン問題、
正体不明のToday: 🪆https://gigazine.net...40326-archive-today/
には、どんな手を遣ってでも執れる様に期待w
>>934🙈→>>829
🪬https://mevius.5ch.n...ard/1717147167/1000n
𝐇𝐔𝐌!→𝐇𝐫𝐦.でバイツァダストが关ってるとか本来は生涯を通して知らせる事は無い -
糖質はスルー推奨
-
ちんこ!
-
http://thai.jinsei.l...rg-ace-toy-thailand/
↑を取得しようとすると、404なってしまう
ほかのサービスだとウェブ魚拓はNG、Archive.todayはOK -
>>942
HTTP HEAD が投げられると 404 を返すとか、そういうパターンか。
直接 GET で行けば採れるっぽい。
https://web.archive....rg-ace-toy-thailand/ -
このAPIはまだ使えないのか
https://archive.org/help/wayback_api.php -
新規にページ保存しても保存されてない扱いで返ってくるな…
またクラッカー共にやられてんのか? -
outlinks復活したな
-
絵文字糖質は今週末は休みかなw
メールアドレス変更を試して、認証 URL が機能せず失敗、を何回か繰り返すと制限が掛かるのね
本垢でやらなくて良かった
新規アカウント認証用の https://archive.org/account/verify.php は動いてるけど
メアド変更認証用の https://archive.org/...unt/verify-email.php はエラーのまま
-
authorization: LOW = >>949のWAISのスコアがLOW
なシークレッドコードにも一生気付かなそう
@internetarchiveのポスト見ても絵文字がどーたら言ってんのかな
>>ssspは>>793で必要の無い99を調べてる処からもLOW
統合失調者の20年近く前の記憶など訊いてない
0 = 最古が事実
正直ssspのレスは登錄する必要がない輩 = HIGH(myaccesskey:⬆)には只のゴミレス
>>936
Todayの様な匿名サイトで再構築しないと
>>939の🔲な事態となるのがLaw
𝐇𝐫𝐦.化したアーカイブは
時限で治ってるリンクと治らないリンクがある様なので
再チェックが必要 -
>>950
もうちょっと根本的な反論をしてみろよ低能糖質 -
>>951=低能糖質の遠吠え(ワラ
-
糖質はスルー推奨
-
SSブログ(so-netブログ)がサービス終了だって
-
俺環だけかもしれないが、21時台から(それまではなんともなかった)
https://web.archive.org/saveまではつながるのに、取得しようとするとNot FoundだったりService Unavailableだったり -
と思ってたらJob failed.とかSave Page Now could not capture this URL because it was unreachable.とかThe server didn't respond in time forとか出るもののつながった
-
>>582
2024/12/20 閉鎖 vectorの作者個人ページ >>505
2025/03/31 SSブログ終了 https://blog-wn.blog...s-blog.jp/2024-11-15
やれやれ、 -
SSブログはArchiveTeam辺りが取ってくれないかな
頼み方?が分からんけど -
これホスティングしているブログのID一覧って取る手段ない感じ?
新着記事一覧とか見てもページングが20件くらいしかない
URLの形式はこうと。
https:// [*].blog.ss-blog.jp/
新着1000件はこれで見れるが…
https://blog.ss-blog.jp/index.xml -
2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505
2025/03/31 閉鎖 魔法のiらんど >>653
2025/03/31 閉鎖 SSブログ https://blog-wn.blog...s-blog.jp/2024-11-15
あれ、iらんどと同じ日なのか… -
そうか必要なのは blog.ss-blog.jp のサブドメイン一覧か
勘違いした申し訳ない -
>>961
それだと既にアーカイブされているURLしか見つからない訳で、
既にアーカイブされてるなら、あれ もうする事なくねって思っちゃう…
まあ各ブログの個別の記事を改めて明示的にアーカイブするとかあるけどさ。 -
>>920
IAと契約して魔法使いになってよ
通常英語になるアマゾンを日本語でアーカイブさせた例
一般人:https://archive.is/FVU6Z
買った商品の記録に「おま国」発動
This item cannot be shipped to your selected delivery location. Please choose a different delivery location.
魔法使:https://archive.is/wEGlh
一般人:https://archive.is/pNf8p
魔法使:https://archive.is/HPeoy -
愛知県民さんこんばんわ
https://web.archive.....co.jp/dp/B0CKLF9WBB -
5chの古いスレの過去ログが復活したから見れるうちにアーカイブ
復活した過去ログは
https://itest.5ch.ne.../kako/test/read.cgi/板名/1690495133
https://kako.5ch.net/test/read.cgi/板名/1690495133
この2パターンあるけどまあどっちでもよさそう。個人的には前者の方が見やすい。 -
しまった、マンガ図書館Zも明日閉鎖か!
マンガ本体はともかく作品一覧だけでも作っておこうと思ったんだが…もう遅い
2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505
2024/11/26 12時 閉鎖 マンガ図書館Z https://closing.mang...info/2114/index.html
2025/03/31 閉鎖 魔法のiらんど >>653
2025/03/31 閉鎖 SSブログ https://blog-wn.blog...s-blog.jp/2024-11-15 -
今年はサービス終了地獄だったな
来年とか更にどうなってしまうのか -
>>969
復活したけど .dat が無いんよね・・・ -
このままいくと2000年代のネット情報は殆ど何も残らなくなりそうだな
ガラケー関係は既に死滅状態だし -
10年以上前の個人サイトのエロ小説とかこう残ってたらなあと期待するがそううまくいかんな
-
エヴァのオリキャラ上等時代のSSとかどこにあるかな
当時のGAINAXは許可サイトのURL一覧ページ作っていたからそこから辿れば見れるかな -
>>954
ソラ、Soよ
>>967-968
なのラ!
≫953🙉はSikiのデフォルト設定にすらDerezzedされてる事も死ぬまでシラなソう
>>955-956
アーカイブしたページがランダムに𝐇𝐫𝐦.化して未採取になるバグの残存リンクも19日に復旧された
4日に執って検証用に再アーカイブを賭けなかったリンクは19日迄ずっと𝐇𝐫𝐦.状態だった
>>939🔲のStack Exchangeも現在はリダイレクトされずにアーカイブが表示される
が、
currently facing some limitationsな𝕏(Twitter)ら辺は、訴えてやられたら全アーカイブボッシュート鴨葱(ビッグデータ至上主義)
そもそも🏛Internet Archiveは、
IA/イエーイ “われ”がダウソたら、🛂https://www.aozora.g...files/127_15260.html。
Wayback MachineにLog in機能は要らん
⌫24時間以内同一IPからならミスキャプチャアーカイブを削除できる機能
がOrgにもTodayにもジェバンニにも要る
Orgはミスキャプチャが多過ぎ!
・note.comの不可文が
>Sorry.
>This URL has been excluded from the Wayback Machine.
ではない>>918🌌
・オーパーツ(>>910❔📁: 無納アドレスを納近アドレスに代替してしまう>>793的なバグ)
が繼続
>>>>>>882➡ ≒ ⬏https://web.archive....format=png&name=orig -
糖質はスルー推奨
-
今回のトラブル中に残せなかったのがいくつもある
-
>>970
https://info.seesaa....ticle/505833903.html
閉鎖では(現状)ないが、Seesaaブログ運営会社がしたらばに変更
そういやしたらば(ライブドア)掲示板も過去との連続性どうなってんだろうな
大昔に作って放置されてる掲示板とかどうなってんだろ -
vectorの個人作者ホームページ終了まで残り20日
-
アーカイブって訳じゃないけど一覧は作って公開した。他に出来る事って無いよね
-
Vectorはもうarchivebot に投げられているっぽいな
https://archive.fart...r/?q=hp.vector.co.jp
https://transfer.arc...p-authors-VA-200.txt -
>>987
こんなサイトあったのか知らなかった -
🔭https://web.archive....o-star-viewer-210607
Org恒例の画像が表示されないパターンのアーカイブだったけど、
ダウソ板で使う予定の一枚を11月28日にキャプチャしたら他画像も2024/11/30から未来トランクス
現在は、サムネが途中からひどくありふれたホワイトノイズだがTodayからは観らるる: 👍https://archive.Today/Gj67i
🏛https://archive.Today/vcfxp
>同時点で収集されたものとは限らず、1年以上の時間差があることも稀ではない。
🧳http://img1.gamersky...57_2015141411DC2.jpg
実際に同一URL差し替え異画像をチェ───ンジ!!!!!しもうてたら//web.chimera.orz/
🖼画像の欠けたアーカイブは、クローラーやsave-page-now-outlinksの仕業じゃ! >>>134-143
このポンコツ仕様、中の誰一人としてコレジャナイと思わんのか?
>>918❔✅アドレスはoutlinksの無納 ∴ outlinksは(゚⊿゚)イラネ
複アカまで使ってキャプチャ数制限をリミットブレイクしちゃってるこのスレの██は
セーブしたアーカイブの🧬https://archive.Toda...6ac981885eb725b5.jpg
なんてまずcf.してないヨネ。██だから
>>910🗓
OCT 11~NOV 1が🈳だったのが現在は🔵
ご乱立botクローラが無駄ァに重合しまくってるナニコレ珍千景、
NOV 24の8450 snapshotsとか総アーカイブ数🜄増しの為にやってんの?w
🔵は、統合者ならクローラ採取や直前との差分発生を記号や色で標示するけどな(💠な区画型アイコンだと多彩標現可)
🇧🇷のURLを5chに記入出来なかった自称魔法使の>>967
>>978⬏のクッキーさんのツイートをダウソ板で遣う調和だから魔法でアーカイブ録っといて
それ、𝕏からログアウトしてると観測問題できない特殊アドレス
🂡
あべべのべを🚉https://archive.Today/vcfxp/imageしたのは
山上ではなく式神なのは🤫デスけ
⌦⛎https://livedoor.blo...mgs/1/0/10a731d5.png -
糖質はスルー推奨
-
ぷららのホームページサービスが来年3月31日に終了するらしい
https://www.docomo.n.../page/240627_01.html -
http://www{1~20}.plala.or.jp/名前
http://business{1~4}.plala.or.jp/名前
ちょっと見てみたら紅白歌合戦完全マニュアルってサイトはぷららホームページサ終と共に閉鎖するそうな
http://www1.plala.or.jp/nakaatsu/
こういうサイトが結構多いかもしれない -
>>991
うおっこれは知らんかった。しかも発表済みだったのか -
ネッ糖フリチャックス
-
Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.n...gi/esite/1733289042/ -
テンプレの>>8
次スレに貼ろうとしたら吸い込まれたんよね -
>>995
乙アーカイブ -
1000
-
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 496日 6時間 6分 47秒 -
5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。
▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/
▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
↑今すぐ読める無料コミック大量配信中!↑
