X

Internet Archive総合 (web.archive.org) #3

レス数が950を超えています。1000を超えると書き込みができなくなります。
2020/04/02(木) 02:08:09.83
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。


前スレッド
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
2021/05/08(土) 23:10:05.55
>>852
おお、ありがとうございます
保存までに時間が掛かるんですね
855名無しさん@お腹いっぱい。
垢版 |
2021/05/09(日) 02:38:40.84
>>844
画像のアドレスの仕様にもよるがしおりをつけておかないと後で検索のしようがなくなりがちなやつ
imgurの画像とかも保存自体は出来るがどこの何の画像なのかはどこかに記載されてないとカオスに
2021/05/09(日) 03:59:33.78
>>852
それ動画ページが見れるだけで動画自体は保存されないんじゃないの?
2021/05/09(日) 04:04:52.08
>>853
YouTubeのビデオは、訴えられる危険を犯した専用の解読スクリプトを書かないと
ビデオを保存できないので無理。

imgurのようなビデオに静的なリンクを張っている所とは違う。

https://web.archive.org/web/20210508173359/https://imgur.com/z55iZcq

<video draggable="false" playsinline="" autoplay="" … >
<source type="video/mp4" src=
"https://web.archive.org/web/20210508173359oe_/https://i.imgur.com/z55iZcq.mp4"
></video>
858名無しさん@お腹いっぱい。
垢版 |
2021/05/09(日) 04:48:52.27
動画自体も保存されてるよ。自動クロール率は低いけど
適当にURL貼るとこれとか
http://web.archive.org/web/20150815193649/https://www.youtube.com/watch?v=WJzSBLCaKc8
2021/05/09(日) 21:18:48.23
>>858
消されてない動画の場合、見るたびにそっちを取りに行ってる可能性がある
まぁ自分も詳しくないので詳しい人いたら教えてほしい
2021/05/10(月) 02:03:24.91
>>859
保存された動画を再生してるみたい
動画のソース
http://web.archive.org/web/20170214133548oe_/https://r4---sn-n4v7sne7.googlevideo.com/videoplayback?ipbits=0&mm=31&mn=sn-n4v7sne7&ratebypass=yes&expire=1487100946&signature=CA5A22657FBABB6AE773DB9B798B5BA86AE9B362.763F505CD7B9A750710077F92F766E70F1A57187&requiressl=yes&sparams=dur%2Cid%2Cinitcwndbps%2Cip%2Cipbits%2Citag%2Clmt%2Cmime%2Cmm%2Cmn%2Cms%2Cmv%2Cpl%2Cratebypass%2Crequiressl%2Csource%2Cupn%2Cexpire&ms=au&mt=1487079325&upn=NGplNw4c3TQ&mv=m&dur=291.108&pl=20&itag=22&key=yt6&ip=207.241.229.47&lmt=1472445730364669&mime=video%2Fmp4&id=o-ADUZW6CaxfO1uC---vHzDaHvx1GQWxmO717IBgPDVTS0&source=youtube&initcwndbps=2738750&signature=
2021/05/10(月) 02:10:49.84
Youtubeの動画とかもちゃんと保存されんのか……
2021/05/10(月) 02:13:29.44
YouTubeは定期的に仕様変更してるからIAがそれに対応していくのは難しいらしい
だから昔のページだと動画が保存されてるのもあるけど今はされてない
2021/05/10(月) 05:21:32.71
>>862
自分もよく分かってないけど今も保存されてるっぽいよ
昨日の動画が保存されてたから
http://web.archive.org/web/20210509030617/https://www.youtube.com/watch?v=ZxjaW7zGTbA
2021/05/10(月) 14:48:04.32
またサーバーが落ちたのか繋がらないな
archive.orgの方は接続出来るみたいだが…
2021/05/10(月) 16:09:21.18
ttps://archive.org/stats/
日本時間で14時20分すぎから鯖落ち中らしい
2021/05/10(月) 16:34:25.60
web.archive.org までは到達できている。また内部のネットワーク障碍か。
2021/05/10(月) 17:37:18.38
復旧したっぽい
2021/05/11(火) 13:44:37.60
なんか今日はIAの調子やたらいいな
これまで表示されなかったスクショなんかもちゃんと取れてるし
869名無しさん@お腹いっぱい。
垢版 |
2021/05/11(火) 15:27:21.28
Youtubeは少なくとも今年1月にとった分は動画まで保存できてたから、時間が経てば取れると思う。
2021/05/11(火) 19:00:41.67
>>847
わからん…
871名無しさん@お腹いっぱい。
垢版 |
2021/05/14(金) 18:54:25.52
waybackmachine使っただけで訴えられた事例とかあるの?
2021/05/15(土) 00:01:24.67
IA自体はともかく利用者はないだろ
873名無しさん@お腹いっぱい。
垢版 |
2021/05/15(土) 00:54:51.91
ウェブ魚拓保存者がIP開示されたケース
https://gigazine.net/amp/20090628_megalodon
2021/05/15(土) 02:45:03.16
ウェブ魚拓はそういうのもあって今は利用していない
2021/05/16(日) 07:35:08.10
429エラーでもこれはお手上げ
876名無しさん@お腹いっぱい。
垢版 |
2021/05/17(月) 10:22:21.67
Cannot get status of 16進数(32桁)というのが出る
2021/05/18(火) 16:27:53.74
保存日時の情報は記録されているけれど、外部リンク調査日時の記録はされていないんだろうな。
これも記録してあればいいのに。
2021/05/18(火) 18:54:24.22
なんではてなブログアーカイブするとfacebookなんちゃらになるんだ
2021/05/19(水) 03:51:09.54
ツイッターも意味不明な表示になったがちゃんと正式urlでアーカイブされてた
2021/05/19(水) 23:05:23.86
サイト内のzip落としたらUAが表示される某サイトで
二度Sorry出したら二度ともUAが表示されていたから保存されてはいるようだ
2021/05/20(木) 17:13:05.62
Cannot save Internet Archive URLs!
今日はこのエラー連発で1時間後にやり直したらできたり不安定すぎる
保存できなかった理由も書いてない
2021/05/21(金) 18:08:48.24
Twitterで特定のアカウントだけexcludedってあるんだな
本人が申請したっぽいけど
2021/05/22(土) 13:44:06.50
ハイパーリンクの情報は当然持ってるとして各ファイルの被リンク情報はなくてもやっていけるんだろうかと少々心配になる
ビッグデータとして利用する客が考えればいいことか知らんが
2021/05/23(日) 07:32:01.41
そもそも今のIAはとにかく情報を溜め込むことだけ考えてそれをどう活用するかは今後次第って感じじゃないかなあ
現状のsaveだけでもサーバー不安定になるレベルで常にやってるし(それでも全然間に合ってなさそうなのが怖いが)
2021/05/23(日) 22:01:09.82
URLで検索してアーカイブ一覧を表示しようとすると次のエラーが出るのだけど
混雑で検索エンジンが止まってるだけかな

The search engine encountered the following error: invalid or no response from Elasticsearch
2021/05/24(月) 07:19:04.30
ほう https://www.elastic.co/jp/what-is/elasticsearch
887名無しさん@お腹いっぱい。
垢版 |
2021/05/25(火) 04:48:03.82
>>507
ページ全体は無理だが画像などバラのパーツは個別に保存が可能だったりすることもある
ザル運営のブラウザゲームなどはありがち
2021/05/25(火) 08:24:52.11
Cannot fetch the target URL due to system overload.
ナニコレ
2021/05/25(火) 08:29:38.17
>>888
> due to system overload
そういうことだろ
2021/05/25(火) 17:48:23.78
>>888
https://translate.google.co.jp/?sl=auto&;tl=ja&text=Cannot%20fetch%20the%20target%20URL%20due%20to%20system%20overload.%20&op=translate&hl=ja
891名無しさん@お腹いっぱい。
垢版 |
2021/05/25(火) 23:05:34.28
オーバーロードはなろう系で唯一お薦めできる作品
2021/05/26(水) 03:28:24.76
最近データベースの入れ替えでもしてるの?
Explore more than X billion web pages saved over time
のXが一瞬半分になったり変動がすごい
2021/05/26(水) 05:53:27.55
オーバーロードが良かったのは一期だけ(アニメ
894名無しさん@お腹いっぱい。
垢版 |
2021/05/26(水) 18:10:11.99
This snapshot cannot be displayed due to an internal error.
895名無しさん@お腹いっぱい。
垢版 |
2021/05/26(水) 21:05:39.01
回復したかな
2021/05/27(木) 03:31:52.31
system overloadが出ても/*/の後にURLつけると保存できてることがあるので、
一応確認してみるのおすすめ
2021/05/27(木) 22:10:47.88
保存時間の間隔が30分から45分になってる…
2021/05/28(金) 02:03:32.64
アイヤー
2021/05/28(金) 09:59:53.85
http://homepage2.nifty.com/

This URL has been excluded from the Wayback Machine.
になってるのはなんでだろう?ジオシティーズみたいな普通のホームページサービスだったみたいだけど
2021/05/28(金) 10:04:26.18
>>899
> ジオシティーズみたいな普通のホームページサービスだったみたいだけど

ワロタ
2021/05/28(金) 15:24:41.10
ジオシティーズやトクトクは普通だけどフリーティケットシアターは普通じゃない的な
2021/05/30(日) 04:42:48.43
/*/はFail with status: 498 No Reason Phrase
2021/05/30(日) 17:45:08.98
なるべく円高米ドル安の時に寄付したほうがいいんだろうな。
2021/05/30(日) 19:21:56.74
batchのページ開いてもトップに飛ばされてしまうようになった
2021/05/31(月) 01:22:39.81
batchのページが復活したっぽい。よかった
2021/06/01(火) 03:49:59.92
swfのあるページの取得厳しいんだっけ
Cannot fetch the target URL due to system overload.がでる

todayのほうで試したらプロセスが空白で進行せず
megarodonは見かけ上はとれてるがソースからswfの現物アドレスを消して保存してるっぽい

ファイル固有の問題だろうか
デバッガでは開けるんだが
2021/06/01(火) 04:36:21.94
swfってただのファイルじゃないの
どうしてそんなことが起こるのですか
2021/06/01(火) 11:28:13.18
We only allow new captures of the same URL every 45 minutes.
2021/06/01(火) 13:18:27.55
That's too hard to me...
2021/06/01(火) 13:20:35.24
激遅の/save/で行けたりしない?>swf
保存できても表示が更新されないので本当に保存されているか未確認だけど
2021/06/01(火) 17:10:58.68
flash表示システムってどうなったんだっけ
2021/06/01(火) 19:40:12.28
サポート終了で表示できないっぽい
2021/06/02(水) 01:04:22.30
ファイル1個だけなら画像の確認とかやらないから拡張子関係なく超高速で保存できるはずだけど
2021/06/02(水) 01:50:07.20
Cannot fetch the target URL due to system overload.
出すぎ
915名無しさん@お腹いっぱい。
垢版 |
2021/06/02(水) 04:57:26.97
>>910
個別のswfのアドレス投げ込んだら保存できたからひとまずはいいことにする
開くときは開けるアドレスを知ってないとあかんね
デバッガだと「swfを置いてるページ」では開けないんでarchiveのソースに書かれてる現物のアドレスを掘り出してデバッガに渡すまでしないと開かない
(開けるのは確認できた)

>>911
なんかアナウンスされてたよね archiveのswf全部を勝手にブラウザ上で再生してくれるようなものを期待しちゃうけど
そこまでするのは結構大変なはず
2021/06/02(水) 08:47:16.75
3Gガラケーの本体自体にフラッシュの再生機能付いててアーカイブ含め見れるが画面が小さいのがあかんな
ガラケー向けの時計フラッシュまちうけフラッシュは本体が壊れない限り確実に永遠に見れるけどペリーのピアノ講師ネタとか永遠に失われそう
2021/06/02(水) 14:33:51.58
SPNを保存されたかの確認に使うというわけ分からん状況になってる。
誰かが過去に保存したであろう複数ページの記事が途中歯抜けで保存されているのを見かけた。保存失敗か?
元の記事はもう見れないから補完してあげることもできなかった。
918名無しさん@お腹いっぱい。
垢版 |
2021/06/02(水) 14:54:32.98
twitterの保存だけやけに時間かかるんだけど
919名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 00:42:55.87
「Ruffle」というchrome拡張機能使えばFlash見れるよ
920名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 01:11:29.08
Sorry
You have already reached the limit of active sessions

先週からエラー出まくり
2021/06/09(水) 06:03:50.69
>>920
おまいさんのやり方が悪いだけ。先月の制限強化に引っ掛かってるんだろ。
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
> 2021-05-23
> Anonymous users have lower concurrent captures limit (limit=3) compared to authenticated users (limit=5).

制限値を超えないよう、保存開始のタイミングを調整するしか無い。
アカウントを作ってログインすれば従前の制限値に戻る上、空きセッション数を API で
得られるようになるので、自動的に空きを待ってから保存するようなシステムも
組めるようになる。
https://web.archive.org/save/status/user (ログインしていなければ 503 エラー)

Change Log に記載は無いが、ログイン済みユーザの制限値は 6 に緩和されている模様。
("available":6)
2021/06/09(水) 15:34:51.37
なんかリファラー変更ができなくなったっぽいんだけど俺環?
2021/06/09(水) 16:25:44.73
ブラウザが (IA のヘッドレスブラウザも含めて) リファラを送らなくなったとか
そういう話じゃ無くて?
2021/06/09(水) 17:46:21.43
マジか。じゃ もうリファラ必要なサイトは保存できなくなったのか
925名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 18:29:55.92
制限するぐらいなら、有料化しろよ
2021/06/10(木) 05:14:53.41
金ローの画像はどういう仕組みなんだろう
https://kinro.ntv.co.jp/lineup/20210611
保存ができてるのかできてないのかがようわからん

/*/上の階層/*/ってファイルサイズは見れんよね
2021/06/10(木) 09:28:25.29
API を使うとクッキーも送れるけど、ハイジャック耐性の無いユルいサイトしか使い道が無いな。
http://web.archive.org/web/20210610001000/taruo.net/e/
ちなみに force_get を 0 (または省略) にしておかないと capture_cookie を指定しても無視される。
2021/06/10(木) 09:46:43.59
そうそう、IA のアーカイブはサーバのレスポンスヘッダが丸ごと保存されていることに留意。
つまり Set-Cookie でクッキーが返されていた場合、それも保存されているという事。
ログイン管理にクッキーを利用しているサイトで、アーカイブのデータを利用して
誰かに勝手にログインされるという事も起こりうる。
2021/06/10(木) 16:53:57.18
なにそれこわい
2021/06/12(土) 22:30:39.38
また繋がらなくなった?
保存しようとしても503やら404の画面になるんだけど…
2021/06/12(土) 22:36:49.23
そうみたい
2021/06/12(土) 22:49:26.53
しばらくは駄目そうだな
2021/06/12(土) 23:14:58.67
最近、頻繁に使うようになったけど、今繋がらないみたいだね。
だいたいどれくらいで復帰するんだろうか?
1日2日はかかるかな?
2021/06/12(土) 23:18:19.16
503エラー?
2021/06/13(日) 00:44:05.86
さっき見たときは直ってた
2021/06/13(日) 08:29:59.22
親切な表示が出るようになってる
You may close your browser window and the page will still be saved.
2021/06/13(日) 17:29:48.96
さじをなげたか
2021/06/14(月) 11:43:37.62
Batch Archiveに入れない
2021/06/15(火) 07:00:28.90
向こうで計画停電が起こるみたいだから、こっちの時刻で16日の0時30分からしばらくサービス停止するらしい。
https://i.imgur.com/upjcBi3.png
https://www.jisakeisan.com/?y=2021&;m=6&d=15&hh=8&mm=30&t1=pdt&t2=jst
2021/06/15(火) 09:25:17.87
>>939
Due to a planned power outage, our services will be reduced on Tuesday, June 15th, starting at 8:30am PDT until the work is complete. We apologize for the inconvenience.

この程度の英文すら機械翻訳使わなきゃ読めない低能
2021/06/15(火) 14:04:45.44
喧嘩はよそで一人でやってろよ
2021/06/15(火) 15:21:07.34
人は上から目線で間違いを訂正するときに性行為より快感を感じるらしい
943イモー虫
垢版 |
2021/06/18(金) 20:45:23.13
読み込み機能は機能しているのか
2021/06/19(土) 14:06:16.43
The capture is estimated to start in 120 minutes. You may close your browser window and the page will still be saved.

うっかりログインし忘れるとこれだわw
2021/06/19(土) 18:36:08.03
523分待ちだったわ 撮ってくれるんならまあいいけど
2021/06/19(土) 19:35:06.80
>>899
members.jcom.home.ne.jpも This URL has been excluded from the Wayback Machine.になるね
2021/06/19(土) 21:03:13.89
残り763分
2021/06/19(土) 23:24:40.50
今968分待ち、今日中に1000分超えるかな
2021/06/20(日) 00:40:25.87
1085分、てかアカウントでログインして保存しようとしてもこの表示出るじゃん
アカウント作った意味ないわ
2021/06/20(日) 01:26:26.34
待ち時間が一度表示されてしまうと、その後ログインして
同じURLの再保存を試みても待ち時間が延びるだけ。
2021/06/20(日) 03:44:33.22
1393分待ちになってる
952名無しさん@お腹いっぱい。
垢版 |
2021/06/20(日) 12:42:15.80
保存は匿名で出来るんですか?
2021/06/20(日) 12:58:58.94
まだログインしないと待ち時間が出る状態なの?
ご愁傷様w
2021/06/20(日) 15:59:50.29
今は直ってるな
というか別に待ち時間があっても後で保存されるんだから良くね?
レス数が950を超えています。1000を超えると書き込みができなくなります。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況