"2.3 근거 제시" 중 archive.today(a.k.a. archive.is , archive.ph , archive.md) 서비스 배제에 관한 규정 개정
열림
archive.today(a.k.a. archive.is , archive.ph , archive.md) 는 최근 몇개월간 광범위한 보안 및 신뢰성 이슈에 직면하고 있습니다. archive.today에 접속했을 때 나오는 reCAPTCHA를 인증하는 것만으로 특정 블로 주소에 DDos 공격을 하는 자바스크립트 코드를 실행하도록 하여, archive.today을 열람하거나, 아카이빙하는 것만으로도 나무위키 이용자가 사이버 범죄 행위에 동참하게 됩니다.
현재 archive.today는 유료 구독(paywall) 콘텐츠를 우회하여 보존하고 이에 대한 삭제 요청을 거부하고, 운영자의 신원이 비밀에 감싸져 있어 ## FBI의 수사 대상에 오르기도 하였습니다.
또한, 1번의 DDos 공격과 관련하여, 개인적으로 분쟁이 있는 특정인을 괴롭하기 위하여 아카이브된 스냅샷을 조작하는 등, 아카이브 서비스로서의 신뢰성을 떨어뜨릴 수 있는 행위를 하는 것이 발견되기도 하였습니다. #
이러한 이유로, 최근 위키백과에서는 토론을 통해 archive.is를 악성 사이트로 규정하고 해당 링크를 위키백과에서 전면적으로 제거하고, 더 이상 사용하지 못하도록 스팸 도메인으로 올리기도 하였습니다.
이에 나무위키에서도 해당 아카이브 사이트가 활발하게 이용되는 만큼 논의가 필요하다고 보입니다.
현재 archive.today는 유료 구독(paywall) 콘텐츠를 우회하여 보존하고 이에 대한 삭제 요청을 거부하고, 운영자의 신원이 비밀에 감싸져 있어 ## FBI의 수사 대상에 오르기도 하였습니다.
또한, 1번의 DDos 공격과 관련하여, 개인적으로 분쟁이 있는 특정인을 괴롭하기 위하여 아카이브된 스냅샷을 조작하는 등, 아카이브 서비스로서의 신뢰성을 떨어뜨릴 수 있는 행위를 하는 것이 발견되기도 하였습니다. #
이러한 이유로, 최근 위키백과에서는 토론을 통해 archive.is를 악성 사이트로 규정하고 해당 링크를 위키백과에서 전면적으로 제거하고, 더 이상 사용하지 못하도록 스팸 도메인으로 올리기도 하였습니다.
이에 나무위키에서도 해당 아카이브 사이트가 활발하게 이용되는 만큼 논의가 필요하다고 보입니다.
"2.3. 근거 제시" 문단을 첨부 1과 같이 개정한다. 개정안의 원활한 이행을 위하여, archive.today, archive.is , archive.ph , archive.md 를 나무위키에서 허용되지 않은 도메인으로 지정하도록 운영사에 요청한다.
[첨부1]
다른 아카이브 사이트를 아카이빙한 경우에는 원본 아카이브가 사용 가능해야 합니다. 아카이브된 게시글은 등재 시점에서 관련 규정에서 요구하는 조건을 충족했음을 증명해야 합니다.
- [[https://archive.md* - 전체 852 건 / 처리 시간 0.754초
- [[https://archive.today* - 전체 29 건 / 처리 시간 0.427초
- [[https://archive.is* - 전체 1476 건 / 처리 시간 0.457초
- [[https://archive.ph* - 전체 560 건 / 처리 시간 0.543초
- [[https://archive.fo* - 전체 180 건 / 처리 시간 0.646초
- [[https://archive.li* - 전체 72 건 / 처리 시간 0.539초
- [[https://archive.vn* - 전체 180 건 / 처리 시간 0.527초
전체 3,529건으로 많지는 않으나, 인간이 손으로 하긴 무리네요. 봇 운용을 요청해야 할 듯 합니다.
미러 도메인이 몇 개 더 있었네요.
"2.3. 근거 제시" 문단을 첨부 1과 같이 개정한다. 개정안의 원활한 이행을 위하여, archive.today 및 이를 미러하는 도메인(archive.is , archive.ph , archive.md 등) 나무위키에서 허용되지 않은 도메인으로 지정하도록 운영사에 요청한다.
[첨부1]
다른 아카이브 사이트를 아카이빙한 경우에는 원본 아카이브가 사용 가능해야 합니다. 아카이브된 게시글은 등재 시점에서 관련 규정에서 요구하는 조건을 충족했음을 증명해야 합니다.
아카이브 내용만을 근거로 등재된 자료도 있을수 있을꺼 같은데, 해당 규정 소급적용되나요?
아카이브를 아카이브하면 가능하지 않을까요..?
허용되지 않은 도메인으로 지정될 경우 더 이상 해당 링크를 포함하여 문서 저장이 불가능합니다.
웨이백 머신 등 기타 허용되는 아카이브 사이트를 이용하여 주시면 됩니다.
소급하여 적용되지 않는 규정입니다.
토론에서 증명이 완료된 경우 근거가 일부 유실되어도 당시에는 유효했다는 점이 토론 근거와 나머지 게시글로 입증되므로 문제가 없어 보입니다.
그렇다고 보안상 문제가 있는 링크를 지속적으로 사용할 수는 없는데, 사용자님께서 생각하시는 대안이나 좋은 아이디어가 있을까요?
#29 일단 문의 넣었습니다.
한국어로 쓰고 번역한 메일입니다.
[I'm not good to Eng, so I translated this email by Gemini.]
Dear Internet Archive Team,
My name is rapo72, a contributor to Namuwiki, the largest wiki project in South Korea.
Our community is currently in the process of permanently banning all domains associated with "archive.today" (including .is, .ph, .md, .fo, .li, .vn, etc.). This decision follows the discovery of severe security threats: archive.today’s reCAPTCHA has been found to execute malicious JavaScript for DDoS attacks, effectively forcing our users to participate in cybercriminal activities simply by accessing or archiving links.
To preserve the integrity of our citations safely, I am planning a large-scale migration to replace approximately 3,500 existing archive.today links with Internet Archive (Wayback Machine) snapshots.
However, we have encountered a significant technical hurdle: archive.today is actively blocking Wayback Machine’s crawlers, making direct "Save Page Now" requests for these specific URLs impossible.
To resolve this, I am considering the following approach:
Safely extracting HTML content and snapshot data from archive.today.
Bulk-uploading this data to the Internet Archive to ensure these historical records are not lost.
I would like to request your technical guidance on the following:
Are there any established methods to migrate data to your platform when the source site blocks your crawlers?
What is the most efficient way to perform bulk uploads or "Save Page Now" requests for 3,500+ URLs without being flagged by your rate-limiting systems?
Are there specific protocols we should follow to ensure this migration remains fully compliant with your Terms of Service?
We highly value the Internet Archive’s commitment to a free and safe web. We hope to transition our records to your platform as soon as possible to protect our users from further cyber threats.
Thank you for your time and assistance.
Sincerely,
rapo72 Contributor, Namuwiki
한국어로 쓰고 번역한 메일입니다.
[I'm not good to Eng, so I translated this email by Gemini.]
Dear Internet Archive Team,
My name is rapo72, a contributor to Namuwiki, the largest wiki project in South Korea.
Our community is currently in the process of permanently banning all domains associated with "archive.today" (including .is, .ph, .md, .fo, .li, .vn, etc.). This decision follows the discovery of severe security threats: archive.today’s reCAPTCHA has been found to execute malicious JavaScript for DDoS attacks, effectively forcing our users to participate in cybercriminal activities simply by accessing or archiving links.
To preserve the integrity of our citations safely, I am planning a large-scale migration to replace approximately 3,500 existing archive.today links with Internet Archive (Wayback Machine) snapshots.
However, we have encountered a significant technical hurdle: archive.today is actively blocking Wayback Machine’s crawlers, making direct "Save Page Now" requests for these specific URLs impossible.
To resolve this, I am considering the following approach:
Safely extracting HTML content and snapshot data from archive.today.
Bulk-uploading this data to the Internet Archive to ensure these historical records are not lost.
I would like to request your technical guidance on the following:
Are there any established methods to migrate data to your platform when the source site blocks your crawlers?
What is the most efficient way to perform bulk uploads or "Save Page Now" requests for 3,500+ URLs without being flagged by your rate-limiting systems?
Are there specific protocols we should follow to ensure this migration remains fully compliant with your Terms of Service?
We highly value the Internet Archive’s commitment to a free and safe web. We hope to transition our records to your platform as soon as possible to protect our users from further cyber threats.
Thank you for your time and assistance.
Sincerely,
rapo72 Contributor, Namuwiki
재아카이빙을 하기보다는 그냥 남아있는 archive.today 계열 링크들이 원본 내용의 올바른 아카이브라고 추정하는 편이 훨씬 나아 보입니다.
거 난감한 상황이네요. 도대체 뭔 일이 일어난 건지...
혹시 조작 이슈가 대략 언제쯤부터 대두되었는지 알 수 있을까요?
혹시 조작 이슈가 대략 언제쯤부터 대두되었는지 알 수 있을까요?
지난해 말이라... 그렇다면 2025년 10월까지 아카이빙된 내용은 원본과 같다고 추정한다는 단서조항을 넣는다고 해도 좀 문제가 있을 것 같아 애매하네요.
음, 그러니깐 지금까지 저 서비스로 아카이브 이용한 건 다 지워야 한다는 건가요?
아직은 아닙니다.
wayback machine, megalodon을 통한 아카이빙 후 링크 교체를 우선으로 하되 원본이 유실되어 불가능하다면 archive.today 링크를 주석 처리하는 건 어떨까요?
https://megalodon.jp/2026-0219-1634-10/https://archive.ph:443/LZymb
https://archive.md/LZymb
#38 작성자의 이름을 임의로 바꾸는 등 이미 증거가 제시된 상황입니다. 아카이브의 무결성이 훼손되고 있는 것이죠.
https://archive.md/LZymb
#38 작성자의 이름을 임의로 바꾸는 등 이미 증거가 제시된 상황입니다. 아카이브의 무결성이 훼손되고 있는 것이죠.
이 증거가 발각되는 것이 megalodon에 의해 아카이빙되자 다시 또 원래대로 되돌려 놓는 등 아카이브 사이트 소유자로서 지켜야 할 기본적인 윤리와 원칙 조차 지켜지지 않고 있습니다. 해당 아카이브를 한 나무위키 이용자가 조작을 했다는게 아니라, 사이트 소유자가 조작을 했다는 뜻입니다.
지금 논지가 살짝 달라지는데 제 의견은 그 사이트 증거는 더 이상 인정하지 않고 삭제하는게 합당합니다. 다만, 이전의 서술에서의 해당 사이트 아카이브를 인정하지 않기엔 어렵다고 봅니다.
앞으로 생산되는 새로운 아카이브 스냅샷만 조작되는 것이 아닌, 오래된 스냅샷도 조작이 이미 되었다가, 사이트 소유자의 마음에 따라 다시 되돌려지기도 하는 등 2026년 2월 이전과 이후는 크게 중요하지 않은 것 같습니다.
일단 그렇다면 문서 역사상 실제 링크가 링크되었으나 현재 접속이 안되는 상황이면 이는 인정을 하시는 방향인가요?
원본 근거는 삭제되어 확인이 불가하고, 아카이브 근거는 신뢰성이 훼손된 상태인데 사용자님은 무엇을 믿고 해당 서술을 존치해야 한다고 생각하나요?
자 만약에 향후 FBI 수사 결과에 따라 아예 archive.today 사이트가 접속 불능에 쳐했다고 생각한다면, 그 경우에도 서술이 존치되어야 하나요?
해당 아카이브의 관리자가 조작한 내용으로 인해 나무위키에서 문제가 생긴 사례가 있나요?
그리고 archive.today에만 의존했더라도, 그 서술이 토론을 통해 합의안으로 존치된 서술이라면 해당 시점에 나무위키 이용자 모두가 검증한 것으로 간주하고 삭제하지 않는 것도 고려하고 있습니다.
아니면 부칙을 신설해 일정 기간 동안은 근거 명확화를 위한 토론을 발제할수 있다고 하는것은 어떻나요?
나무위키의 역사에 관련되어 있기 때문에
해당 아카이브 사이트로부터 직접 재아카이브를 할 수 있다고 확실히 보장할 수 있는 상황이 아니라면
반대합니다.
이는 #57에도 불구하고 말씀드리는 것이고, 특히 #62의 입장에는 확실한 반대를 하는 것입니다.
2015년 여성시대 대란
해당 아카이브 사이트로부터 직접 재아카이브를 할 수 있다고 확실히 보장할 수 있는 상황이 아니라면
반대합니다.
이는 #57에도 불구하고 말씀드리는 것이고, 특히 #62의 입장에는 확실한 반대를 하는 것입니다.
2015년 여성시대 대란
애초에 해당 사이트는 과거부터 DMCA 요청이나 권리자의 요청을 일절 거절하였는 것을 생각하면 과거부터 이를 사용하기에는 부적절하다고 생각하긴 했습니다.
https://board.namu.wiki/b/qna/2846482
서술 시점에서 원본 글이 있고, 원본 글이 본문 내에 있으면 원칙적으로는 등재 시점에서 등재되었다고 간주되어서 인정되지 않나요?
아카이브 글이 있든 없든 필수는 아닌 것으로 알고 있습니다.
서술 시점에서 원본 글이 있고, 원본 글이 본문 내에 있으면 원칙적으로는 등재 시점에서 등재되었다고 간주되어서 인정되지 않나요?
아카이브 글이 있든 없든 필수는 아닌 것으로 알고 있습니다.
#1의 규정에 따라 본 사이트에서 문제가 발생한 아카이브 사이트에서 지속적으로 허용하는 것부터가 나무위키가 사이버 범죄를 사용자들을 대상으로 주도하고 있다는 꼴이 되어 버립니다.
나무위키에서 해당 사이트의 이용률은 다수 있었으며 상당수 부작용이 추측되지만, 국제적으로 허용되지 않는 사이버 범죄에 가담할수는 없다고 생각합니다.
추가적으로, 무결성에 대해서 이야기하고자 합니다. 한국어 커뮤니티를 대상으로 아카이브 사이트의 임의의 조작이 없었다는 것은 '확인되지 않았다.' 정도이며, 이미 아카이브 사이트에서 아카이브된 자료를 완전 삭제를 하는 방식이 아닌 일부 내용을 임의로 조작하는 것은 무결성에 있어서 신뢰가 깨진 상황입니다. 이에 따라 한국어 사이트에서 무결성 여부가 확인되지 않았다는 것은 있을 수도 있고 없을 수도 있지만 이미 타 사이트의 조작 여부가 증명되었기에 신뢰도가 떨어진다고 반박할 수 있습니다.
해당 사이트는 이미 신뢰도가 떨어졌습니다. 해당 사건 발생 이전의 아카이브 조차도 신뢰도가 떨어지며 해당 사이트를 이용한 아카이브 링크 전부 신뢰도가 떨어지며 원본을 그대로 보존한다고 볼 수 없습니다.
사이버 범죄의 요인으로 활용되는 사이트가 아카이브 보존의 신뢰도도 떨어진다면 규정 개정 토론의 반대 의견과 무관하게 이러한 사이트의 이용을 즉시 막기 위해 운영사측의 개입이 필요할 것으로 생각합니다.
나무위키에서 해당 사이트의 이용률은 다수 있었으며 상당수 부작용이 추측되지만, 국제적으로 허용되지 않는 사이버 범죄에 가담할수는 없다고 생각합니다.
추가적으로, 무결성에 대해서 이야기하고자 합니다. 한국어 커뮤니티를 대상으로 아카이브 사이트의 임의의 조작이 없었다는 것은 '확인되지 않았다.' 정도이며, 이미 아카이브 사이트에서 아카이브된 자료를 완전 삭제를 하는 방식이 아닌 일부 내용을 임의로 조작하는 것은 무결성에 있어서 신뢰가 깨진 상황입니다. 이에 따라 한국어 사이트에서 무결성 여부가 확인되지 않았다는 것은 있을 수도 있고 없을 수도 있지만 이미 타 사이트의 조작 여부가 증명되었기에 신뢰도가 떨어진다고 반박할 수 있습니다.
해당 사이트는 이미 신뢰도가 떨어졌습니다. 해당 사건 발생 이전의 아카이브 조차도 신뢰도가 떨어지며 해당 사이트를 이용한 아카이브 링크 전부 신뢰도가 떨어지며 원본을 그대로 보존한다고 볼 수 없습니다.
사이버 범죄의 요인으로 활용되는 사이트가 아카이브 보존의 신뢰도도 떨어진다면 규정 개정 토론의 반대 의견과 무관하게 이러한 사이트의 이용을 즉시 막기 위해 운영사측의 개입이 필요할 것으로 생각합니다.
12ft.io가 저작권 침해로 폐쇄된 점을 고려할 때, archive.today가 FBI의 수사 대상에 오른 이상 해당 사이트도 폐쇄되기 전에 빨리 문제가 없는 아카이브들을 이관하는 작업을 시작해야 하는 것이 아닌가 하는 생각이 듭니다.
우선 위키 독자들과 편집자들을 대상으로 특정 사이트에 공격을 유도하는 사이트를 빠르게 전면 금지될 필요성이 있다고 생각합니다. 이에 따라 #8 동의하며, 법률적으로 문제가 될 사안이기에 사측에 선제적으로 문의를 남겼습니다.
소급 적용되지 않는 규정이니까 규정상의 근거 링크가 포함되어 있어야 하고 해당 아카이브 사이트가 제시된 경우 일단은 등재 기준 위반을 명목하에 삭제를 함부로 적용을 할 수 없을 것으로 보이긴 합니다.
다만, 문제가 있는 사이트임은 맞으므로 기존의 아카이브 링크를 대량 교체하여야 함에 동의합니다.
다만, 문제가 있는 사이트임은 맞으므로 기존의 아카이브 링크를 대량 교체하여야 함에 동의합니다.
#69
이건 깨진 링크 정상화 규정과 비슷하게 보아야 한다고 생각합니다.
리비전을 살펴보니, 해당 규정은 r661, 즉 2025년 04월 29일부터 효력이 있었습니다. 많은 문서들이 해당 아카이브를 근거로 여러 서술을 남겼겠지요.
#65에서 제시된 2015년 여성시대 대란 문서를 보면 archive.is 링크가 45개 있군요.
이런 이유로 인해 지금 당장 그 아카이브들을 무효화시킨다면 많은 서술들이 삭제될 위험에 처할 것입니다. 특히 논란과 사건사고 등 의견이 많이 갈리는 서술이라면 더더욱 그렇겠지요.
하지만 #1이나 #71의 의견도 당연히 일리가 있습니다. 따라서 저는 #64와 같이 약식 토론을 열 수 있도록 한다던가 하는, 해당 링크를 기반으로 하는 서술이 보증되고 계속 존치될 수 있도록 하는 절차가 추가적으로 수행되어야 한다고 생각합니다.
이건 깨진 링크 정상화 규정과 비슷하게 보아야 한다고 생각합니다.
리비전을 살펴보니, 해당 규정은 r661, 즉 2025년 04월 29일부터 효력이 있었습니다. 많은 문서들이 해당 아카이브를 근거로 여러 서술을 남겼겠지요.
#65에서 제시된 2015년 여성시대 대란 문서를 보면 archive.is 링크가 45개 있군요.
이런 이유로 인해 지금 당장 그 아카이브들을 무효화시킨다면 많은 서술들이 삭제될 위험에 처할 것입니다. 특히 논란과 사건사고 등 의견이 많이 갈리는 서술이라면 더더욱 그렇겠지요.
하지만 #1이나 #71의 의견도 당연히 일리가 있습니다. 따라서 저는 #64와 같이 약식 토론을 열 수 있도록 한다던가 하는, 해당 링크를 기반으로 하는 서술이 보증되고 계속 존치될 수 있도록 하는 절차가 추가적으로 수행되어야 한다고 생각합니다.
깨진 링크 정상화는 외부 검색 엔진과 이동 시 역링크가 자동으로 정리되지 않는 나무위키의 기술적인 이슈로 인하여 만들어진 규정입니다. 본 규정과 비교하기에는 어려움이 있다고 생각합니다.
소급 적용이 아니기에 기존의 아카이브들은 무효화되지 않습니다. 애초에 아카이브가 없더라도 원본 글이 등재 시점에서 있었는 경우에도 원칙적으로는 등재가 가능합니다.
소급 적용이 아니기에 기존의 아카이브들은 무효화되지 않습니다. 애초에 아카이브가 없더라도 원본 글이 등재 시점에서 있었는 경우에도 원칙적으로는 등재가 가능합니다.
#29 html 파일의 경우 중간에 파일이 수정될 우려가 있다는 점을 고려해야 할 듯 합니다.
추가로 Ghostarchive도 유효한 아카이브로 인정하는 것도 고려해 주시기 바랍니다.
현재 위키백과에서 archive.today의 대체제로 언급되고 있고,[1] 한국기술진흥원에서도 언급된 적이 있는 서비스입니다. [2]
추가로 Ghostarchive도 유효한 아카이브로 인정하는 것도 고려해 주시기 바랍니다.
현재 위키백과에서 archive.today의 대체제로 언급되고 있고,[1] 한국기술진흥원에서도 언급된 적이 있는 서비스입니다. [2]
#77 Wayback Machine과 같은 다른 아키이브 서비스들이 잘 사용되지 않던 이유 중 하나로 아카이브투데이의 뛰어난 성능(속도와 저장 능력, 페이월 우회 기능[1])이 있었습니다.
현재 해외에서도 잘 다뤄지고 있는 archive.today 계열 링크들은, 위키미디어에서 추천하는 아카이브 서비스 [2]로 교체가 시작된 상태입니다. (국내에서만 다뤄지는 사건이 아니라면, 나무위키에서는 archive.today의 링크를 교체된 링크로 대체하기만 하면 됩니다.) 고스트아카이브 외 다른 아카이브 서비스라도 해외에서(위키백과 등) 신뢰받고 있다면 나무위키에서도 허용하는 방향으로 규정이 개정되면 좋을 것 같습니다.
현재 해외에서도 잘 다뤄지고 있는 archive.today 계열 링크들은, 위키미디어에서 추천하는 아카이브 서비스 [2]로 교체가 시작된 상태입니다. (국내에서만 다뤄지는 사건이 아니라면, 나무위키에서는 archive.today의 링크를 교체된 링크로 대체하기만 하면 됩니다.) 고스트아카이브 외 다른 아카이브 서비스라도 해외에서(위키백과 등) 신뢰받고 있다면 나무위키에서도 허용하는 방향으로 규정이 개정되면 좋을 것 같습니다.
원본 링크가 유료 서비스로 인하여 근거 제시가 안되는데 아카이브는 허용된다는 것부터가 이상합니다. 애초에 이전부터 나무위키에서 자주 사용되는 링크라서 규정에서도 허용해준 것으로 추정되는데 이제서야 정상화가 이루어지는 느낌입니다. 개인적인 생각으로는 이번에 문제가 생긴 것 외에도 여러 문제가 있었던 사이트이므로 진작 금지되었어야 했다고 생각합니다.
그리고, 갑자기 생각난건데 토론 내에서 아카이브 링크가 첨부된 경우는 어떻게 되나요?
원본 글이 사라졌고 아카이브 글도 증거로 취급되지 않는다면 해당 합의안을 누군가가 파기하려 할 때 어떤 반박 근거를 가져가야 하나요?
이 부분은 불소급 처리가 되는지 궁금합니다.
원본 글이 사라졌고 아카이브 글도 증거로 취급되지 않는다면 해당 합의안을 누군가가 파기하려 할 때 어떤 반박 근거를 가져가야 하나요?
이 부분은 불소급 처리가 되는지 궁금합니다.
ghostarchive.org도 .org로 비영리를 표방하기는 하지만, 그 운영 주체가 누군지에 대해서는 함구하고 있어 솔직히 권장하고 싶지는 않습니다. 다만 아직까지 딱히 문제는 없으니 archive.today가 그랬듯 믿고 쓰면 되지 않을까 하네요. 저라면 웨이백 머신에서 되지 않는 사이트들만 나머지 두 사이트를 시도해 볼 것 같습니다.
저명성이나 운영측면에서도 웨이백 머신이 조금 더 적합한 거 같긴 합니다.
메갈로돈은 24시간 내 60회 제한이 있어 웨이백머신이 적합한 것 같습니다.
계속 진행 후 규정 개정 토론 개정안에 의거하여 요청드리면 될 것 같습니다.
현재 전수 조사 후 재보존을 위한 프로젝트 개설이 진행 중입니다.