Wayback Machine

 

<colbgcolor=#222222> '''웨이백머신
Wayback Machine'''

[image]
'''국가'''
미국 캘리포니아
'''사이트 종류'''
저장, 미러
'''소유자'''
Internet Archive
'''설립일'''
2001년 10월 24일
'''작성 언어'''
C언어, Perl
'''회원 가입'''
선택
'''상태'''
사용 가능
'''링크'''
https://web.archive.org
https://archive.org/web/
'''웨이백머신'''
Wayback Machine
1. 개요
2. 기능
3. 문제점
4. 기타
5. 관련 문서

[clearfix]

1. 개요


미국의 비영리재단인 인터넷 아카이브(Internet Archive)에서 제작한 디지털 타임캡슐. 2020년 4월 기준 현재 4240억 개의 페이지가 아카이브 되어있다. 알렉사 인터넷의 컨텐츠와 함께 유지되고 있다.
웨이백 머신에서 자체적으로 보존한 웹 페이지는 저장하고 6~12개월 후에 공개된다. 저장하는 주기가 다르기 때문에 업데이트 때마다 추적, 기록하는 건 아니다. 하지만 어떤 웹사이트는 몇 주 간격이나 또는 하루도 안되어 공개되는 경우도 있다.
특정 웹 페이지의 아카이브를 원하는 경우 https://web.archive.orghttps://archive.org/web/으로 들어가서 자신이 아카이브 하기 원하는 페이지의 주소를 넣으면 된다.
robots.txt크롤링을 막아놓으면 크롤링하지 않는다.
PC 버전 웹페이지 주소를 입력했는데 자동으로 모바일 버전 웹페이지로 저장하는 경우가 있다.

2. 기능


  • 웹 페이지의 예전 모습을 볼 수 있다.
  • API 제공
  • 삭제된 파일 다운로드. 없을 것 같으면서도 있는 경우가 꽤 있다.

3. 문제점


저작권 문제 등 archive.is의 문제점과 거의 같은 문제가 있다. 물론 이쪽은 단순한 박제 보다 더 좋은 용도로도 사용되고 있다. 하지만 함부로 저장했다가 저작권 침해가 되지 않게 주의하자. 또한 잊힐 권리의 문제도 있다.
2019년 5월 5일 기준 웨이백 머신 자체 알고리즘과 다른 홈페이지의 최신 업데이트 알고리즘이 충돌하여 게시물의 댓글이 다른 날짜 게시물의 댓글로 잘못 출력되는 오류가 있다[1].

4. 기타


이 웹사이트를 운영하는 비영리법인 인터넷 아카이브에서는 웨이백 머신 운영 외에도 여러 아카이브 관련 활동에 힘쓰고 있다.

5. 관련 문서



[1] 특히 디시인사이드에서 이런 오류가 심하게 난다.