사이트들의 예전 모습을 찾아준다고 해서 화제가 되었던 인터넷 아카이브 웨이백 머신. ( http://www.archive.org )
여기서 사이트를 제거하기 위해선 robots.txt 로 수집 및 노출을 제어할 수 있습니다. 다만 웹호스팅을 이전했을 때 로봇파일 설정을 깜빡했다거나 (이건 짐작입니다만) 로봇텍스트 파일을 설정할 수 없는 서비스, 그러니까 도메인은 설정할 수 있게 해주지만 로봇텍스트에 대한 설정을 제공하지 않는 서비스를 이용하게 되면 다시 예전 사이트 내용이 나타날 가능성이 있습니다.
인터넷아카이브 팀에 문의하니 도메인 소유자의 삭제 의사가 명확하고 이걸 몇가지 방법으로 자기네가 확인할 수 있다면 웨이백 머신에서 삭제가 가능하다는 회신을 받았습니다. (사실 완전히 데이터를 지우는지 아니면 다만 표시하지 않기로 한 것인지에 대해서는 묻지 않았습니다.)
전 whois로 확인 할 수 있는 도메인 소유자의 이메일로 삭제 의사를 보낸 후, 해당 서버의 소유자만이 파일을 작성할 수 있는 곳에 삭제의사를 거듭 명시한 텍스트 파일을 만들어서 이 URL을 보내주었습니다.
첫번째 그림은 robots.txt 로 접근제어 하였을 때의 화면이고 두번째 그림은 삭제요청하여 제거된 후의 화면입니다. 메세지가 서로 다르다는 것을 확인할 수 있습니다.
[robots.txt 사용했을 때 조회 화면]
[도메인 소유자의 제거요청 후 조회 화면]
반대로, 등록하고 싶다면 어떻게 하면 될까요?
선생님 혹시 웨이백머신 사이트에서 제 웹페에지와 캡쳐된 url을 삭제하는 방법중에 관리자에게 이메일을 보내서 정당한 이유를 대면 대부분 지워준다고 하는데…맞는 말인가요? 지워준다면 혹시 어떤 식으로 이메일을 작성해야 하는지 아시나요..?
info골뱅이archive.org 문의해보실 수 있습니다. 정확한 양식은 없습니다만 삭제를 원하는 URL과 이유를 적으셔야할 것으로 보이고요, 해당 도메인의 소유주임을 입증해야할 수도 있다고 생각합니다.