Notice
Recent Posts
Recent Comments
Link
- Arawn's Dev Blog
- Outsider's Dev Story
- Toby's Epril
- Benelog
- NHN 개발자 블로그
- SK 플래닛 기술 블로그
- OLC CENTER
- 소프트웨어 경영/공학 블로그
- 모바일 컨버전스
- KOSR - Korea Operating System …
- 넥스트리 블로그
- 리버스코어 ReverseCore
- SLiPP
- 개발자를 위하여... (Nextree 임병인 수석)
- "트위터 부트스트랩: 디자이너도 놀라워할 매끈하고 직관…
- Learning English - The English…
- real-english.com
- 'DataScience/Deep Learning' 카테…
- Deep Learning Summer School, M…
- Deep Learning Courses
민서네집
검색엔진 수집거부 robots.txt 검사 본문
Google의 웹마스터 도구 (https://www.google.com/webmasters/tools/home)로 들어오고, 검사하려는 사이트를 등록한다.
좌측의 대시보드에서 크롤링의 하위 메뉴로 robots.txt 테스터를 클릭한다.
없던 robots.txt 파일을 업로드 하고나서 웹부라우저에서는 robots.txt 파일이 보이는데, robots.txt 테스터에서는 404 에러가 나서 당황스러웠는데,
테스트 할 때마다 robots.txt 파일을 가져오는게 아니라
<최신 버전이 표시된 날짜>에 표시된 시간에 가져온 것을 기준으로 해서 테스트를 하는 것이다.
그래서 변경된 것을 반영하려면 "제출" 버튼을 눌러서 robots.txt 테스터에게 변경되어서 새로 반영해야 함을 알려줘야 한다.
그런 다음 테스트를 해 보면 잘 반영되는 것을 확인할 수 있다.
ROBOTS.TXT로 URL 차단
robots.txt 파일에 대해 자세히 알아보기
https://support.google.com/webmasters/answer/6062608?hl=ko&ref_topic=6061961&rd=1
메타태그를 사용하여 검색 색인 생성 차단하기
https://support.google.com/webmasters/answer/93710
NOINDEX 메타 표준을 사용하면 페이지별로 사이트에 대한 액세스를 관리할 수 있으므로 서버에 대한 루트 액세스 권한이 없는 경우에 유용합니다.
사이트 페이지의 색인을 생성하지 못하도록 대부분의 검색엔진 웹 크롤러를 차단하려면 다음 메타태그를 페이지의 <head>
섹션에 삽입합니다.
<meta name="robots" content="noindex">
'WEB (HTML, CSS)' 카테고리의 다른 글
“아이패드에서 플래시 광고 보기”, 자바스크립트로 구현 (0) | 2014.10.14 |
---|---|
float을 clear하는 4가지 방법 (0) | 2014.10.13 |
Google Analytics (0) | 2014.09.25 |
[Javascript] 이벤트 핸들러 함수 보기 (0) | 2014.09.22 |
focus 이벤트가 어디서 오는지 구분하기(Keyboard or Mouse) (0) | 2014.09.19 |
Comments