검색엔진 배제표준(Robots Exclusion Protocol)

IT정보2013. 3. 4. 11:09

보안이 필요한 내용이 검색엔진에 유출 되지 못하도록 웹페이지를 작성하는 방법을 기술한 국제기술표준

크롤러 같은 웹로봇을 막을 수 있는 규약입니다.

웹서버의 홈페이지 최상위 디렉토리에 robots.txt 파일을 만들어 사용합니다.

하나의 robots.txt 만을 가질 수 있으며, "robots.txt" 문자열은 모두 소문자, 공백 허용 X

User-agent : // 밑의 규칙을 적용할 로봇이름

Allow : // 수집 허용 페이지

Disallw : // 수집 거부 페이지

ex ) 모든 검색 로봇들에게 노출

User-agent : *

Disallow :

ex ) 모든 검색 로봇들에게 노출 X

User-agent : *

Disallow : /

ex ) 특정 검색 로봇에게만 노출 X

User-agent : 로봇이름

Disallow : /

ex ) 특정 URL 노출 X

User-agent : *

Disallow : /logs

Posted by 건깡

흘러간다...