메타데이터 단계에서 로봇은 자원에 대한 URL을 발견하지만 자원의 컨텐트를 다운로드하지는 않습니다. 따라서 filter.conf 파일 등의 다른 소스에서 파생된 데이터와 URL에 대한 정보를 사용할 수 있습니다. 그러나 이 단계에서 자원의 컨텐트에 대한 정보는 사용할 수 없습니다.
표 19–2 메타데이터 단계에서 RAF가 사용할 수 있는 소스
소스 |
설명 |
예 |
---|---|---|
csid |
카탈로그 서버 아이디 |
x-catalog//budgie.siroe.com:8086/alexandria |
depth |
시작 위치로부터 방문한 링크 수 |
10 |
enumeration filter |
열거 필터의 이름 |
enumeration1 |
generation filter |
생성 필터의 이름 |
generation1 |
host |
URL의 호스트 부분 |
home.siroe.com |
IP |
호스트의 숫자 버전 |
198.95.249.6 |
protocol |
URL의 액세스 부분 |
http, https, ftp, file |
path |
URL의 경로 부분 |
/, /index.html, /documents/listing.html |
URL |
전체 URL |
http://developer.siroe.com/docs/manuals/ |