필터링 중에 지원 함수를 사용하면 자원에 대한 정보를 조작하거나 생성할 수 있습니다. 그런 다음 로봇은 필터링 함수를 호출하여 자원을 처리할 수 있습니다. 이 함수는 filter.conf 파일의 열거 및 생성 필터 모두에 사용할 수 있습니다.
assign-source 함수는 해당 정보 소스에 새로운 값을 할당합니다. 이 함수는 필터링 과정에서 편집을 허용합니다. 또한 명시적인 새 값을 할당하거나 다른 정보 소스의 값을 복사할 수 있습니다.
값을 변경할 소스의 이름
명시적인 값을 지정합니다.
dst로 복사할 정보 소스
value 등록 정보 또는 src 등록 정보를 지정해야 하며 둘 모두 지정할 수는 없습니다.
Data fn=assign-source dst=type src=content-type
assign-type-by-extension 함수는 자원의 파일 이름을 사용하여 그 유형을 결정하고 추가적 처리를 위해 이 유형을 자원에 할당합니다.
setup-type-by-extension 함수를 설정 중에 호출해야 assign-type-by-extension을 사용할 수 있습니다.
비교할 파일 이름의 소스입니다. 소스를 지정하지 않으면 기본값은 자원의 경로가 됩니다.
MetaData fn=assign-type-by-extension
clear-source 함수는 지정된 데이터 소스를 삭제합니다. 일반적으로 이 함수는 수행할 필요가 없습니다. assign-source 함수를 사용하면 소스를 만들거나 교체할 수 있습니다.
삭제할 소스 이름
다음 예에서는 경로 소스를 삭제합니다.
MetaData fn=clear-source src=path
convert-to-html 함수는 자원 유형이 지정된 MIME 유형과 일치하는 경우 추가 처리를 위해 현재 자원을 HTML 파일로 변환합니다. 변환 필터는 변환 중인 파일 유형을 자동으로 감지합니다.
변환할 MIME 유형
다음 순서로 함수를 호출하면 필터가 모든 Adobe Acrobat PDF 파일, Microsoft RTF 파일 및 FrameMaker MIF 파일 그리고 파일을 전달하는 서버에서 유형을 지정하지 않은 모든 파일을 HTML로 변환합니다.
Data fn=convert-to-html type=application/pdf
Data fn=convert-to-html type=application/rtf
Data fn=convert-to-html type=application/x-mif
Data fn=convert-to-html type=unknown
copy-attribute 함수는 자원 설명의 한 필드에서 다른 필드로 값을 복사합니다.
복사해 올 자원 설명의 필드
소스를 복사해 넣을 자원 설명의 항목
복사할 소스의 최대 길이
잘려진 텍스트를 단어의 일부분으로 남겨 두지 않고 수정할지 여부를 나타내는 부울 등록 정보. 이 등록 정보는 기본적으로 false입니다.
Generate fn=copy-attribute \\
src=partial-text dst=description truncate=200 clean=true
generate-by-exact 함수는 지정된 값의 소스를 생성하지만 기존 소스가 또 다른 값과 정확히 일치하는 경우에만 그렇습니다.
생성할 소스의 이름
dst를 할당할 값
일치 대상으로 사용할 소스
다음 예는 호스트가 www.siroe.com인 경우 분류를 siroe로 설정합니다.
Generate fn="generate-by-exact" match="www.siroe.com:80" src="host" value="Siroe" dst="classification"
이 generate-by-prefix 함수는 기존 소스의 접두어가 다른 값과 일치하는 경우 지정된 값의 소스를 생성합니다.
생성할 소스의 이름
dst를 할당할 값
일치 대상으로 사용할 소스
src와 비교할 값
다음 예에서는 프로토콜 접두어가 HTTP인 경우 분류를 Compass로 설정합니다.
Generate fn="generate-by-prefix" match="http" src="protocol" value="World Wide Web" dst="classification"
generate-by-regex 함수는 기존 소스가 정규식과 일치하는 경우 지정된 값의 소스를 생성합니다.
생성할 소스의 이름
dst를 할당할 값
일치 대상으로 사용할 소스
src와 비교할 정규식 문자열
다음 예는 호스트 이름이 정규식 *.siroe.com과 일치하는 경우 분류를 siroe로 설정합니다. 예를 들어 developer.siroe.com과 home.siroe.com에 있는 자원은 모두 Siroe로 분류됩니다.
Generate fn="generate-by-regex" match="\\\\*.siroe.com" src="host" value="Siroe" dst="classification"
generate-md5 함수는 MD5 체크섬을 생성하고 이를 자원에 추가합니다. 그런 다음 filter-by-md5 함수를 사용하여 중복된 MD5 체크섬을 가진 자원을 거부할 수 있습니다.
없음
Data fn=generate-md5
generate-rd-expires 함수는 만료 날짜를 생성하고 이를 지정된 소스에 추가합니다. 이 함수는 HTTP 헤더와 HTML <META> 태그와 같은 메타데이터를 사용하여 자원에서 만료 날짜 데이터를 얻습니다. 데이터가 없으면 이 함수는 현재 날짜로부터 3개월 후를 만료 날짜로 생성합니다.
소스의 이름. 생략하는 경우 소스 기본값은 rd-expires입니다.
Generate fn=generate-rd-expires
generate-rd-last-modified 함수는 현재 시간을 지정된 소스에 추가합니다.
소스의 이름. 생략하는 경우 소스 기본값은 rd-last-modified입니다.
Generate fn=generate-last-modified
rename-attribute 함수는 자원 설명의 필드 이름을 변경합니다. 이 함수는 extract-html-meta 함수를 사용하여 <META> 태그에서 필드로 정보를 복사하고 해당 필드의 이름을 변경할 때 가장 유용합니다.
한 이름에서 다른 이름으로의 매핑을 포함하는 문자열
다음 예에서는 속성 이름을 author에서 author-name으로 변경합니다.
Generate fn=rename-attribute src="author->author-name"