URLScraper 包含一項機制,可從不同 URL 取得認證內容和從受密碼保護的網站抽取內容。URLScraper 會對指定的 URL 以及使用者憑證發出請求,並且使用傳回的 Cookie 進行階段作業追蹤以及對此網站進行後續呼叫。
管理員可提供:
loginUrl 是 action HTML 表單的屬性,供使用者認證之用。loginUrl 與要抽取的 URL 不同。例如,若要抽取 http://my.yahoo.com,loginUrl 為 http://login.yahoo.com/config/login。
loginFormData 包含使用者憑證,將其視為 HTTP 查詢參數 (例如必須傳遞以進行認證的 HTML 表單屬性)。此處,金鑰為 HTML 表單屬性,值是必須傳遞的使用者憑證。在執行階段,將填入方括弧中的值。
指定是否為 isHttpAuth。此時只支援 Http-Basic Auth。使用使用者憑證,以授權標頭設定 HTTP 標頭。
這是在呼叫 URL 時必須發佈的資料。