再開可能クロールについて

このトピックでは、再開可能クロールの概要について説明します。

再開可能クロール(別名: 再起動可能クロール)は、以前の完全クロールまたは再開クロールのシードURLを使用するクロールです。また、より深いレベル、または異なる構成設定のセット、あるいはその両方を使用します。

クロールを再開するには、-r (または--resume)コマンドライン・フラグを使用します。履歴にはすでにクロールされたシードURLおよびURLリストが含まれているため、再開可能クロールは、ワークスペース・ディレクトリにある以前に作成されたクロール履歴を使用します。再開可能クロールでは、履歴でステータスが「完了」のURLは再クロールされません。

再開可能クロールの想定されるユースケース・シナリオは次のとおりです。
再開クロールのルールは次のとおりです。