dedup

Utilizzare il comando dedup per rimuovere i risultati che contengono la stessa combinazione di valori di campo in base all'ordine di ricerca generato mediante il comando sort.

Sintassi

dedup <dedup_options> <field_name> [, <field_name>, ...]

Parametri

La tabella seguente elenca i parametri utilizzati in questo comando e le relative descrizioni.

Parametro descrizione;

field_name

Specificare il campo i cui valori devono essere controllati per i duplicati.

dedup_options

Sintassi:

[count = <count>][includenulls = [true|false]] [consecutive = [true|false]]

count: specifica il numero di duplicati da restituire. Il valore predefinito è 1, se non specificato.

includenulls: include i risultati in cui i campi dedup sono nulli. Il valore predefinito è false, se non specificato.

consecutive: rimuove solo i risultati con combinazioni duplicate di valori consecutivi. Il valore predefinito è false, se non specificato.

I seguenti gruppi di query registrano in base a ogni combinazione univoca di città host client e IP, calcola la somma delle dimensioni del contenuto per ogni gruppo, ordina ogni gruppo in base all'ordine decrescente delle dimensioni del contenuto e infine rimuove le righe duplicate per una città host client. In questo modo vengono mantenute solo le righe corrispondenti alle dimensioni di contenuto più elevate per ogni città host del client:

* | stats sum('Content Size') as 'Content Size' by 'Client Host City', 'Source IP'
    | sort -'Content Size'
    | dedup 'Client Host City'

Con l'interrogazione precedente, la tabella dei record risultante contiene tre colonne Client Host City, Source IP e Content Size.

Se si specifica l'opzione dedup count = 2, sono disponibili 2 righe con lo stesso valore di Client Host City.

Se si specifica l'opzione dedup includenulls = true, vengono incluse le righe in cui il valore Client Host City è nullo.

Se si specifica l'opzione dedup consecutive = true, vengono rimosse solo le righe in cui i valori consecutivi di Client Host City sono uguali.