Puede utilizar la propiedad de eliminación de datos duplicados (dedup) para eliminar datos redundantes de los sistemas de archivos ZFS. Si un sistema de archivos tiene activada la propiedad dedup, los bloques de datos duplicados se eliminan de forma sincrónica. El resultado es que se almacenan solamente los datos exclusivos y los componentes comunes se comparten entre archivos. Por ejemplo:
# zfs set dedup=on tank/home
No active la propiedad dedup en los sistemas de archivos que residen en los sistemas de producción hasta que realice los pasos siguientes para determinar si el sistema puede admitir los datos de la anulación de la duplicación.
Determine si los datos se beneficiarían con el ahorro de espacio que proporciona la anulación de la duplicación. Si no se puede anular la duplicación de los datos, no tiene sentido activar dedup. La ejecución del siguiente comando consume mucha memoria:
# zdb -S tank Simulated DDT histogram: bucket allocated referenced ______ ______________________________ ______________________________ refcnt blocks LSIZE PSIZE DSIZE blocks LSIZE PSIZE DSIZE ------ ------ ----- ----- ----- ------ ----- ----- ----- 1 2.27M 239G 188G 194G 2.27M 239G 188G 194G 2 327K 34.3G 27.8G 28.1G 698K 73.3G 59.2G 59.9G 4 30.1K 2.91G 2.10G 2.11G 152K 14.9G 10.6G 10.6G 8 7.73K 691M 529M 529M 74.5K 6.25G 4.79G 4.80G 16 673 43.7M 25.8M 25.9M 13.1K 822M 492M 494M 32 197 12.3M 7.02M 7.03M 7.66K 480M 269M 270M 64 47 1.27M 626K 626K 3.86K 103M 51.2M 51.2M 128 22 908K 250K 251K 3.71K 150M 40.3M 40.3M 256 7 302K 48K 53.7K 2.27K 88.6M 17.3M 19.5M 512 4 131K 7.50K 7.75K 2.74K 102M 5.62M 5.79M 2K 1 2K 2K 2K 3.23K 6.47M 6.47M 6.47M 8K 1 128K 5K 5K 13.9K 1.74G 69.5M 69.5M Total 2.63M 277G 218G 225G 3.22M 337G 263G 270G dedup = 1.20, compress = 1.28, copies = 1.03, dedup * compress / copies = 1.50
Si la razón estimada de dedup es mayor que 2, puede que se produzca un ahorro de espacio con dedup.
En este ejemplo, la razón de dedup (dedup = 1,20) es menor que 2, por lo cual no se recomienda la activación de dedup.
Asegúrese de que el sistema tenga memoria suficiente para admitir dedup de la siguiente manera:
Cada entrada de la tabla de dedup incorporada en el núcleo central es de aproximadamente 320 bytes.
Multiplique el número de bloques asignados por 320. Por ejemplo:
in-core DDT size = 2.63M x 320 = 841.60M
El rendimiento de dedup es mejor cuando la tabla de anulación de la duplicación se ajusta a la memoria. Si la tabla de dedup se tiene que escribir en el disco, el rendimiento disminuirá. Si activa la anulación de duplicación en los sistemas de archivos sin suficientes recursos de memoria, el rendimiento del sistema podría disminuir durante las operaciones relacionadas con el sistema de archivos. Por ejemplo, la eliminación de un gran sistema de archivos activado para dedup sin recursos de memoria suficientes puede afectar al rendimiento del sistema.