Uso y medición del sistema de archivos

En este tema se describe cómo se calculan el uso y la medición para los sistemas de archivos, para que pueda saber cuáles son los costos del servicio y poder gestionarlos. En este tema también se describen las diferentes maneras de ver el uso del sistema de archivos, la clonación y la instantánea, así como las diferencias en la generación de informes que se pueden producir según el método que utilice.

Visión general

El aprovisionamiento del servicio File Storage está completamente gestionado y automatizado a medida que se amplía la utilización. Para obtener más información, consulte Asignación de espacio.

Estos son los métodos que puede utilizar para ver el uso de sistemas de archivos, clonaciones e instantáneas:

  • El servicio File Storage informa del uso del sistema de archivos medido y se actualiza cada hora. El uso del sistema de archivos medido proviene del valor meteredBytes de la API y representa el valor de utilización autorizado que se usa para contar el costo del servicio. Puede acceder a la utilización registrada de cada sistema de archivos mediante la consola, la interfaz de línea de comandos (CLI) o la API. Para obtener más información, consulte la siguiente sección Uso medido del sistema de archivos.
  • El servicio File Storage soporta el protocolo de sistema de archivos de red (NFS), por lo que puede utilizar el comando df o du de la herramienta de línea de comandos de instancia para ver el uso de los sistemas de archivos montados. Sin embargo, el uso que registre du puede ser diferente del valor meteredBytes y del valor df. Para obtener más información, consulte Uso de los comandos DF y DU.

Asignación de espacio

El servicio File Storage asigna espacio en bloques de tamaño variable a fin de minimizar el costo total del cliente y optimiza el rendimiento. Otros sistemas de almacenamiento pueden asignar bloques de forma diferente a los de Oracle Cloud Infrastructure File Storage. Si copia archivos desde otro dispositivo de almacenamiento en su sistema de archivos de Oracle Cloud Infrastructure, es posible que vea diferencias sin importancia al comparar el tamaño físico del archivo antes y después de la copia.

Costo de medición y del servicio

En esta sección se describen aspectos del uso del sistema de archivos y cómo afectan a los costos de servicio generales.

Uso medido del sistema de archivos

El servicio File Storage informa del tamaño del uso medido para cada sistema de archivos. El tamaño de utilización medido se actualiza por horas. Puede ver el tamaño del uso medido en la consola de la página Detalles del sistema de archivos. Este valor procede de la propiedad meteredBytes de la API del servicio File Storage, que es el número total de bytes consumidos por el sistema de archivos. Si el sistema de archivos es una clonación de otro sistema de archivos, en la clonación solo se miden los datos diferenciados exclusivos de la clonación.

El valor meteredBytes se actualiza de forma asíncrona con respecto a las actualizaciones del sistema de archivos. Los cargos de uso se calculan en función del valor meteredBytes.

También puede usar la CLI o la API para obtener esta información. Consulte Gestión de sistemas de archivos para obtener instrucciones sobre cómo ver el uso del sistema de archivos.

Importante

Al agregar o eliminar archivos del sistema de archivos, el servicio File Storage puede tardar hasta una hora en informar del cambio en el tamaño medido.

Uso medido de las instantáneas

Una instantánea es una vista puntual del sistema de archivos. Inicialmente, las instantáneas no consumen uso adicional en el sistema de archivos, ya que hacen referencia a los datos originales en lugar de duplicarlos, lo que limita el costo de uso. Una instantánea no cambia los bloques a los que hace referencia después de tomarse.

El uso de los datos de instantáneas se mide solo con respecto a datos diferenciados. Si no ha cambiado nada en el sistema de archivos desde que se tomó la última instantánea, una nueva instantánea no consume más almacenamiento. El tamaño medido de las instantáneas se incluye en el valor meteredBytes registrado del sistema de archivos al que pertenece.

Por ejemplo:

  1. Supongamos que crea un sistema de archivos denominado MyFileSystem y agrega File1. El nuevo sistema de archivos ahora contiene 1 GB incluidos los metadatos. Una vez terminado el ciclo de actualización por horas, el total de meteredBytes mostrado por el servicio File Storage es de 1 GB.
  2. A continuación, crea una instantánea de MyFileSystem denominada Snapshot1. Después de terminar el ciclo de actualización por hora, el total de meteredBytes que muestra el servicio File Storage permanece en 1 GB porque todavía no hay datos diferenciados.

  3. Después, sobrescribe los primeros 0,5 GB de File1. Ahora, MyFileSystem tiene un archivo diferente a la versión capturada anteriormente en Snapshot1. El valor de meteredBytes es de 1,5 GB porque los datos diferenciados entre el sistema de archivos activo y la instantánea son de 0,5 GB.

    1 GB (instantánea) + 0,5 GB (datos diferenciados) = 1,5 GB

  4. Si, a continuación, suprime File1. MyFileSystem ahora tiene un valor meteredBytes de 1 GB, que representa solo el uso para Snapshot1.
  5. Por último, suprime Snapshot1. Al suprimir la instantánea, se eliminan sus referencias a los datos del archivo. Si ninguna otra instantánea hace referencia a los datos del archivo, el espacio se deja de usar y el uso vuelve a cero.

Utilización medida de la clonación

El costo medido inicial de una clonación del sistema de archivos se basa únicamente en sus metadatos, ya que las clonaciones hacen referencia a los datos del sistema de archivos principal en lugar de duplicarlos.

El sistema de archivos principal de una clonación se mide por todos los datos compartidos con sus clonaciones descendientes. Una clonación se mide por todos sus metadatos y cambios incrementales realizados en sus datos. Cuando se suprime una clonación, se reclaman todos los bloques a los que hace referencia solo esa clonación. Si otra clonación se está hidratando de la clonación suprimida, los bloques de metadatos a los que hace referencia se reclaman una vez completada la hidratación.

Si suprime una clonación principal, los bloques de datos compartidos por las clonaciones descendientes no se pueden liberar. Los bloques asignados a los que hacen referencia las clonaciones descendientes se transfieren a la nueva clonación principal (el principal del principal) para fines de medición. No se miden más de una vez sus datos compartidos entre varios sistemas de archivos.

Por ejemplo:

  1. Supongamos que crea una clonación de FileSystemA denominada Clone1. En el momento de la creación y antes de que se modifiquen los datos:
    • FileSystemA (principal) se mide por sus datos y metadatos.
    • Clone1 se mide solo por sus metadatos.
  2. A continuación, crea un nuevo archivo de 1 GB en Clone1 denominado File1:
    • FileSystemA (principal) se mide por los datos que comparte con Clone1 (clonación).
    • Clone1 se mide por sus metadatos más 1 GB de datos modificados de File1.
  3. El principal de FileSystemA es OriginalRoot. Es la raíz del árbol de clonación. Supongamos que suprime FileSystemA:
    • OriginalRoot se convierte en el nuevo principal de Clone1.
    • OriginalRoot se mide por los datos que comparte con Clone1.
    • Clone1 se mide por sus metadatos más 1 GB de datos modificados de File1.

Utilización medida de la replicación

Después de activar la replicación para un sistema de archivos, este se replica en un sistema de archivos de destino en la región y el dominio de disponibilidad especificados. El almacenamiento de archivos se mide para la capacidad total almacenada en disco para los sistemas de archivos de origen y destino. El precio de los sistemas de archivos de origen y destino es el mismo.

La factura incluye cualquier costo de red aplicable para el proceso de replicación entre regiones. Como parte del proceso de replicación, todos los datos que se actualizan en el sistema de archivos de origen se transfieren a la réplica del sistema de archivos, por lo que los sistemas de archivos con actualizaciones continuas incurren en mayores costos de red. No se aplica ningún cargo adicional por el ancho de banda entre dominios de disponibilidad dentro de la misma región ni la transferencia de datos entrantes.

Muchos escenarios de failback de replicación utilizan una clonación de un sistema de archivos de origen original. La clonación del origen a partir de la última instantánea aplicada por completo garantiza que el origen y el destino sean compatibles. También puede utilizar un nuevo sistema de archivos para el failback. Sin embargo, el uso de una clonación del sistema de archivos de origen original tiende a ser más rápido y más rentable que el uso de un nuevo sistema de archivos. Por ejemplo:

  1. Supongamos que crea un sistema de archivos de origen, Sistema de archivos A, y un sistema de archivos de destino, Sistema de archivos B. Después, configura la replicación desde el Sistema de archivos A (origen) al Sistema de archivos B (destino). Se monta el Sistema de archivos A y los datos se escriben en él desde instancias o aplicaciones. El proceso de replicación duplica las actualizaciones de datos del Sistema de archivos A en el Sistema de archivos B.
    • El Sistema de archivos A (origen) se mide por sus datos y metadatos. A medida que se actualizan los datos, se puede incurrir en un mayor costo.
    • Las instantáneas creadas por el usuario para el Sistema de archivos A se miden solo con respecto a los datos diferenciados del Sistema de archivos A.
    • Los datos del Sistema de archivos B (destino) son idénticos al Sistema de archivos A y se miden por sus datos y metadatos.
    • Las instantáneas creadas por el usuario para el Sistema de archivos B son idénticas al Sistema de archivos A y se miden solo con respecto a los datos diferenciados.
    • Las instantáneas creadas por la replicación se miden únicamente con respecto a los datos diferenciados y se suprimen una vez que se ha completado un ciclo de replicación.
    Nota

    Hasta que se complete un ciclo de replicación, el uso de datos y metadatos para el Sistema de archivos B puede ser diferente para el Sistema de archivos A.
  2. Posteriormente, en algún momento el dominio de disponibilidad que contiene el Sistema de archivos A falla y usted realiza un failover al Sistema de archivos B. El Sistema de archivos B se monta en instancias de aplicación y los datos se escriben en él.
    • El Sistema de archivos A se mide por sus datos y metadatos existentes. Dado que no se actualiza ningún dato, no hay cambios en los costos.
    • Las instantáneas creadas por el usuario para el Sistema de archivos A se siguen midiendo solo con respecto a los datos diferenciados existentes del Sistema de archivos A.
    • Los datos del Sistema de archivos B se miden por sus datos y metadatos. A medida que se actualizan los datos, se puede incurrir en un mayor costo.
    • Las instantáneas creadas por el usuario para el Sistema de archivos B se miden solo con respecto a los datos diferenciados del Sistema de archivos B.
    • No se crea ninguna instantánea de replicación.
  3. Después de restaurar el dominio de disponibilidad que contiene el Sistema de archivos A, revierta la replicación para copiar los datos actualizados del Sistema de archivos B de nuevo al Sistema de archivos A y volver a sincronizarlos. Cree una clonación del Sistema de archivos A denominada Clone1. En el momento de la creación y antes de que se modifiquen los datos:
    • El Sistema de archivos A (origen de replicación original, clonación principal) se mide por sus datos y metadatos.
    • Clone1 se mide solo por sus metadatos.
  4. A medida que avanza la replicación del Sistema de archivos B a Clone1, los datos se copian del Sistema de archivos B a Clone1.
    • El Sistema de archivos A (origen de replicación antiguo, clonación principal) se mide por sus datos y metadatos. Dado que no se actualiza ningún dato, no hay cambios en los costos.
    • Las instantáneas creadas por el usuario para el Sistema de archivos A se siguen midiendo solo con respecto a los datos diferenciados existentes del Sistema de archivos A.
    • Clone1 (nuevo destino) se mide para los datos diferenciados entre este y el Sistema de archivos A. Como los datos se replican en Clone1 desde el Sistema de archivos B, se incurre en un mayor costo.
    • El Sistema de archivos B (nuevo origen) se mide por sus datos y metadatos.
    • Las instantáneas creadas por el usuario para el Sistema de archivos B se miden solo con respecto a los datos diferenciados del Sistema de archivos B.
    • Las instantáneas creadas por la replicación se miden solo con respecto a los datos diferenciados entre Clone1 y el Sistema de archivos B, y se suprimen una vez que se ha completado un ciclo de replicación.

Para obtener más información, consulte Replicación del sistema de archivos.

Uso medido de los metadatos

Los archivos del sistema de archivos requieren que se asigne espacio para los metadatos. Se necesitan 512 bytes para cada entrada de directorio y se necesitan 8192 bytes para cada enlace simbólico. Varios enlaces físicos a un archivo crean varias entradas de directorio para el archivo y aumentan el uso de los metadatos. Esta utilización se incluye en el valor meteredBytes del sistema de archivos al que pertenece.

Uso de los comandos DF y DU

Puede utilizar los comandos df o du de la aplicación de la línea de comandos de la instancia para ver la información de uso del sistema de archivos. Para utilizar estos comandos para ver el uso del sistema de archivos, primero se debe montar el sistema de archivos en la instancia. Consulte Montaje de los sistemas de archivos para obtener instrucciones sobre cómo montar el sistema de archivos.

Cómo funcionan los comandos

  • df proporciona la cantidad de almacenamiento medido para el sistema de archivos. Los resultados se devuelven rápidamente, pero pueden tardar hasta 1 hora en actualizarse.
  • du proporciona el almacenamiento utilizado por una jerarquía de directorios. El comando du analiza el árbol de directorios y, si su jerarquía es grande, puede tardar mucho tiempo en ejecutarse y devolver resultados.

Diferentes resultados

En las siguientes secciones se explica cómo y por qué difieren los resultados de df y du:

DF y DU informan sobre la utilización de instancias y clonaciones de manera diferente

Una instantánea es una vista puntual de un sistema de archivos. Las instantáneas hacen referencia a los datos del sistema de archivos sin cambios en lugar de duplicarlos. Los bloques del sistema de archivos a los que hace referencia la instantánea no contabilizan para el uso de instantáneas. Solo los datos diferenciados aumentan el uso de la instantánea.

El mismo comportamiento se aplica a las clonaciones del sistema de archivos. Las clonaciones hacen referencia a los datos que comparten con su sistema de archivos principal. Los bloques del sistema de archivos a los que hace referencia la clonación no cuentan para la utilización de la clonación. Solo los datos diferenciados aumentan la utilización de la clonación.

  • El comando df recupera la información proporcionada por el servicio File Storage mediante la llamada FSSTAT de NFS. La llamada FSSTAT de NFS se tiene en cuenta correctamente para el modo en que las instantáneas y las clonaciones hacen referencia a los datos del sistema de archivos. Solo se informa del uso ocasionado por datos diferenciados.

    Se puede acceder a las instantáneas en el directorio raíz del sistema de archivos en .snapshot/name. Si utiliza un cliente NFSv3 para realizar operaciones como ls, du o find en el directorio de instantáneas, el servicio exporta automáticamente el directorio. El cliente utiliza nfs_d_automount() para detectar y montar el directorio. Una vez detectado y montado el directorio por primera vez, el cliente monta el directorio de forma automática.

    Nota

    Si ha depurado un sistema de archivos, pero el sistema de archivos tiene instantáneas o clones, el comando df sigue informando de los bloques subyacentes. La depuración de un sistema de archivos sin suprimir instantáneas o clones no elimina esos bloques.
  • El comando du desciende en el árbol del sistema de archivos y utiliza el atributo de tamaño de cada archivo para calcular el total de espacio utilizado. Cuando crea una instantánea o una clonación, estas copian el atributo de tamaño original de cada archivo. Por lo tanto, si ejecuta el comando du, la instantánea informa del tamaño del sistema de archivos en el momento en que se realizó la instantánea no necesariamente el uso actual real de la instantánea. Las clonaciones informan inicialmente del tamaño del sistema de archivos principal en el momento en que se realizó la instantánea de origen. Cuando se realizan cambios en los datos de clonación, du comienza a informar de los nuevos atributos de tamaño solo de los archivos actualizados.

Por ejemplo:

  1. Supongamos que crea un sistema de archivos denominado "MyFileSystem". A continuación, agrega un archivo de 1 GB llamado "FileA" al sistema de archivos. Aquí se muestra cómo cada comando indicaría el tamaño.

    Para.. du indica...

    df indica...

    FileA 1 GB 1 GB
    MyFileSystem 1 GB 1 GB
  2. A continuación, crea "Snapshot1". La instantánea se coloca en la carpeta /.snapshot de MyFileSystem. A continuación, se muestra cómo cada comando indicaría el tamaño:

    Para.. du indica...

    df indica...

    FileA 1 GB 1 GB
    Snapshot1 1 GB 1 GB

    MyFileSystem

    2 GB 1 GB
    • du indica 1 GB para Snapshot1 porque indica el atributo de tamaño de archivo copiado de FileA, que es de 1 GB.
  3. A continuación, utilice "Snapshot1" para crear una clonación denominada "Clone1". A continuación, se muestra cómo cada comando indicaría el tamaño:

    Para.. du indica...

    df indica...

    FileA 1 GB 1 GB
    Snapshot1 1 GB 1 GB

    MyFileSystem

    2 GB 1 GB
    Clone1 2 GB 0 GB
    • df informa de 0 GB para Clone1 porque los datos aún no han cambiado, por lo que no hay ningún espacio asignado para los datos diferenciados.
    • du informa de 2 GB para Clone1 porque indica el atributo de tamaño de archivo copiado de FileA, que es de 1 GB, y el tamaño de Snapshot1, que es 1 GB adicional.
  4. Debe agregar un archivo de 1 GB llamado "FileB" al sistema de archivos clonado. A continuación, se muestra cómo cada comando indicaría el tamaño:

    Para.. du indica...

    df indica...

    FileA 1 GB 1 GB
    Snapshot1 1 GB 1 GB

    MyFileSystem

    2 GB 1 GB
    Clone1 3 GB 1 GB
    FileB 1 GB 1 GB
    • df informa de 1 GB para Clone1 para los datos diferenciados agregados en FileB.
    • du informa de 3 GB para Clone1 porque indica la suma de los atributos de tamaño de archivo copiados de FileA, FileB y Snapshot1.
Importante

Los cargos se calculan utilizando el valor meteredBytes. El tamaño de utilización indicado por du puede ser mucho mayor que el valor meteredBytes. df indica el mismo valor que meteredBytes, por lo que puede utilizarlo para ver con precisión el tamaño del sistema de archivos.