Bulkvorgänge für Dateien in der Cloud
Das PL/SQL-Package DBMS_CLOUD
bietet Unterstützung für die parallele Ausführung von Bulk-Dateiupload-, -Download-, -Kopier- und -Übertragungsaktivitäten. Dadurch wird die Benutzererfahrung optimiert und die optimale Performance für Bulk-Dateivorgänge bereitgestellt.
Das Package DBMS_CLOUD
unterstützt das Laden und Entladen von Dateien in die folgenden Cloud-Services:
-
Oracle Cloud Infrastructure Object Storage
-
Azure Blob Storage
-
Amazon S3
-
Google Cloud Storage
Weitere Informationen finden Sie unter DBMS_CLOUD-Package -Datei-URI-Formate.
Verwandte Themen
Informationen zu Bulk File-Vorgängen
DBMS_CLOUD
-Bulkdateivorgänge unterstützen das Herunterladen und Hochladen von Dateien in Autonomous Database, einschließlich Unterstützung für das Kopieren, Verschieben und Löschen von Dateien in Cloud-Objektspeichern, entweder innerhalb desselben Objektspeicherproviders oder zwischen Objektspeicherprovidern.
Die Bulk File-Vorgänge unterstützen Parallelität und bieten eine optimale Performance für das Hochladen, Herunterladen, Kopieren und Verschieben von Dateien. Parallelität für Bulk-Dateivorgänge wird durch Angabe einer Priorität für einen Vorgang behandelt. Folgende Prioritäten werden unterstützt:
HIGH
: Mit der CPU-Compute-Anzahl der Autonomous Database-Instanz können Sie die Anzahl der verarbeiteten parallelen Dateien bestimmen.MEDIUM
: Verwenden Sie das Nebenläufigkeitslimit für den Medium-Service, um die Parallelität zu bestimmen.LOW
: Dateien in serieller Reihenfolge verarbeiten (kein gleichzeitiger Zugriff).
Wenn Bulkvorgänge mit einer höheren Priorität ausgeführt werden, werden mehr Datenbankressourcen und Vorgänge schneller abgeschlossen, wenn die Parallelisierung den Vorgang beschleunigen kann. Eine niedrigere Priorität verbraucht weniger Datenbankressourcen, und die Ausführung von Vorgängen dauert länger, wenn die Parallelisierung den Vorgang beschleunigen kann. Wenn Bulk-Vorgänge eine geringe Anzahl von Dateien umfassen, die wenig Daten enthalten, ändert die Angabe einer höheren Priorität möglicherweise nicht die Performance.
Um die Parallelität für Bulkdateivorgänge zu erhöhen, verwenden Sie die Priorität HIGH
, und erhöhen Sie die Anzahl der CPUs, die Ihrer Autonomous Database-Instanz zugewiesen sind. Die maximal unterstützte Anzahl nebenläufiger Dateivorgänge ist für Bulk-Dateivorgänge auf 64 begrenzt.
Die Standardpriorität ist MEDIUM
, die angibt, dass Bulk-Dateivorgänge das für die MEDIUM-Nutzungsgruppe definierte Nebenläufigkeitslimit verwenden.
Details zur Verwendung des Parameters format
zur Angabe von priority
mit Bulkdateivorgängen finden Sie unter DBMS_CLOUD für Bulkdateiverwaltung.
In den unten erläuterten DBMS_CLOUD-Unterprogrammen kann credential_name
, source_credential_name
oder target_credential_name
für eine öffentliche, vorab authentifizierte oder vorab signierte Bucket-URI NULL
lauten.
Massenkopieren von Dateien in Cloud Object Storage
Mit der Prozedur DBMS_CLOUD.BULK_COPY
können Sie Dateien im Bulkverfahren aus einem Objektspeicher-Bucket oder -Ordner in einen anderen Bucket oder Ordner kopieren.
Beispiel: Verwenden Sie DBMS_CLOUD.BULK_COPY
, um Dateien von Amazon S3 in Oracle Cloud Infrastructure Object Storage zu kopieren.
BEGIN
DBMS_CLOUD.BULK_COPY
(
source_credential_name => 'AWS_CRED',
source_location_uri => 'https://bucketname.s3-us-west-2.amazonaws.com/',
target_credential_name => 'OCI_CRED',
target_location_uri => 'https://objectstorage.us-phoenix-1.oraclecloud.com/n/namespace-string/b/bucketname2/o',
format => JSON_OBJECT ('logretention' value 7, 'logprefix' value 'BULKOP')
);
END;
/
Massenverschiebung von Dateien über den Cloud-Objektspeicher
DBMS_CLOUD.BULK_MOVE
können Sie Dateien im Bulkverfahren von einem Cloud-Objektspeicherort in einen anderen verschieben.
Der erste Schritt beim Verschieben von Dateien ist das Kopieren in den Zielspeicherort. Nachdem die Dateien erfolgreich kopiert wurden, werden sie aus dem Quellspeicherort gelöscht.
Die Dateien werden umbenannt und nicht kopiert, wenn der Objektspeicher das Umbenennen von Vorgängen zwischen Quell- und Zielspeicherort zulässt.
Beispiel: Verwenden Sie DBMS_CLOUD.BULK_MOVE
, um Dateien von Amazon S3 in Oracle Cloud Infrastructure Object Storage zu verschieben.
BEGIN
DBMS_CLOUD.BULK_MOVE
(
source_credential_name => 'AWS_CRED',
source_location_uri => 'https://bucketname.s3-us-west-2.amazonaws.com/',
target_credential_name => 'OCI_CRED',
target_location_uri => 'https://objectstorage.us-phoenix-1.oraclecloud.com/n/namespace-string/b/bucketname2/o',
format => JSON_OBJECT ('logretention' value 7, 'logprefix' value 'BULKOP')
);
END;
/
Dateien im Bulkverfahren aus Cloud Object Storage herunterladen
Mit der Prozedur DBMS_CLOUD.BULK_DOWNLOAD
können Sie Dateien im Bulkverfahren aus dem Speicherort des Cloud-Objektspeichers in das Verzeichnisobjekt in einer Autonomous Database herunterladen.
Massenupload von Dateien in Cloud Object Storage
Verwenden Sie die Prozedur DBMS_CLOUD.BULK_UPLOAD
, um Dateien aus einem Verzeichnisobjekt in einer Datenbank im Bulkverfahren in einen Cloud-Objektspeicherort hochzuladen.
Massenlöschung von Dateien aus dem Cloud-Objektspeicher
Mit der Prozedur DBMS_CLOUD.BULK_DELETE
können Sie Dateien im Bulkverfahren aus Cloud Object Storage löschen.
Bulkladevorgänge überwachen und Fehler beheben
Alle Dataload-Vorgänge von DBMS_CLOUD
werden in den Ansichten dba_load_operations
und user_load_operations
protokolliert.
Mit den folgenden Ansichten können Sie Bulk Load-Vorgänge überwachen und beheben:
-
dba_load_operations
: Zeigt alle Ladevorgänge an. -
user_load_operations
: Zeigt die Ladevorgänge in Ihrem Schema an.
Fragen Sie diese Ansichten ab, um Informationen zu laufenden und abgeschlossenen Bulk-Dateivorgängen anzuzeigen. Beispiel: Die folgende SELECT
-Anweisung mit einem WHERE
-Klauselprädikat für TYPE
zeigt DOWNLOAD
-Vorgänge an:
SELECT owner_name, type, status, start_time, update_time, status_table, rows_loaded
FROM user_load_operations WHERE type = 'DOWNLOAD';
OWNER_NAME TYPE STATUS START_TIME UPDATE_TIME STATUS_TABLE ROWS_LOADED
---------- -------- --------- ------------------------ ------------------------ ------------ -----------
"ADMIN" DOWNLOAD COMPLETED 2022-10-17T20:42:19.498Z 2022-10-17T20:42:21.054Z DWN$2_STATUS 4
"ADMIN" DOWNLOAD FAILED 2022-10-17T20:40:54.348Z 2022-10-17T20:40:55.679Z DWN$1_STATUS
In der Spalte STATUS_TABLE
wird der Name der Tabelle angezeigt, die Sie abfragen können, um detaillierte Logginginformationen für den Bulkdownloadvorgang anzuzeigen. Beispiel:
DESCRIBE DWN$2_STATUS
Name Null? Type
------------- -------- ---------------------------
ID NOT NULL NUMBER
NAME VARCHAR2(4000)
BYTES NUMBER
CHECKSUM VARCHAR2(128)
LAST_MODIFIED TIMESTAMP(6) WITH TIME ZONE
STATUS VARCHAR2(30)
ERROR_CODE NUMBER
ERROR_MESSAGE VARCHAR2(4000)
START_TIME TIMESTAMP(6) WITH TIME ZONE
END_TIME TIMESTAMP(6) WITH TIME ZONE
SID NUMBER
SERIAL# NUMBER
ROWS_LOADED NUMBER
SELECT id, name, bytes, status, error_message, start_time, end_time FROM DWN$2_STATUS;
ID NAME BYTES STATUS ERROR_MESSAGE START_TIME END_TIME
-- ---------- ----- --------- ------------- ------------------------ ------------------------
1 trees.txt 58 COMPLETED 2022-10-17T20:42:19.998Z 2022-10-17T20:42:20.421Z
2 trees1.txt 58 COMPLETED 2022-10-17T20:42:20.425Z 2022-10-17T20:42:20.533Z
3 trees2.txt 58 COMPLETED 2022-10-17T20:42:20.535Z 2022-10-17T20:42:20.894Z
4 trees3.txt 58 COMPLETED 2022-10-17T20:42:20.896Z 2022-10-17T20:42:21.043Z
In der Statustabelle werden jeder Dateiname und sein Status für den Bulkvorgang angezeigt.
Die entsprechende Fehlernummer und Meldung werden in der Statustabelle aufgezeichnet, wenn ein Vorgang für eine bestimmte Datei nicht erfolgreich verläuft.
Bei abgeschlossenen Vorgängen kann die für jeden Vorgang benötigte Zeit mit der gemeldeten START_TIME
- und END_TIME
-Zeit berechnet werden.
Die Spalte STATUS
des Dateivorgangs kann einen der folgenden Werte aufweisen:
Datei-Status | Beschreibung |
---|---|
|
Dateivorgang erfolgreich abgeschlossen. |
|
Dateivorgang nicht erfolgreich. Möglicherweise wird zweimal versucht, es erneut zu versuchen. |
|
Der Dateivorgang wurde noch nicht gestartet. |
|
Dateivorgang wird derzeit ausgeführt. |
|
Dateivorgang übersprungen. |
Wenn ein Dateivorgang nach zwei Wiederholungsversuchen nicht erfolgreich verläuft, wird der Bulkvorgang als nicht erfolgreich markiert, und ein Fehler wird ausgelöst. Beispiel:
ORA-20003: Operation failed, please query table DOWNLOAD$2_STATUS for error details
Wenn Sie einen DBMS_CLOUD
-Bulkdateivorgang verwenden, gibt es format
-Parameteroptionen, die Statustabellen steuern:
-
logretention
: Gibt einen ganzzahligen Wert an, der die Dauer in Tagen bestimmt, in denen die Statustabelle beibehalten wird. Der Standardwert ist 2 Tage. -
logprefix
: Gibt einen Zeichenfolgenwert an, der das Namenspräfix der Statustabelle für den Bulkvorgang bestimmt.Jeder Bulkvorgang hat einen eigenen Standardwert für die Option
logprefix
:Vorgehensweise Standardwert für logprefix
DBMS_CLOUD.BULK_COPY
COPYOBJ
DBMS_CLOUD.BULK_DELETE
DELETE
DBMS_CLOUD.BULK_DOWNLOAD
DOWNLOAD
DBMS_CLOUD.BULK_MOVE
MOVE
DBMS_CLOUD.BULK_UPLOAD
UPLOAD
Informationen zum Löschen der Tabelle user_load_operations
finden Sie unter DELETE_ALL_OPERATIONS-Prozedur.