10 템플리트를 사용하여 사용자와 협업

Oracle Machine Learning 노트북 템플리트를 사용하면 작업을 공유하고, 작업을 보고서로 게시하고, 템플리트에서 노트북을 생성하여 다른 사용자와 협업할 수 있습니다. 노트북을 템플릿으로 저장하고, 노트북을 공유하고, 다른 사용자에게 샘플 템플릿을 제공할 수 있습니다.

주:

작업영역에 대한 접근 권한을 제공하여 다른 Oracle Machine Learning 노트북 사용자와 협업할 수도 있습니다. 그러면 인증된 사용자가 작업 영역의 프로젝트에 액세스하고 노트북에 액세스할 수 있습니다. 접근 수준은 부여된 권한 유형(관리자, 개발자 또는 뷰어)에 따라 다릅니다. 사용자 간 협업에 대한 자세한 내용은 Oracle Machine Learning Notebooks에서 협업하는 방법을 참조하십시오.

10.1 개인 템플리트 사용

개인 템플리트에는 사용자가 만든 노트북 템플리트가 나열됩니다.

수행할 수 있는 작업은 다음과 같습니다.
  • 선택한 템플리트를 읽기 전용 모드로 봅니다.

  • 선택한 템플릿에서 새 노트북을 만듭니다.

  • 선택한 템플리트를 편집합니다.

  • 공유 템플리트에서 선택한 노트북 템플리트를 공유합니다.

  • 선택된 노트북 템플리트를 삭제합니다.

10.1.1 템플리트에서 노트북 생성

기존 템플리트에서 새 노트북을 생성하고 나중에 사용할 수 있도록 개인 템플리트에 저장할 수 있습니다.

노트북 템플리트를 선택해야 합니다.
템플리트에서 새 노트북을 생성하려면 다음과 같이 하십시오.
  1. 개인 템플리트 페이지에서 노트북을 생성할 템플리트를 선택하고 새 노트북을 누릅니다.
    메모장 생성 대화상자가 열립니다.
  2. 이름 필드에서 노트북의 이름을 입력합니다.
  3. 설명 필드에서 설명(있는 경우)을 입력합니다.
  4. 프로젝트 필드에서 노트북을 저장할 프로젝트를 선택합니다.
  5. 접속 필드에서 기본 접속이 선택됩니다.
  6. 확인을 누릅니다.
노트북이 생성되고 노트북 페이지에서 사용할 수 있습니다.

10.1.2 노트북 템플리트 공유

개인 템플리트에서 템플리트를 공유할 수 있습니다.편집을 위해 템플리트를 공유할 수도 있습니다.

템플리트를 공유하려면 다음과 같이 하십시오.
  1. 개인 템플리트에서 노트북 템플리트를 선택하고 공유를 누릅니다.
    공유 템플리트에 저장 대화 상자가 열립니다.
  2. 이름 필드에 새 템플리트 이름을 입력합니다.
  3. 설명 필드에 설명을 제공합니다(있는 경우).
  4. 태그 필드에 쉼표로 구분된 태그를 입력합니다. 쉽게 검색할 수 있도록 설명 태그를 사용합니다.
  5. 확인을 누릅니다.
템플리트가 성공적으로 생성되고 공유되면 공유에서 템플리트가 생성되었음을 알리는 메시지가 나타납니다.

10.1.3 메모장 템플리트 설정 편집

개인 템플리트에서 기존 노트북 템플리트의 설정을 수정할 수 있습니다.

노트북 템플리트 설정을 편집하려면 다음을 수행합니다.
  1. 개인 템플리트에서 노트북 템플리트를 선택하고 설정 편집을 누릅니다.
    템플리트 편집 대화상자가 열립니다.
  2. 이름 필드에서 해당하는 경우 이름을 편집합니다.
  3. 설명 필드에서 설명(있는 경우)을 편집합니다.
  4. 태그 필드에서 해당하는 경우 태그를 편집합니다.
  5. 확인을 누릅니다.

10.2 공유 템플리트 사용

공유 템플리트에서는 템플리트에서 사용 가능한 기존 노트북에서 생성한 모든 인증된 사용자와 노트북 템플리트를 공유할 수 있습니다.

공유 템플리트 페이지는 다음을 수행할 때 노트북 템플리트를 추적합니다.
  • 유사 템플리트

  • 템플리트에서 노트북 생성

  • 템플리트 보기

공유 템플리트 페이지에는 템플리트에 대한 다음 정보가 표시됩니다.
  • 템플리트 이름

  • 설명

  • 좋아요 수

  • 생성 수

  • 정적 뷰 수

수행할 수 있는 작업은 다음과 같습니다.
  • 새 노트북을 눌러 템플리트 생성

  • 설정 편집을 눌러 템플리트 설정을 편집합니다.

  • 삭제를 눌러 선택된 템플리트 삭제

  • 이름, 태그, 작성자별 템플리트 검색

  • 이름, 일자, 작성자, 좋아요, 조회, 사용별로 템플리트 정렬

  • 관련 항목만 표시 또는 내 항목만 표시를 눌러 템플리트를 봅니다.

10.2.1 템플리트에서 노트북 생성

기존 템플리트에서 새 노트북을 생성하고 나중에 사용할 수 있도록 개인 템플리트에 저장할 수 있습니다.

노트북 템플리트를 선택해야 합니다.
템플리트에서 새 노트북을 생성하려면 다음과 같이 하십시오.
  1. 개인 템플리트 페이지에서 노트북을 생성할 템플리트를 선택하고 새 노트북을 누릅니다.
    메모장 생성 대화상자가 열립니다.
  2. 이름 필드에서 노트북의 이름을 입력합니다.
  3. 설명 필드에서 설명(있는 경우)을 입력합니다.
  4. 프로젝트 필드에서 노트북을 저장할 프로젝트를 선택합니다.
  5. 접속 필드에서 기본 접속이 선택됩니다.
  6. 확인을 누릅니다.
노트북이 생성되고 노트북 페이지에서 사용할 수 있습니다.

10.2.2 메모장 템플리트 설정 편집

개인 템플리트에서 기존 노트북 템플리트의 설정을 수정할 수 있습니다.

노트북 템플리트 설정을 편집하려면 다음을 수행합니다.
  1. 개인 템플리트에서 노트북 템플리트를 선택하고 설정 편집을 누릅니다.
    템플리트 편집 대화상자가 열립니다.
  2. 이름 필드에서 해당하는 경우 이름을 편집합니다.
  3. 설명 필드에서 설명(있는 경우)을 편집합니다.
  4. 태그 필드에서 해당하는 경우 태그를 편집합니다.
  5. 확인을 누릅니다.

10.3 예제 템플리트 사용

템플리트 예 페이지에는 미리 채워진 Oracle Machine Learning 노트북 템플리트가 나열됩니다. 이러한 템플리트를 보고 사용하여 노트북을 만들 수 있습니다.

예제 템플리트 페이지에는 템플리트에 대한 다음 정보가 표시됩니다.
  • 템플리트 이름

  • 설명

  • 좋아요 수. 좋아요를 눌러 좋아요로 표시합니다.

  • 정적 뷰 수

  • 사용 횟수

예제 템플리트 페이지에서 템플리트를 변경할 수 없습니다. 검색 옵션은 다음과 같습니다.
  • 이름, 태그, 작성자별 템플리트 검색

  • 이름, 일자, 작성자, 좋아요, 조회, 사용별로 템플리트 정렬

  • 즐겨찾기만 표시를 눌러 좋아하는 템플리트를 봅니다.

10.3.1 예제 템플리트에서 메모장 생성

Oracle Machine Learning 예제 템플리트를 사용하여 사용 가능한 템플리트에서 노트북을 생성할 수 있습니다.

노트북을 생성하려면 다음과 같이 하십시오.
  1. 템플리트 예 페이지에서 노트북을 생성할 템플리트를 선택합니다.
  2. 새 노트북을 누릅니다.
    메모장 생성 대화상자가 열립니다.
  3. 메모장 생성 대화상자에서 선택한 템플리트의 이름이 나타납니다. 이름 필드에서 노트북 이름을 변경할 수 있습니다.
    노트북 생성 대화상자
  4. 설명 필드에 템플리트에 사용할 수 있는 설명이 있으면 해당 설명이 표시됩니다. 설명을 편집할 수 있습니다.
  5. 프로젝트 필드에서 편집 아이콘 편집을 누릅니다.
  6. 노트북을 저장할 프로젝트를 선택합니다.
  7. 접속 필드에서 기본 접속이 선택됩니다.
  8. 확인. 을 누릅니다
노트북이 생성되고 노트북 페이지에서 사용할 수 있습니다.

10.3.2 예제 템플리트

Oracle Machine Learning Notebooks은 다양한 머신 러닝 알고리즘 및 Python, R, SQL과 같은 언어를 기반으로 하는 노트북 예제 템플리트를 제공합니다. 예제 템플리트는 Oracle Autonomous Database에서 처리됩니다.

다음 Oracle Machine Learning for R 예제 템플리트 노트북을 기반으로 편집 가능하고 실행 가능한 고유 Oracle Machine Learning 노트북을 생성할 수 있습니다.
  • OML 일련번호 지정 모델 익스포트 및 임포트: 이 노트북을 사용하여 DBMS_DATA_MINING.EXPORT_SERMODELDBMS_DATA_MINING.IMPORT_SERMODEL 프로시저를 사용하여 고유 일련번호 지정 모델을 익스포트하고 임포트합니다. Oracle Machine Learning은 데이터베이스 및 플랫폼 간 모델 마이그레이션 프로세스를 간소화하는 API를 제공합니다.
  • OML Wiki ESA 모델: 문서와 인간이 명시적으로 정의하고 설명하는 주제 세트 간의 의미 관련성(두 단어 또는 텍스트가 서로 유사한 의미)을 계산하여 텍스트 문서 분류에 이 노트북을 사용합니다. Oracle Machine Learning for SQL 함수 ESA, Oracle Machine Learning for Python 함수 oml.esa 및 Oracle Machine Learning for R 함수 ore.odmESA는 문서 그룹에서 텍스트 기반 기능을 추출하고 문서 유사성 비교를 수행합니다. 이 노트북에서는 다음 OML 템플리트 노트북 예제와 함께 사용할 수 있도록 위키 ESA 모델을 Autonomous Database로 임포트합니다.
    • OML4SQL 기능 추출 ESA 위키 모델
    • OML4Py 기능 추출 ESA 위키 모델
    • OML4R 기능 추출 ESA 위키 모델
  • OML 서비스 뱃치 점수부여: 이 노트북을 사용하여 OML 서비스를 통해 REST 인터페이스를 통해 뱃치 점수부여 작업을 실행합니다. OML 서비스는 회귀, 분류, 클러스터화 및 기능 추출을 위한 일괄 처리 점수 부여를 지원합니다.
    • 데이터베이스 사용자를 인증하고 토큰을 얻습니다.
    • 뱃치 점수부여 작업 생성
    • 뱃치 점수부여 작업의 세부정보 및 출력 보기
    • 뱃치 점수부여 작업 업데이트, 사용 안함 및 삭제
  • OML 서비스 데이터 모니터링: 이 노트북을 사용하여 데이터 모니터링을 수행합니다. 이 노트북은 다음을 포함하는 REST 인터페이스를 통해 데이터 모니터링 워크플로우 단계를 제공합니다.
    • 데이터베이스 사용자를 인증하고 토큰을 얻습니다.
    • 데이터 모니터링 작업 생성
    • 데이터 모니터링 작업의 세부정보 및 출력 보기
    • 데이터 모니터링 작업 업데이트, 사용 안함 및 삭제
  • OML 서비스 모델 모니터링: 이 노트북을 사용하여 모델 모니터링을 이해하고 수행할 수 있습니다. 이 노트북 실행은 다음을 포함하는 REST 인터페이스를 통해 모델 모니터링 워크플로우 단계를 제공합니다.
    • 데이터베이스 사용자를 인증하고 토큰을 얻습니다.
    • 모델 모니터링 작업 생성
    • 모델 모니터링 작업의 세부정보 및 출력 보기
    • 모델 모니터링 작업 업데이트, 사용 안함 및 삭제
  • OML 타사 패키지 - 환경 만들기: 이 노트북을 사용하여 Conda 환경을 다운로드 및 활성화하고 노트북 세션에서 라이브러리를 사용할 수 있습니다. Oracle Machine Learning Notebooks은 Conda 인터프리터를 제공하여 Oracle Machine Learning Notebooks 세션 내에서뿐만 아니라 Oracle Machine Learning for PythonOracle Machine Learning for R 내장 실행 호출 내에서도 사용할 수 있도록 타사 Python 및 R 라이브러리를 Conda 환경에 설치합니다.

    Oracle Machine Learning Notebooks에 설치된 타사 라이브러리는 다음에서 사용할 수 있습니다.

    • 표준 Python
    • 표준 R
    • Python, SQL 및 REST API에서 실행되는 Oracle Machine Learning for Python 내장 Python 실행
    • Oracle Machine Learning for R R, SQL 및 REST API에서 내장된 R 실행

    주:

    Conda 환경은 ADMIN 사용자가 OML_SYS_ADMIN 롤을 사용하여 설치 및 관리합니다. 관리자는 공유 환경을 만들고 공유 환경에서 패키지를 추가하거나 삭제할 수 있습니다. Conda 환경은 Autonomous Database와 연관된 Object Storage 버킷에 저장됩니다.

    Conda는 타사 R 및 Python 패키지가 포함된 가상 환경을 사용할 수 있는 오픈 소스 패키지 및 환경 관리 시스템입니다. Conda 환경을 사용하면 패키지와 종속성을 설치 및 업데이트하고 프로젝트별 패키지를 사용하도록 환경 간에 전환할 수 있습니다.

    이 템플리트 노트북 OML 타사 패키지 - 환경 생성에는 Oracle Machine Learning Notebooks의 타사 환경 생성 및 패키지 설치를 위한 일반적인 워크플로우가 포함되어 있습니다.

    • 섹션 1에는 Conda 환경을 생성하고 테스트하는 명령이 포함되어 있습니다.
    • 섹션 2에는 Conda 환경을 생성하고, 패키지를 설치하고, Oracle Autonomous Database와 연관된 Object Storage 버킷에 Conda 환경을 업로드하는 명령이 포함되어 있습니다.

    그림 10-1 Conda 예제 템플리트

    Conda 예제 템플리트
  • OML 타사 패키지 - Python 환경 사용량: 이 템플리트 노트북을 사용하여 Oracle Machine Learning Notebooks에서 Python 및 Oracle Machine Learning for Python을 사용하는 타사 환경 사용에 대한 일반적인 워크플로우를 이해할 수 있습니다. 이전에 생성되어 Autonomous Database와 연관된 Object Storage 버킷 폴더에 저장된 Conda 환경의 라이브러리를 다운로드하여 사용합니다.
    이 노트북에는 다음 명령을 포함합니다.
    • 오브젝트 스토리지에 저장된 모든 환경 나열
    • 오브젝트 스토리지에 저장된 명명된 환경 나열
    • mypyenv 환경 다운로드 및 활성화
    • Conda 환경에서 사용 가능한 패키지 나열
    • Python 라이브러리 임포트
    • 데이터 집합 로드
    • 모델 빌드
    • 모델 점수 부여
    • UDF(Python 사용자 정의 함수) 생성
    • Python에서 UDF(유저 정의 함수) 실행
    • 내장된 Python 실행을 위한 SQL 및 REST API에서 사용자 정의 함수 생성 및 실행
    • 내장된 Python 실행용 SQL API를 사용하여 Python 사용자 정의 함수 생성 및 실행 - 비동기 모드
  • OML 타사 패키지 - R 환경 사용량: 이 템플리트 노트북을 사용하여 Oracle Machine Learning for R에서 타사 환경 사용에 대한 일반적인 워크플로우를 이해할 수 있습니다.
    이 노트북에는 다음 명령을 포함합니다.
    • 오브젝트 스토리지에 저장된 모든 환경 나열
    • 오브젝트 스토리지에 저장된 명명된 환경 나열
    • myrenv 환경 다운로드 및 활성화
    • 사용 가능한 OML4R Conda 환경 목록 표시
    • R 라이브러리 임포트
    • 데이터 로드 및 준비
    • 모델 빌드
    • 모델 점수 부여
    • R UDF(유저 정의 함수) 생성
    • R에서 UDF(유저 정의 함수) 실행
    • 스크립트 저장소에 UDF(유저 정의 함수) 저장
    • 내장된 R 실행을 위해 SQL 및 REST API에서 R 사용자 정의 함수 실행
    • OML 유저를 Access Control List에 추가
    • 동기 모드에서 포함된 R 실행을 위해 REST API를 사용하여 R 사용자 정의 함수를 실행합니다.
  • OML4R-1: 소개: 다음 방법을 이해하려면 이 노트북을 사용합니다.
    • ORE 라이브러리 로드
    • 데이터베이스 테이블 생성
    • 투명도 레이어 사용
    • 데이터베이스 내 속성 중요도 알고리즘을 사용하여 예측 값에 대한 속성 순위 지정
    • 예측 모델 구축 및
    • 이 모델을 사용하여 데이터 점수 부여

    그림 10-2 Oracle Machine Learning for R 예제 템플리트

    OML4R 예제 템플리트
  • OML4R-2: 데이터 선택 및 조작: 이 노트북을 사용하여 데이터 선택 및 조작과 관련된 투명도 계층의 기능을 이해할 수 있습니다.
  • OML4R-3: 데이터 저장소 및 스크립트 저장소: 이 노트북을 사용하여 OML4R의 데이터 저장소 및 스크립트 저장소 기능을 이해할 수 있습니다.
  • OML4R-4: 내장 R 실행: 이 노트북을 사용하여 OML4R 내장 R 실행을 이해합니다. 먼저 선형 모델이 R에 직접 내장된 후 선형 모델을 구축하기 위해 사용자 정의 R 함수가 생성되고, 스크립트에 함수가 저장되며, Oracle Autonomous Database 환경에서 생성된 R 엔진을 사용하여 데이터에 병렬로 점수가 부여됩니다. 또한 내장 R 실행이 포함된 SQL 인터페이스 및 REST API for R을 사용하여 이러한 스크립트를 호출하는 방법을 보여줍니다.

    주:

    내장 R 실행에 SQL API를 사용하려면 사용자 정의 R 함수가 OML4R 스크립트 저장소에 있어야 하며, 인증 토큰을 얻으려면 OML(Oracle Machine Learning) 클라우드 계정 USERNAME, PASSWORD 및 URL을 제공해야 합니다.
  • OML4R 이상 감지 SVM(Support Vector Machine): 이 노트북을 사용하여 일류 SVM 모델을 구축한 다음 이 노트북을 사용하여 비정상적이거나 의심스러운 레코드에 플래그를 지정합니다.
  • OML4R 연관 규칙 Apriori: 이 노트북을 사용하여 A Priori 알고리즘을 사용하여 SH 스키마(SH.SALES)의 데이터와 연관 규칙 모델을 작성합니다. 모든 계산은 Oracle Autonomous Database 내에서 수행됩니다.
  • OML4R 속성 중요도 최소 설명 길이(MDL): 이 노트북을 사용하여 SH 스키마 데이터에서 최소 설명 길이 알고리즘을 사용하는 속성 중요도를 계산합니다. 모든 기능은 Oracle Autonomous Database 내에서 실행됩니다. Oracle Machine Learning은 속성 중요도를 지원하여 속성, 예측자, 대상 속성에 가장 큰 영향을 미치는 변수와 같은 주요 요소를 식별합니다.
  • OML4R 분류 GLM(Generalized Linear Model): 이 노트북을 사용하여 Affinity Card 로열티 프로그램에 대한 긍정적인 응답자가 될 가능성이 가장 높은 고객을 예측합니다. 이 노트북은 SH(Sales History) 스키마 데이터를 사용하여 분류 일반 선형 모델을 작성하고 적용합니다. 모든 처리는 Oracle Autonomous Database 내에서 수행됩니다.
  • OML4R NB(Classification Naive Bayes): 이 노트북을 사용하여 Affinity Card 로열티 프로그램에 대한 긍정적인 응답자가 될 가능성이 가장 높은 고객을 예측합니다. 이 노트북은 SH(Sales History) 스키마 데이터를 사용하여 분류 결정 트리 모델을 작성하고 적용합니다. 모든 처리는 Oracle Autonomous Database 내에서 수행됩니다.
  • OML4R RF(Classification Random Forest): 이 노트북을 사용하여 OML4R의 분류에 Random Forest 알고리즘을 사용하고, Affinity Card 로열티 프로그램에 대해 긍정적인 응답자가 될 가능성이 가장 높은 고객을 예측합니다.
  • OML4R SVM(Support Vector Machine)을 사용하여 대상 고객을 예측하기 위한 분류 모델링: 이 노트북을 사용하여 분류 모델링을 통해 Support Vector Machine 모델을 사용하여 대상 고객을 예측할 수 있습니다.
  • OML4R 클러스터링 - Expectation Maximization 클러스터링을 사용하여 고객 세그먼트 식별: 이 노트북을 사용하면 비지도 학습 EM(Expectation Maximization) 알고리즘을 사용하여 SH 스키마에서 CUSTOMERS 데이터 집합을 사용하여 고객의 자연 클러스터를 식별하는 방법을 이해할 수 있습니다. 데이터 탐색, 준비 및 머신 러닝은 Oracle Autonomous Database 내에서 실행됩니다.
  • OML4R 클러스터링 - K-평균 클러스터링을 사용하여 고객 세그먼트 식별: 이 노트북을 사용하면 지도 없는 학습 KM(K-평균) 알고리즘을 사용하여 SH 스키마에서 CUSTOMERS 데이터 세트를 사용하여 고객의 자연 클러스터를 식별하는 방법을 이해할 수 있습니다. 데이터 탐색, 준비 및 머신 러닝은 Oracle Autonomous Database 내에서 실행됩니다.
  • OML4R 클러스터링 - OC(직교 분할 클러스터링): 이 노트북을 사용하면 비지도 학습 k-평균 알고리즘을 사용하여 SH 스키마의 CUSTOMERS 데이터 집합을 사용하여 고객의 자연 클러스터를 식별하는 방법을 이해할 수 있습니다. 데이터 탐색, 준비, 머신 러닝은 Oracle Autonomous Database 내에서 실행됩니다.
  • OML4R 데이터 삭제 이상치: 이 노트북에서는 OML4R를 사용하여 이상치가 있는 레코드를 이해하고 제외할 수 있습니다.
  • OML4R 데이터 청소 - 동의어 값 재코딩: 이 노트북을 사용하여 OML4R를 사용하여 동의어 값을 재코딩합니다.
  • OML4R 데이터 집합 생성: 이 노트북을 사용하여 샘플 데이터 집합 MTCARSIRIS를 로드하고 ore.create() 함수를 사용하여 Oracle Autonomous Database 인스턴스로 임포트합니다.

주:

다음 예제 템플리트 노트북에는 별표(*)가 접두어로 붙고 CUSTOMER_INSURANCE_LTV 데이터 세트를 사용합니다. 이 데이터 세트는 OML Run-me-first 노트북에서 생성됩니다. 따라서 예제 템플리트에서 사용할 수 있는 OML Run-me-first 노트북을 실행해야 합니다.
  • * OML4R 누락된 데이터 정리: 이 노트북을 사용하여 OML4R를 사용하여 누락된 값 교체를 수행할 수 있습니다.
  • * OML4R 데이터 정리 중복 제거: OML4R를 사용하여 중복 레코드를 제거하려면 이 노트북을 사용합니다.
  • * OML4R 데이터 변환 BIN: 이 노트북을 사용하여 OML4R를 사용하여 숫자 열을 BIN합니다.
  • * OML4R 데이터 변환 범주 레코드: 이 노트북을 사용하여 OML4R를 사용하여 범주 문자열 변수를 숫자 변수 및 문자열-문자열 재코딩으로 재코딩합니다.
  • * OML4R 데이터 변환: 정규화 및 크기 조정: 이 노트북을 사용하면 OML4R를 사용하여 데이터를 정규화하고 크기를 조정할 수 있습니다.
  • * OML4R 데이터 변환: 핫 인코딩: 이 노트북을 사용하여 OML4R를 사용하여 1핫 인코딩을 수행할 수 있습니다.
  • * OML4R 기능 선택 - 감독 알고리즘: 이 노트북을 사용하면 OML4R를 사용하여 데이터베이스 내 감독 알고리즘을 사용하여 기능 선택을 수행할 수 있습니다. 이 노트북은 Random Forest 모델을 구축하여 고객이 보험을 구매할지 여부를 예측한 다음 기능 중요도를 사용하여 기능 선택을 수행하는 방법을 보여줍니다.
  • * OML4R 요약 통계를 사용하여 기능 선택: 이 노트북을 사용하면 OML4R를 사용하여 요약 통계를 사용하여 기능 선택을 수행할 수 있습니다. 이 노트북은 OML4R를 사용하여 구분 값 수, 널 값, 상수 값 비율에 따라 기능을 선택하는 방법을 보여줍니다.
  • OML4R 기능 엔지니어링 집계: 이 노트북을 사용하면 OML4R를 사용하여 최소, 최대, 평균 및 개수에 대한 집계를 수행할 수 있습니다. 이 템플리트는 SH 스키마에 있는 SALES 테이블을 사용하며 각 고객 및 제품 쌍에 대해 판매된 금액을 집계하여 기능을 생성하는 방법을 보여줍니다.
  • OML4R ESA(기능 추출 명시적 의미 분석) Wiki 모델: 이 노트북에서는 Wikipedia 모델을 예로 사용합니다. 이 노트북에서는 Oracle Machine Learning for R 함수 ore.odmESA을 사용하여 문서 그룹에서 텍스트 기반 기능을 추출하고 문서 유사성 비교를 수행할 수 있습니다. 모든 처리는 Oracle Autonomous Database 내에서 수행됩니다.

    주:

    이 노트북을 실행하려면 사전 구축된 Wikipedia 모델이 Autonomous Database 인스턴스에 설치되어 있어야 합니다.
  • OML4R 데이터 변환 날짜 데이터 유형: 이 노트북을 사용하면 Oracle Machine Learning for R을 사용하여 데이터베이스 테이블 프록시 객체를 사용하여 날짜 및 시간 데이터에 대해 다양한 작업을 수행할 수 있습니다.
  • OML4R 기능 추출 SVD(단수 값 분해): 이 노트북을 사용하여 기능 추출을 위해 데이터베이스 내 SVD를 사용합니다. 이 노트북에서는 Oracle Machine Learning for R 함수 ore.odmSVD을 사용하여 기능 추출을 위해 SVD(단수 값 분해) 알고리즘을 사용하는 모델을 생성합니다.
  • OML4R Partitioned Model SVM(Support Vector Machine): 이 노트북을 사용하여 고객이 거주지에 있지만 고객 성별에 따라 분할된 연수를 예측하는 SVM 모델을 구축합니다. 그런 다음 모델을 사용하여 대상을 예측한 다음 예측 세부정보로 대상을 예측합니다.
  • OML4R 회귀 GLM(일반 선형 모델): 여러 회귀를 사용하여 숫자 값을 예측하는 방법을 이해하려면 이 노트북을 사용합니다. 이 노트북은 일반화된 선형 모델 알고리즘을 사용합니다.
  • OML4R 회귀 신경망(NN): 여러 회귀를 사용하여 숫자 값을 예측하는 방법을 이해하려면 이 노트북을 사용합니다. 이 노트북은 신경망 알고리즘을 사용합니다.
  • OML4R 회귀 Support Vector Machine(SVM): 이 노트북을 사용하여 여러 회귀를 사용하여 숫자 값을 예측하는 방법을 이해할 수 있습니다. 이 노트북은 Support Vector Machine 알고리즘을 사용합니다.
  • OML4R REST API: 이 노트북을 사용하면 OML4R REST API를 사용하여 사용자 정의 R 함수를 호출하고 R 스크립트 저장소에서 사용 가능한 함수를 나열하는 방법을 이해할 수 있습니다.

    주:

    스크립트를 실행하려면 R 스크립트 저장소에 있어야 합니다. 인증을 위해 Oracle Machine Learning 클라우드 서비스 계정 사용자 이름 및 비밀번호를 제공해야 합니다.
  • OML4R 통계 함수: 이 노트북을 사용하여 다양한 통계 함수를 이해하고 사용할 수 있습니다. 노트북은 OML4R 투명도 계층을 통해 SH 스키마의 데이터를 사용합니다.
  • OML4R 텍스트 마이닝 SVM(Support Vector Machine): 이 노트북을 통해 비정형 텍스트 데이터를 사용하여 머신 러닝 모델을 구축하고, Oracle Text를 활용하고, Oracle Machine Learning 데이터베이스 내 알고리즘 예측 기능을 사용하고, 텍스트 열에서 기능을 추출하는 방법을 이해할 수 있습니다.

    이 노트북은 SVM(Support Vector Machine) 모델을 구축하여 Affinity Card 로열티 프로그램에 대한 긍정적인 응답자가 될 가능성이 가장 높은 고객을 예측합니다. 데이터는 사용자 생성 설명을 포함하는 텍스트 열에서 가져옵니다.

Oracle Machine Learning for Python 예제 템플리트

다음 Oracle Machine Learning for Python 예제 템플리트를 기반으로 Oracle Machine Learning 노트북을 생성할 수 있습니다.

그림 10-3 Oracle Machine Learning for Python 예제 템플리트

OML4Py 예제 템플리트
  • My First Notebook: 기본 머신 러닝 기능, 데이터 선택 및 데이터 보기를 위해 My First Notebook 노트북을 사용합니다. 이 템플리트는 SH 스키마 데이터를 사용합니다.
  • OML4Py -0- 둘러보기: 이 노트북은 간단한 예를 통해 OML4Py 기능의 범위를 소개하기 위한 0~5 시리즈의 첫번째 노트북입니다.
  • OML4Py -1- 소개: 이 노트북에서는 OML 라이브러리를 로드하고, 데이터베이스 테이블을 생성하고, 투명도 계층을 사용하고, 데이터베이스 내 속성 중요도 알고리즘을 사용하여 예측 값에 대한 속성의 순위를 지정하고, 예측 모델을 구축하고, 이러한 모델을 사용하여 데이터에 점수를 부여하는 방법에 대한 개요를 제공합니다.
  • OML4Py -2- 데이터 선택 및 조작: 이 노트북을 사용하여 데이터 선택 및 조작이 필요한 투명도 계층을 사용하는 방법을 알아봅니다.
  • OML4Py -3- 데이터 저장소: 이 노트북을 사용하여 데이터 저장소 작업, 데이터 저장소와 Python 세션 간 객체 이동, 데이터 저장소 권한 관리, 데이터 저장소에 모델 객체 및 Python 객체 저장, 데이터 저장소 삭제 등을 수행하는 방법을 알아봅니다.
  • OML4Py -4- 내장된 Python 실행: 내장된 Python 실행을 이해하려면 이 노트북을 사용합니다. 이 노트북에서는 선형 모델이 Python에서 직접 구축된 후 Autonomous Database 환경에서 생성된 Python 엔진을 사용하는 함수가 생성됩니다.
  • OML4Py -5- AutoML: 이 노트북을 사용하여 OML4Py의 AutoML 워크플로우를 이해할 수 있습니다. 이 노트북에서는 scikit-learn의 WINE 데이터 세트가 사용됩니다. 여기서 AutoML는 target 열의 분류 및 alcohol 열의 회귀에 사용됩니다.

주:

다음 예제 템플리트 노트북에는 별표(*)가 접두어로 붙고 CUSTOMER_INSURANCE_LTV_PY 데이터 세트를 사용합니다. 이 데이터 세트에는 OML4SQL Noise 노트북에서 인위적으로 생성된 중복 값이 있습니다. 따라서 노트북을 실행하기 전에 먼저 OML4SQL Noise를 실행해야 합니다.
  • * OML4Py 데이터 삭제 중복 제거: 이 노트북을 사용하면 OML4Py를 사용하여 중복 레코드를 제거하는 방법을 이해할 수 있습니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다.
  • * OML4Py 데이터 삭제 누락 데이터: 이 노트북을 사용하면 OML4Py를 사용하여 누락된 값을 채우는 방법을 이해할 수 있습니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다.
  • * OML4Py 데이터 청소는 동의어 값을 다시 코딩합니다. 이 노트북에서는 OML4Py를 사용하여 동의어 값을 다시 코딩하는 방법을 이해할 수 있습니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다.
  • OML4Py 데이터 삭제 이상값 제거: 이 노트북을 사용하여 이상값을 제거하기 위해 데이터를 정리하는 방법을 이해할 수 있습니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 CUSTOMER_INSURANCE_LTV 데이터 세트를 사용합니다. 데이터 세트 CUSTOMER_INSURANCE_LTV에서 포커스는 숫자 값과 위쪽 및 아래쪽 값이 5%인 레코드 제거에 있습니다.
  • OML4Py 데이터 변환 BIN: 이 노트북을 사용하여 숫자 열을 BIN하고 배포를 시각화하는 방법을 이해할 수 있습니다.
  • OML4Py 데이터 변환 범주 - 범주 변수를 숫자 변수로 변환: 이 노트북을 사용하여 OML4Py를 사용하여 범주 변수를 숫자 변수로 변환하는 방법을 이해합니다. 노트북은 각 고유 레벨/값이 정수 데이터 유형으로 코딩된 범주 변수를 변환하는 방법을 보여줍니다.
  • OML4Py 데이터 변환 정규화 및 크기 조정: 이 노트북을 사용하면 z 점수(평균 및 표준 편차), 최소 최대 크기 조정 및 로그 크기 조정을 사용하여 데이터를 정규화하고 크기를 조정하는 방법을 이해할 수 있습니다.

    주:

    데이터베이스 내 Oracle Machine Learning 알고리즘을 사용하여 모델을 구축하거나 적용할 때 자동 데이터 준비는 특정 알고리즘에 따라 필요에 따라 자동으로 데이터를 정규화합니다.
  • OML4Py 데이터 변환 핫 인코딩: 이 노트북을 사용하여 OML4Py를 사용하여 하나의 핫 인코딩을 수행하는 방법을 이해할 수 있습니다. 머신 러닝 알고리즘은 범주형 데이터를 직접 사용할 수 없습니다. 범주별 데이터는 숫자로 변환되어야 합니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다.

    주:

    데이터베이스 내 알고리즘을 사용하려는 경우 핫 인코딩이 필요한 알고리즘에 대해 자동으로 적용됩니다. 데이터베이스 내 알고리즘은 범주형 열을 자동으로 분해하고 모델을 준비된 데이터에 내부적으로 맞춥니다.
  • OML4Py 이상 감지: 이 노트북을 사용하여 비정상적 레코드, 고객 또는 데이터 트랜잭션을 감지합니다. 이 템플리트는 비지도 학습 알고리즘 1-Class Support Vector Machine을 사용합니다. 노트북 템플릿은 1급 SVM(Support Vector Machine) 모델을 구축합니다.
  • OML4Py 연관 규칙: 이 노트북을 사용하여 데이터의 시장 바구니 분석을 수행하거나 데이터에서 공동 발생 항목, 실패 또는 이벤트를 감지합니다. 이 템플리트는 SH 스키마 데이터(SH.SALES)를 사용하는 apriori 연관 규칙 모델을 사용합니다.
  • OML4Py 속성 중요도: 이 노트북을 사용하여 대상 속성에 최대로 영향을 주는 키 속성을 식별합니다. 감독 모델의 빌드 데이터에 있는 대상 속성은 예측할 속성입니다. 템플리트는 SH 스키마 데이터를 사용하여 속성 중요도 모델을 작성합니다.
  • OML4Py 분류: 고객 행동 및 유사한 예측을 예측하려면 이 노트북을 사용합니다. 템플리트는 분류 알고리즘 결정 트리를 작성하고 적용하여 예측자 값과 대상 값 간의 관계를 기반으로 분류 모델을 작성합니다. 템플리트는 SH 스키마 데이터를 사용합니다.
  • OML4Py 클러스터링: 이 노트북을 사용하여 데이터의 자연 클러스터를 식별합니다. 노트북 템플리트는 SH 스키마 데이터의 비지도 학습 k-평균 알고리즘을 사용합니다.
  • OML4Py 데이터 변환: 이 노트북을 사용하여 OML4Py를 사용하여 범주 변수를 숫자 변수로 변환합니다. 이 템플리트는 각 고유 레벨/값이 정수 데이터 유형으로 코딩된 범주 변수를 변환하는 방법을 보여줍니다.
  • OML4Py 데이터 집합 생성: 이 노트북을 사용하여 sklearn 패키지에서 OML 데이터 프레임으로 OML4Py를 사용하여 데이터 집합을 생성합니다.
  • OML4Py 기능 엔지니어링 집계: 이 노트북 템플리트를 사용하여 OML4Py를 사용하여 누락된 값을 채웁니다. 이 노트북은 SH 스키마 SALES 테이블을 사용합니다. 이 테이블에는 각 고객 및 구매한 제품에 대한 트랜잭션 레코드가 포함되어 있습니다. 각 고객 및 제품 쌍에 대해 판매된 금액을 집계하여 기능을 생성합니다.
  • OML4Py 기능 선택 감독 알고리즘 기반: 이 노트북을 사용하면 OML4Py를 사용하여 데이터베이스 내 감독 알고리즘을 사용하여 기능 선택을 수행할 수 있습니다.
  • OML4Py 기능 선택 요약 통계: 이 노트북 템플리트를 사용하면 OML4Py를 사용하여 요약 통계를 사용하여 기능 선택을 수행할 수 있습니다. 이 노트북은 OML4Py를 사용하여 구분 값 수, 널 값, 상수 값 비율에 따라 기능을 선택하는 방법을 보여줍니다. CUSTOMER_INSURANCE_LTV_PY에 사용된 데이터 세트에 OML4SQL 노이즈 노트북에서 인위적으로 생성된 널 값이 있습니다. OML4Py 기능 선택 요약 통계 노트북을 실행하기 전에 먼저 OML4SQL 노이즈 노트북을 실행해야 합니다.
  • OML4Py 분할된 모델: 이 노트북을 사용하여 분할된 모델을 빌드합니다. 이 노트북은 고객이 거주하고 있지만 고객 성별에 따라 분할된 연수를 예측하는 SVM 모델을 구축합니다. 모델을 사용하여 대상을 예측한 다음 예측 세부 정보로 대상을 예측합니다.

    Oracle Machine Learning을 사용하면 각 데이터 파티션마다 하나씩 여러 하위 모델로 구성된 앙상블 모델을 자동으로 구축할 수 있습니다. 하위 모델이 존재하고 하나의 모델로 사용되므로 최상위 모델만 사용하여 점수부여가 간소화됩니다. 적절한 하위 모델은 점수가 부여될 데이터 행의 분할 영역 값을 기반으로 시스템에서 선택됩니다. 분할된 모델은 여러 대상 모델을 통해 잠재적으로 더 나은 정확도를 달성합니다.

  • OMP4Py REST API: 이 노트북을 사용하여 내장된 Python 실행을 호출합니다. OML4Py에는 스크립트 저장소에 저장된 사용자 정의 Python 함수를 실행하기 위한 REST API가 포함되어 있습니다. REST API는 클라이언트와 데이터베이스 서버 간의 구분이 유용한 경우 사용됩니다. OML4Py REST API를 사용하여 스크립트를 빌드, 교육, 배포 및 관리합니다.

    주:

    스크립트를 실행하려면 OML4Py 스크립트 저장소에 있어야 합니다. 인증을 위해 Oracle Machine Learning 클라우드 서비스 계정 사용자 이름 및 비밀번호를 제공해야 합니다.
  • OML4Py 숫자 값을 예측하는 회귀 모델링: 여러 회귀를 사용하여 숫자 값을 예측하려면 이 노트북을 사용합니다.
  • OML4Py 통계 함수: 이 노트북을 사용하여 다양한 통계 함수를 사용합니다. 통계 함수는 OML4Py 투명도 계층을 통해 SH 스키마의 데이터를 사용합니다.
  • OML4Py 텍스트 마이닝: 이 노트북을 사용하여 Oracle Machine Learning에서 텍스트 마이닝 기능을 사용하여 모델을 구축합니다.

    이 노트북에서 SVM 모델은 Affinity Card 충성도 프로그램에 대한 긍정적인 응답자가 될 가능성이 가장 높은 고객을 예측하기 위해 구축되었습니다. 데이터는 사용자 생성 설명을 포함하는 텍스트 열과 함께 제공됩니다. 몇 가지 추가 사양으로 알고리즘은 텍스트 열을 자동으로 사용하고 구조화된 데이터와 비구조화된 텍스트 모두에 모델을 작성합니다.

Oracle Machine Learning for SQL 예제 템플리트

Oracle Machine Learning for SQL 예제 템플리트를 기반으로 Oracle Machine Learning 노트북을 생성할 수 있습니다.

그림 10-4 Oracle Machine Learning for SQL 예제 템플리트

OML4SQL 예제 템플리트
  • OML4SQL 변형 감지: 이 노트북을 사용하여 비정상적이거나 드문 발생을 감지합니다. Oracle Machine Learning은 반지도 학습 알고리즘 One-Class Support Vector Machine을 사용하여 데이터에서 희귀하거나 비정상적인 레코드(고객, 트랜잭션 등)를 식별하는 이상 감지를 지원합니다. 이 노트북은 1Class-SVM 모델을 만든 다음 이 모델을 사용하여 비정상적이거나 의심스러운 레코드에 플래그를 지정합니다. 전체 머신 러닝 방법론은 Oracle Autonomous Database 내에서 실행됩니다.
  • OML4SQL 연관 규칙: 이 노트북을 사용하여 연관 규칙 머신 러닝 기술(시장 바구니 분석이라고도 함)을 적용하여 공동 발생 항목, 실패로 이어지는 상태 또는 명확하지 않은 이벤트를 검색합니다. 이 노트북은 A Priori 알고리즘을 사용하여 SH 스키마의 SH.SALES 데이터와 연관 규칙 모델을 구축합니다. 모든 계산은 Oracle Autonomous Database 내에서 수행됩니다.
  • OML4SQL 속성 중요도 - 주요 요소 식별: 이 노트북을 사용하여 대상 속성에 가장 큰 영향을 주는 속성, 예측자, 변수라고도 하는 주요 요소를 식별합니다. 이 노트북은 SH 스키마 데이터를 사용하여 최소 설명 길이 알고리즘을 사용하는 속성 중요도 모델을 작성합니다. 모든 기능은 Oracle Autonomous Database 내에서 실행됩니다.
  • OML4SQL 분류 - 대상 고객 예측: 이 노트북을 사용하여 선호도 카드 로열티 프로그램에 대해 긍정적인 응답자가 될 가능성이 가장 높은 고객을 예측합니다. 이 노트북은 SH 스키마 데이터를 사용하여 분류 결정 트리 모델을 작성하고 적용합니다. 모든 처리는 Oracle Autonomous Database 내에서 수행됩니다.
  • OML4SQL 클러스터링 - 고객 세그먼트 식별: 이 노트북을 사용하여 고객의 자연스러운 클러스터를 식별합니다. Oracle Machine Learning은 k-평균, O-클러스터, 기대 최대화 등 여러 알고리즘을 사용하여 클러스터링을 지원합니다. 이 노트북은 비지도 학습 k-평균 알고리즘을 사용하여 SH 스키마의 CUSTOMERS 데이터 집합을 사용합니다. 데이터 탐색, 준비, 머신 러닝은 Oracle Autonomous Database 내에서 실행됩니다.
  • OML4SQL 데이터 정리 - 중복 제거: Oracle SQL을 사용하여 중복 레코드를 제거하려면 이 노트북을 사용합니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다. 데이터 세트 CUSTOMER_INSURANCE_LTV_SQL에 OML4SQL 노이즈 노트북에서 생성된 중복 값이 있습니다.

    주:

    OML4SQL 데이터 청소 노트북을 실행하기 전에 먼저 OML4SQL 노이즈 노트북을 실행해야 합니다.
  • OML4SQL 데이터 정리 - 데이터 누락: Oracle SQL 및 DBMS_DATA_MINING_TRANSFORM 패키지를 사용하여 누락된 값을 바꾸려면 이 템플리트를 사용합니다. 데이터 세트 CUSTOMER_INSURANCE_LTV_SQL에 OML4SQL 노이즈 노트북에서 인위적으로 생성된 값이 누락되었습니다. OML4SQL 데이터 청소 노트북을 실행하기 전에 먼저 OML4SQL 노이즈 노트북을 실행해야 합니다.

    주:

    데이터베이스 내 Oracle Machine Learning 알고리즘을 사용하여 모델을 구축하거나 적용할 때 자동 데이터 준비가 사용으로 설정된 경우 이 작업이 별도로 필요하지 않을 수 있습니다. 자동 데이터 준비는 숫자 속성의 누락된 값을 자동으로 범주 속성의 평균 및 누락 값으로 모드로 바꿉니다.
  • OML4SQL 데이터 삭제 이상치 제거: 이 노트북을 사용하여 Oracle SQL 및 DBMS_DATA_MINING_TRANSFORM 패키지를 사용하여 이상치를 제거합니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다. 데이터 세트 CUSTOMER_INSURANCE_LTV에서 숫자 값에 초점을 맞추고 위쪽 및 아래쪽 5%에 있는 값이 있는 레코드를 제거합니다.
  • OML4SQL 데이터 청소는 동의어 값을 다시 코딩합니다. 이 노트북을 사용하여 Oracle SQL을 사용하여 열의 동의어 값을 다시 코딩합니다. 이 노트북은 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다. 데이터 세트 CUSTOMER_INSURANCE_LTV_SQL에 OML4SQL 노이즈 노트북에서 생성된 값이 재코딩되었습니다. OML4SQL 데이터 청소 - 동의어 값 재코딩 노트북을 실행하기 전에 먼저 OML4SQL 노이즈 노트북을 실행해야 합니다.
  • OML4SQL 데이터 변환 BIN: 이 노트북을 사용하여 Oracle SQL 및 DBMS_DATA_MINING_TRANSFORM 패키지를 사용하여 숫자 열을 BIN합니다. 이 노트북은 숫자 열을 저장하고 배포를 시각화하는 방법을 보여줍니다.
  • OML4SQL 데이터 변환 범주: 이 노트북을 사용하여 Oracle SQL을 사용하여 범주 변수를 숫자 변수로 변환합니다. 이 노트북은 각 고유 레벨/값이 정수로 코딩된 범주 변수를 변환하는 방법과 단순 술어를 기반으로 표시기 변수를 생성하는 방법을 보여줍니다.
  • OML4SQL 데이터 변환 정규화 및 확장: 이 노트북을 사용하여 Oracle SQL 및 DBMS_DATA_MINING_TRANSFORM 패키지를 사용하여 데이터를 정규화하고 확장할 수 있습니다. 이 노트북은 z 점수(평균 및 표준 편차), 최소 최대 크기 조정 및 로그 크기 조정을 사용하여 데이터를 정규화하는 방법을 보여줍니다. 데이터베이스 내 Oracle Machine Learning 알고리즘을 사용하여 모델을 구축하거나 적용할 때 자동 데이터 준비는 필요에 따라 특정 알고리즘에 따라 자동으로 데이터를 정규화합니다.
  • OML4SQL 차원 감소 - 음수가 아닌 매트릭스 계수화: 이 노트북을 사용하면 데이터베이스 내 음수가 아닌 매트릭스 계수화 알고리즘을 사용하여 차원 감소를 수행할 수 있습니다. 이 노트북은 많은 열이 있는 테이블을 축소된 피쳐 세트로 변환하는 방법을 보여줍니다. 음수가 아닌 매트릭스 인수분해는 음수가 아닌 계수를 생성합니다.
  • OML4SQL 차원 감소 - 단일 값 분해: 데이터베이스 내 단수 값 분해(SVD) 알고리즘을 사용하여 차원 감소를 수행하려면 이 노트북을 사용합니다.
  • OML4SQL: 직렬화된 모델 익스포트: 이 노트북을 사용하여 직렬화된 모델을 Oracle Cloud Object Storage로 익스포트합니다. 이 노트북은 Oracle Machine Learning 회귀 및 분류 모델을 생성하고 직렬화된 형식으로 모델을 익스포트하여 Oracle Machine Learning(OML) Services REST API를 사용하여 점수를 부여할 수 있습니다. OML 서비스는 Oracle Autonomous Database에서 호스팅되는 REST API 엔드포인트를 제공합니다. 이러한 엔드포인트를 사용하면 Oracle Machine Learning 모델을 메타데이터와 함께 저장하고 모델에 대한 점수부여 엔드포인트를 생성할 수 있습니다. OML 서비스용 REST API는 Oracle Machine Learning 모델과 ONNX 형식 모델을 모두 지원하며 인지 텍스트 기능을 지원합니다.
  • OML4SQL 기능 엔지니어링 집계 및 시간: 이 노트북을 사용하여 집계된 기능을 생성하고 Oracle SQL을 사용하여 날짜 및 시간 기능을 추출합니다. 이 노트북은 TIME_ID 필드에서 날짜 및 시간 기능을 추출하는 방법도 보여줍니다.
  • OML4SQL 기능 선택 알고리즘 기반: 이 노트북을 사용하면 데이터베이스 내 감독 알고리즘을 사용하여 기능 선택을 수행할 수 있습니다. 노트북은 먼저 무작위 포리스트 모델을 구축하여 고객이 보험을 구매할지 예측한 다음 기능 선택에 기능 중요도 값을 사용합니다. 그런 다음 동일한 분류 작업에 대한 결정 트리 모델을 작성하고 분할 노드를 가져옵니다. 지원이 가장 높은 최상위 분할 노드의 경우 해당 노드와 연관된 기능이 선택됩니다.
  • OML4SQL 기능 선택 비지도 속성 중요도: 이 노트북을 사용하면 데이터베이스 내 비지도 알고리즘인 EM(예상 최대화)을 사용하여 기능 선택을 수행할 수 있습니다. 이 노트북은 다른 노트북에 사용된 CREATE_MODEL2 함수와 달리 설정 테이블을 활용하는 CREATE_MODEL 함수를 사용하는 방법을 보여줍니다.
  • OML4SQL 요약 통계를 사용하여 기능 선택: 이 노트북에서는 Oracle SQL을 사용하여 요약 통계를 사용하여 기능 선택을 수행할 수 있습니다. 데이터 세트 CUSTOMER_INSURANCE_LTV_SQL에 인위적으로 OML4SQL 노이즈 노트북에서 생성된 널 값이 있습니다. 요약 통계를 사용하여 OML4SQL 기능 선택을 실행하기 전에 먼저 OML4SQL 노이즈 노트북을 실행해야 합니다.
  • OML4SQL 소음: 이 노트북을 사용하여 일반 값을 널 값으로 바꾸고 중복 행을 추가합니다. 이 노트북에서는 데이터 준비 노트북에서 사용하는 데이터 세트, 특히 데이터 정리 및 기능 선택을 위한 데이터 세트가 준비되어 있습니다. 고객 재무 정보, 수명 값 및 고객이 보험을 구매했는지 여부를 포함하는 고객 보험 수명 값 데이터 세트를 사용합니다.

    주:

    데이터 준비 노트북 앞에 OML4SQL 노이즈 노트북을 실행합니다.
  • OML4SQL 분할된 모델: 이 노트북을 사용하여 분할된 모델을 빌드합니다. 분할된 모델은 여러 대상 모델을 통해 잠재적으로 더 나은 정확도를 달성합니다. 이 노트북은 고객이 거주지에 있지만 고객 성별에 따라 분할된 연수를 예측하기 위해 SVM 모델을 구축합니다. 그런 다음 모델을 사용하여 대상을 먼저 예측한 다음 예측 세부 정보로 대상을 예측합니다.
  • OML4SQL 텍스트 마이닝: 이 노트북을 사용하여 텍스트 마이닝 기능을 사용하여 모델을 빌드합니다. Oracle Machine Learning은 정형 데이터와 비정형 텍스트 데이터를 모두 처리합니다. Oracle Text를 활용하여 Oracle Machine Learning 데이터베이스 내 알고리즘은 텍스트 열에서 예측 기능을 자동으로 추출합니다.

    이 노트북은 SVM 모델을 구축하여 Affinity Card 로열티 프로그램에 대한 긍정적인 응답자가 될 가능성이 가장 높은 고객을 예측합니다. 데이터는 사용자 생성 설명을 포함하는 텍스트 열과 함께 제공됩니다. 몇 가지 추가 사양으로 알고리즘은 텍스트 열을 자동으로 사용하고 구조화된 데이터와 비구조화된 텍스트 모두에 모델을 작성합니다.

  • OML4SQL 회귀: 이 노트북을 사용하여 숫자 값을 예측합니다. 이 템플리트는 GLM(Generalized Linear Models)과 같은 다중 회귀 알고리즘을 사용합니다.
  • OML4SQL 통계 함수: 설명 및 비교 통계 함수에 이 노트북을 사용합니다. 노트북 템플리트는 SH 스키마 데이터를 사용합니다.
  • OML4SQL 시계열: 이 노트북을 사용하여 예측을 위해 시계열 데이터에 시계열 모델을 작성합니다. 이 노트북은 지수 평활 알고리즘을 기반으로 합니다. 이 노트북의 영업 예측 예는 SH.SALES 데이터를 기반으로 합니다. 모든 계산은 Oracle Autonomous Database 내에서 수행됩니다.