머신 러닝 Sandbox 작성 정보

인기 있는 머신 러닝 툴 및 라이브러리를 사용하여 데이터로 재생할 수 있는 단일 시스템에 하나 이상의 격리된 환경을 설정하려면 Oracle Cloud Infrastructure Compute 에 Anaconda Distribution을 설치하십시오.

Anaconda는 데이터 과학 프로젝트를 디자인, 구축 및 관리하는 일반적인 용도의 도구입니다. Anaconda의 경우 R 및 Python에서 1,500 데이터 과학 패키지에 액세스할 수 있습니다. TensorFlow, NumPy, 장애, 과학 학습 등과 같은 라이브러리를 관리합니다. 또한 Jupyter Notebook 및 RStudio 과 같은 머신 러닝 환경 설치 및 업데이트를 처리합니다.

구조

이 구조는 Oracle Cloud Infrastructure 의 단일 컴퓨트 인스턴스에 여러 머신 러닝 환경이 설치된 샘플 Sandbox를 보여줍니다.

각 환경은 독립적이며 다른 환경과 분리됩니다. 각 항목에 Python, R 또는 기타 언어, 도구 및 라이브러리 조합이 있을 수 있습니다. 이 설정을 통해 한 환경에서 다른 환경으로 쉽게 전환할 수 있는 여러 독립 프로젝트가 한 시스템에 있을 수 있습니다.

다음은 architecture e-oci-compute-environments.png에 대한 설명입니다.
그림 architecture e-oci-compute-environments.png에 대한 설명

필요 조건

이 솔루션에서 학습할 필요가 없지만, 최소한 데이터 수집, 이동 및 변환에 사용되는 기술과 프로세스에 대한 지식이 있어야 합니다.

특히 다음과 같은 기술이 있어야 합니다.

  • Python에 대한 기본적인 이해

  • Jupyter Notebook에 대한 기본적인 이해 기능입니다.

  • 머신 러닝 프로세스 및 메소드에 대한 일부 지식

  • Linux 명령행을 잘 알고 있어야 합니다.

  • SSH 또는 PuTTY 를 사용하여 원격 시스템에 접속할 수 있습니다.

필수 서비스 및 제품 정보

Linux를 실행하는 Oracle Cloud Infrastructure Compute에 대한 액세스 권한이 있어야 합니다.

Oracle Linux 7 . 7또는 Ubuntu 18 . 04를 사용할 수 있습니다. 이 솔루션에서는 두 가지 방법을 모두 사용하는 방법을 보여줍니다. 한 NVIDIA Tesla V100 GPU 및 6OCPU가 있는 GPU 컴퓨트 구성 VM.GPU3.1를 사용하지만 비GPU 구성에서 Sandbox를 설정할 수도 있습니다.

필요한 클라우드 서비스를 얻을 수 있도록 Oracle 솔루션용 Oracle Cloud 서비스를 얻는 방법을 알아봅니다 .