Sun N1 Grid Engine 6.1 インストールガイド

Procedureマスターホストをインストールする方法

マスターインストール手順により、sge_qmastersge_schedd によって使用される適切なディレクトリ階層が作成されます。また、マスターホスト上で Grid Engine システムデーモン sge_qmaster および sge_schedd が実行されます。マスターホストは、管理権と発行権を持つホストとして登録されます。インストール手順では、実行されるシステムにデフォルト構成が作成されます。インストールスクリプトは、システムにオペレーティングシステムの種類を照会します。照会内容に基づいて重要な設定が行われます。

インストール中に何か問題があることに気付いたら、いつでもインストール手順を中止し、やり直すことができます。

始める前に

「ユーザー名」の説明に従って、管理ユーザーを使用する場合、ここで管理ユーザーを作成します。この手順は、「ワークステーションへの配布ファイルの読み込み」の説明に従って、Grid Engine ソフトウェアがすでに抽出されていることを想定しています。


注 –

Windows ホストはマスターホストとしては使用できません。


  1. root としてマスターホストにログインします。

  2. $SGE_ROOT 環境変数が設定されていない場合は、次のように入力して設定します。


    # SGE_ROOT=sge-root; export SGE_ROOT
    

    次のように入力して、$SGE_ROOT 環境変数が設定されていることを確認します。


    # echo $SGE_ROOT
    
  3. インストールディレクトリへ移動します。

    • インストールファイルが格納されているディレクトリをマスターホストから認識できる場合は、インストールディレクトリ sge-root にディレクトリを移動 (cd) し、手順 4 に進みます。

    • 該当するディレクトリを認識できない場合は、次のようにします。

      1. マスターホスト上にローカルのインストールディレクトリ sge-root を作成します。

      2. ネットワークからローカルインストールディレクトリ sge-root にインストールファイルをコピーします。たとえば、ftprcp を使用します。

      3. ローカルの sge-root ディレクトリに移動します (cd)。

  4. 第 4 章「拡張セキュリティー機能のインストール」に説明されている Certificate Security Protocol を使ってインストールを行う場合、install_qmaster コマンドを入力して -csp フラグを追加します。

    このコマンドにより、マスターホストインストール手順が開始されます。表示される質問に対して回答を入力し、いくつかの管理アクションを実行する必要があります。


    % ./install_qmaster
    Welcome to the Grid Engine installation
    ---------------------------------------
    
    Grid Engine qmaster host installation
    -------------------------------------
    
    Before you continue with the installation please read these hints:
    
       - Your terminal window should have a size of at least
         80x24 characters
    
       - The INTR character is often bound to the key Ctrl-C.
         The term >Ctrl-C< is used during the installation if you
         have the possibility to abort the installation
    
    The qmaster installation procedure will take approximately 5-10 minutes.
    
    Hit <RETURN> to continue >> 
  5. 管理アカウントを持つユーザーを選択します。


    Choosing Grid Engine admin user account
    ---------------------------------------
    
    You may install Grid Engine that all files are created with the user id of an
    unprivileged user.
    
    This will make it possible to install and run Grid Engine in directories
    where user >root< has no permissions to create and write files and directories.
    
       - Grid Engine still has to be started by user >root<
    
       - this directory should be owned by the Grid Engine administrator
    
    Do you want to install Grid Engine
    under an user id other than >root< (y/n) [y] >> y
    

    Choosing a Grid Engine admin user name
    --------------------------------------
    
    Please enter a valid user name >> sgeadmin
    
    Installing Grid Engine as admin user >sgeadmin<
    
    Hit <RETURN> to continue >>
  6. sge-root ディレクトリの設定を確認します。

    次の例では、sge-root の値は /opt/n1ge6 です。


    Checking $SGE_ROOT directory
    ----------------------------
    
    The Grid Engine root directory is:
    
       $SGE_ROOT = /opt/n1ge6
    
    If this directory is not correct (e.g. it may contain an automounter
    prefix) enter the correct path to this directory or hit <RETURN>
    to use default [/opt/n1ge6] >> 
    
    Your $SGE_ROOT directory: /opt/n1ge6
    
    Hit <RETURN> to continue >> 
  7. Grid Engine ソフトウェアに TCP/IP サービスを設定します。

    1. TCP/IP サービスが未設定の場合はその旨通知されます。


      Grid Engine TCP/IP service >sge_qmaster<
      ----------------------------------------
      
      There is no service >sge_qmaster< available in your >/etc/services< file
      or in your NIS/NIS+ database.
      
      You may add this service now to your services database or choose a port number.
      It is recommended to add the service now. If you are using NIS/NIS+ you should
      add the service at your NIS/NIS+ server and not to the local >/etc/services<
      file.
      
      Please add an entry in the form
      
         sge_qmaster <port_number>/tcp
      
      to your services database and make sure to use an unused port number.
      
      Please add the service now or press <RETURN> to go to entering a port number >> 
    2. 新しい端末セッションを開始またはウィンドウを開き、情報ファイル /etc/services または NIS マップを追加します。

    3. 「ネットワークサービス」の説明に従って、/etc/services ファイルまたは NIS サービスマップに適切なポートを追加します。

      次に /etc/services ファイルの編集例を示します。


      ...
      sge_qmaster     6444/tcp
      sge_execd       6445/tcp
      

      注 –

      この例では、/etc/services に、sge_qmastersge_execd の両方のエントリが追加されます。以降の手順では、この両方のエントリが追加されているものとして説明を進めます。


      変更を保存します。

    4. インストールスクリプトの実行ウィンドウに戻ります。


      Please add the service now or press <RETURN> to go to entering a port number >> 

      続いて Return キーを押します。次の内容が出力されます。


      sge_qmaster 6444
      
      Service >sge_qmaster< is now available.
      
      Hit <RETURN> to continue >> 

      Grid Engine TCP/IP service >sge_execd<
      --------------------------------------
      
      Using the service
      
         sge_execd
      
      for communication with Grid Engine.
      
      Hit <RETURN> to continue >> 
  8. セル名を入力します。

    Grid Engine システムセルの使用方法については、「セル」を参照してください。


    Grid Engine cells
    -----------------
    
    Grid Engine supports multiple cells.
    
    If you are not planning to run multiple Grid Engine clusters or if you don't
    know yet what is a Grid Engine cell it is safe to keep the default cell name
    
       default
    
    If you want to install multiple cells you can enter a cell name now.
    
    The environment variable
    
       $SGE_CELL=<your_cell_name>
    
    will be set for all further Grid Engine commands.
    
    Enter cell name [default] >> 
    • セルを使用する場合は、ここでセル名を入力します。

    • セルを使用しない場合は、Return キーを押して続行します。


      Using cell >default<. 
      Hit <RETURN> to continue >> 

    Return キーを押して続行します。

  9. スプールディレクトリを指定します。

    スプールディレクトリのディスク容量の要件については、「必要なディスク容量」を参照してください。スプールディレクトリの場所については、「ルートディレクトリの下のスプールディレクトリ」を参照してください。


    Grid Engine qmaster spool directory
    -----------------------------------
    
    The qmaster spool directory is the place where the qmaster daemon stores
    the configuration and the state of the queuing system.
    
    The admin user >sgeadmin< must have read/write access
    to the qmaster spool directory.
    
    If you will install shadow master hosts or if you want to be able to start
    the qmaster daemon on other hosts (see the corresponding sectionin the
    Grid Engine Installation and Administration Manual for details) the account
    on the shadow master hosts also needs read/write access to this directory.
    
    The following directory
    
    [/opt/n1ge6/default/spool/qmaster]
    
    will be used as qmaster spool directory by default!
    
    Do you want to select another qmaster spool directory (y/n) [n] >> 
    • デフォルトのスプールディレクトリを使用する場合は、Return キーを押して続行します。

    • その他のディレクトリをスプールディレクトリとして使用する場合、y を入力します。

      次の例では、マスターホストスプールディレクトリとして /my/spool ディレクトリを指定します。


      Do you want to select another qmaster spool directory (y/n) [n] >> y
      
      Please enter a qmaster spool directory now! >>/my/spool
      
  10. Windows ベースの実行ホストについて設定します。

    Windows サポートを使用する予定がない場合は、No と入力します。Windows サポートが必要な場合は、Yes と入力します。

    yes と答えると、このあとのインストールプロセスで、いくつかの Windows 固有の事項について質問されます。このような質問事項には、「WINDOWS のみ」と記載してあります。


    Windows Execution Host Support
    ------------------------------
                                                                                    
    Are you going to install Windows Execution Hosts? (y/n) [n]
  11. 適切なファイルアクセス権を確認または設定します。

    pkgadd を使用している場合、またはファイルアクセス権が正しいことがわかっている場合は、Yes と入力します。No と入力すると、次の手順に示す、アクセス権を設定するスクリプトが表示されます。


    Verifying and setting file permissions
    --------------------------------------
    
    Did you install this version with >pkgadd< or did you already
    verify and set the file permissions of your distribution (y/n) [y] >> y
    
  12. 適切なファイルアクセス権を設定します。

    • WINDOWS のみ – 前の手順で Windows 実行ホストのサポートが必要であると指定した場合は、スクリプトを使用してファイルアクセス権を設定する必要があります。次の質問に No と答えます。


      Verifying and setting file permissions
      --------------------------------------
      
      Did you install this version with >pkgadd< or did you already
      verify and set the file permissions of your distribution (y/n) [y] >> 
      
      In some cases, eg: the binaries are stored on a NTFS or on any other 
      filesystem, which provides additional file permissions, the UNIX file 
      permissions can be wrong. In this case we would advise to verify and 
      to set the file permissions (enter: n) (y/n) [n] >>n
      
    • ファイルアクセス権を確認および設定します。


      Verifying and setting file permissions
      --------------------------------------
      
      We may now verify and set the file permissions of your Grid Engine
      distribution.
      
      This may be useful since due to unpacking and copying of your distribution
      your files may be unaccessible to other users.
      
      We will set the permissions of directories and binaries to
      
         755 - that means executable are accessible for the world
      
      and for ordinary files to
      
         644 - that means readable for the world
      
      Do you want to verify and set your file permissions (y/n) [y] >> y
      

      Verifying and setting file permissions and owner in >3rd_party<
      Verifying and setting file permissions and owner in >bin<
      Verifying and setting file permissions and owner in >ckpt<
      Verifying and setting file permissions and owner in >examples<
      Verifying and setting file permissions and owner in >install_execd<
      Verifying and setting file permissions and owner in >install_qmaster<
      Verifying and setting file permissions and owner in >mpi<
      Verifying and setting file permissions and owner in >pvm<
      Verifying and setting file permissions and owner in >qmon<
      Verifying and setting file permissions and owner in >util<
      Verifying and setting file permissions and owner in >utilbin<
      Verifying and setting file permissions and owner in >catman<
      Verifying and setting file permissions and owner in >doc<
      Verifying and setting file permissions and owner in >man<
      Verifying and setting file permissions and owner in >inst_sge<
      Verifying and setting file permissions and owner in >bin<
      Verifying and setting file permissions and owner in >lib<
      Verifying and setting file permissions and owner in >utilbin<
      
      Your file permissions were set
      
      Hit <RETURN> to continue >> 
  13. すべての Grid Engine システムホストが単一の DNS ドメインにあるかどうかを指定します。


    Select default Grid Engine hostname resolving method
    ----------------------------------------------------
    
    Are all hosts of your cluster in one DNS domain? If this is
    the case the hostnames
    
       >hostA< and >hostA.foo.com<
    
    would be treated as eqal, because the DNS domain name >foo.com<
    is ignored when comparing hostnames.
    
    Are all hosts of your cluster in a single DNS domain (y/n) [y] >>   
    • すべての Grid Engine システムホストが単一の DNS ドメインにある場合は、y を入力します。


      Are all hosts of your cluster in a single DNS domain (y/n) [y] >> y 
      
      Ignoring domainname when comparing hostnames.
      
      Hit <RETURN> to continue >> 
    • 一部の Grid Engine システムホストが別の DNS ドメインにある場合、n を入力します。


      Are all hosts of your cluster in a single DNS domain (y/n) [y] >> n 
      
      The domainname is not ignored when comparing hostnames.
      
      Hit <RETURN> to continue >> 

      Default domain for hostnames
      ----------------------------
      
      Sometimes the primary hostname of machines returns the short hostname
      without a domain suffix like >foo.com<.
      
      This can cause problems with getting load values of your execution hosts.
      If you are using DNS or you are using domains in your >/etc/hosts< file or
      your NIS configuration it is usually safe to define a default domain
      because it is only used if your execution hosts return the short hostname
      as their primary name.
      
      If your execution hosts reside in more than one domain, the default domain
      parameter must be set on all execution hosts individually.
      
      Do you want to configure a default domain (y/n) [y] >> 

      Return キーを押して続行します。

      1. デフォルトドメインを指定したい場合、y を入力します。

        次の例では、デフォルトドメインとして sun.com が指定されています。


        Do you want to configure a default domain (y/n) [y] >> y
        
        
        Please enter your default domain >> sun.com
        
        Using >sun.com< as default domain. Hit <RETURN> to continue >>
      2. デフォルトドメインを指定しない場合、n を入力します。

        次の例では、デフォルトドメインとして sun.com が指定されています。


        Do you want to configure a default domain (y/n) [y] >> n
        
  14. Return キーを押して続行します。


    Making directories
    ------------------
    
    creating directory: default/common
    creating directory: /opt/n1ge6/default/spool/qmaster
    creating directory: /opt/n1ge6/default/spool/qmaster/job_scripts
    Hit <RETURN> to continue >> 
  15. 従来のスプール方式を使用するか、Berkeley DB スプール方式を使用するかを指定します。

    必要なスプール機構の種類を判定する方法については、「従来のスプールとデータベーススプール」を参照してください。


    Setup spooling
    --------------
    Your SGE binaries are compiled to link the spooling libraries
    during runtime (dynamically). So you can choose between Berkeley DB 
    spooling and Classic spooling method.
    Please choose a spooling method (berkeleydb|classic) [berkeleydb] >> 
    • Berkeley DB スプール方式を指定するには、Return キーを押して続行します。


      Please choose a spooling method (berkeleydb|classic) [berkeleydb] >> 

      The Berkeley DB spooling method provides two configurations!
      
      1) Local spooling:
      The Berkeley DB spools into a local directory on this host (qmaster host)
      This setup is faster, but you can't setup a shadow master host
      
      2) Berkeley DB Spooling Server:
      If you want to setup a shadow master host, you need to use
      Berkeley DB Spooling Server!
      In this case you have to choose a host with a configured RPC service.
      The qmaster host connects via RPC to the Berkeley DB. This setup is more
      failsafe, but results in a clear potential security hole. RPC communication
      (as used by Berkeley DB) can be easily compromised. Please only use this
      alternative if your site is secure or if you are not concerned about
      security. Check the installation guide for further advice on how to achieve
      failsafety without compromising security.
      
      Do you want to use a Berkeley DB Spooling Server? (y/n) [n] >> 
      • Berkeley DB スプールサーバーを使用するには、y を入力します。


        Do you want to use a Berkeley DB Spooling Server? (y/n) [n] >> y
        
        Berkeley DB Setup
        
        -----------------
        Please, log in to your Berkeley DB spooling host and execute "inst_sge -db"
        Please do not continue, before the Berkeley DB installation with
        "inst_sge -db" is completed, continue with <RETURN>
        

        注 –

        Berkeley DB がスプールサーバーに完全にインストールされるまで、Return キーを押さないでください


        1. 新しい端末セッションを開始またはウィンドウを開きます。

        2. スプールサーバーにログインします。

        3. 「Berkeley DB スプールサーバーをインストールする方法」の説明に従ってソフトウェアをインストールします。

        4. ソフトウェアがスプールサーバーにインストールされたら、マスターインストールウィンドウに戻り、Return キーを押して続行します。

        5. スプールサーバー名を入力します。

          次の例の vector は、スプールサーバーのホスト名です。


          Berkeley Database spooling parameters
          -------------------------------------
          
          Please enter the name of your Berkeley DB Spooling Server! >> vector
          
        6. スプールディレクトリの名前を入力します。

          次の例では、/opt/n1ge6/default/spooldb になっています。


          Please enter the Database Directory now!
          
          Default: [/opt/n1ge6/default/spooldb] >> 
          Dumping bootstrapping information
          Initializing spooling database
          
          Hit <RETURN> to continue >> 
      • Berkeley DB スプールサーバーを使用しない場合、n を入力します。


        Do you want to use a Berkeley DB Spooling Server? (y/n) [n] >> n
        
        
        Hit <RETURN> to continue >> 

        Berkeley Database spooling parameters
        -------------------------------------
        
        Please enter the Database Directory now, even if you want to spool locally
        it is necessary to enter this Database Directory. 
        
        Default: [/opt/n1ge6/default/spool/spooldb] >> 

        その他のディレクトリを指定するか、Return キーを押して続行します。


        creating directory: /opt/n1ge6/default/spool/spooldb
        Dumping bootstrapping information
        Initializing spooling database
        
        Hit <RETURN> to continue >> 
    • 従来のスプール方式を指定する場合は、classic と入力します。


      Please choose a spooling method (berkeleydb|classic) [berkeleydb] >> classic
      

      Dumping bootstrapping information
      Initializing spooling database
      
      Hit <RETURN> to continue >> 
  16. グループ ID 範囲を入力します。

    詳細は、「グループ ID」を参照してください。


    Grid Engine group id range
    --------------------------
    
    When jobs are started under the control of Grid Engine an additional group id
    is set on platforms which do not support jobs. This is done to provide maximum
    control for Grid Engine jobs.
    
    This additional UNIX group id range must be unused group id's in your system.
    Each job will be assigned a unique id during the time it is running.
    Therefore you need to provide a range of id's which will be assigned
    dynamically for jobs.
    
    The range must be big enough to provide enough numbers for the maximum number
    of Grid Engine jobs running at a single moment on a single host. E.g. a range
    like >20000-20100< means, that Grid Engine will use the group ids from
    20000-20100 and provides a range for 100 Grid Engine jobs at the same time
    on a single host.
    
    You can change at any time the group id range in your cluster configuration.
    
    Please enter a range >> 20000-20100
    
    Using >20000-20100< as gid range. Hit <RETURN> to continue >> 
  17. 実行デーモンのスプールディレクトリを確認します。

    スプールの詳細は、「ルートディレクトリの下のスプールディレクトリ」を参照してください。


    Grid Engine cluster configuration
    ---------------------------------
    
    Please give the basic configuration parameters of your Grid Engine
    installation:
    
       <execd_spool_dir>
    
    The pathname of the spool directory of the execution hosts. User >sgeadmin<
    must have the right to create this directory and to write into it.
    
    Default: [/opt/n1ge6/default/spool] >>  
  18. 問題の報告を受信するユーザーの電子メールアドレスを入力します。

    この例では、me@my.domain と入力します。


    Grid Engine cluster configuration (continued)
    ---------------------------------------------
    
    <administator_mail>
    
    The email address of the administrator to whom problem reports are sent.
    
    It's is recommended to configure this parameter. You may use >none<
    if you do not wish to receive administrator mail.
    
    Please enter an email address in the form >user@foo.com<.
    
    Default: [none] >> me@my.domain
    
  19. 構成パラメータを確認します。


    The following parameters for the cluster configuration were configured:
    
       execd_spool_dir        /opt/n1ge6/default/spool
       administrator_mail     me@my.domain
    
    Do you want to change the configuration parameters (y/n) [n] >> n
    
    Creating local configuration
    ----------------------------
    Creating >act_qmaster< file
    Adding default complex attributes
    Reading in complex attributes.
    Adding default parallel environments (PE)
    Reading in parallel environments:
            PE "make".
    Adding SGE default usersets
    Reading in usersets:
            Userset "deadlineusers".
            Userset "defaultdepartment".
    Adding >sge_aliases< path aliases file
    Adding >qtask< qtcsh sample default request file
    Adding >sge_request< default submit options file
    Creating >sgemaster< script
    Creating >sgeexecd< script
    Creating settings files for >.profile/.cshrc<
    
    Hit <RETURN> to continue >> 
  20. WINDOWS のみ – Windows サポートが必要であると指定した場合は、Certificate Security Protocol (CSP) 証明書の作成を求められます。

    CSP の証明書についての詳細を 「CSP のセキュリティー保護されたシステムをインストールする方法」で確認してから、続行してください。

  21. システムの起動時にデーモンを起動するかどうかを指定します。


    qmaster/scheduler startup script
    --------------------------------
    
    We can install the startup script that will
    start qmaster/scheduler at machine boot (y/n) [y] >> y
    
    Installing startup script /etc/rc2.d/S95sgemaster
    
    Hit <RETURN> to continue >> 
    ...
  22. WINDOWS のみ – SGE マネージャーリストに Windows の管理者名を追加します。


    Windows Administrator Name
    --------------------------
                                                                                    
    For a later execution host installation it is recommended to add the
    Windows Administrator name to the SGE manager list
                                                                                    
    
    Please, enter the Windows Administrator name [Default: Administrator] >>
  23. あとで実行ホストとしてインストールするホストを指定します。


    Adding Grid Engine hosts
    ------------------------
    
    Please now add the list of hosts, where you will later install your execution
    daemons. These hosts will be also added as valid submit hosts.
    
    Please enter a blank separated list of your execution hosts. You may
    press <RETURN> if the line is getting too long. Once you are finished
    simply press <RETURN> without entering a name.
    
    You also may prepare a file with the hostnames of the machines where you plan
    to install Grid Engine. This may be convenient if you are installing Grid
    Engine on many hosts.
    
    Do you want to use a file which contains the list of hosts (y/n) [n] >> n
    
    Adding admin and submit hosts
    -----------------------------
    
    Please enter a blank seperated list of hosts.
    
    Stop by entering <RETURN>. You may repeat this step until you are
    entering an empty list. You will see messages from Grid Engine
    when the hosts are added.
    
    Host(s): host1 host2 host3 host4
    
    host1 added to administrative host list
    host1 added to submit host list
    host2 added to administrative host list
    host2 added to submit host list
    host3 added to administrative host list
    host3 added to submit host list
    host4 added to administrative host list
    host4 added to submit host list
    Hit <RETURN> to continue >> 
    
    Creating the default <all.q> queue and <allhosts> hostgroup
    -----------------------------------------------------------
    
    root@vector added "@allhosts" to host group list
    root@vector added "all.q" to cluster queue list
    
    Hit <RETURN> to continue >> 
  24. スケジューラプロファイルを選択します。

    適切なプロファイルの選択方法については、「スケジューラプロファイル」を参照してください。


    Scheduler Tuning
    ----------------
    
    The details on the different options are described in the manual. 
    
    Configurations
    --------------
    1) Normal
              Fixed interval scheduling, report scheduling information,
              actual + assumed load
    
    2) High
              Fixed interval scheduling, report limited scheduling information,
              actual load
    
    3) Max
              Scheduling on demand, report no scheduling information,
              actual load
    
    Enter the number of your prefered configuration and hit <RETURN>! 
    Default configuration is [1] >> 

    この質問に回答したら、インストールは完了です。スクリプトの終了前にいくつかの情報画面が表示されます。これらの画面に表示されるコマンドは、この章にも記載されています。

  25. WINDOWS のみ – CSP モードを使用している場合は、証明書ファイルを各実行ホストにコピーしてください。

    この機能は、スクリプトを使用して実行できます。


    ヒント –

    パスワードの確認なしにこの機能を使用するには、root ユーザーが rsh または ssh を使用して実行ホストにアクセスする必要があります。



    Should the script try to copy the cert files, for you, to each
    execution host? (y/n) [y] >>
  26. Grid Engine ソフトウェアで使用する環境変数を作成します。


    注 –

    インストール時にセル名が指定されていない場合、cell の値は default になります。


    • C シェルを使用している場合、次のコマンドを入力します。


      % source sge-root/cell/common/settings.csh
      
    • Bourne シェルまたは Korn シェルを使用している場合、次のコマンドを入力します。


      $ . sge-root/cell/common/settings.sh
      
参照

実行ホストが正しく設定されているかどうかを確認する方法については、「マスターホスト上でデーモンが実行中であることを確認する方法」を参照してください。