• 首頁右上角功能說明
    1. 點擊使用者名稱會彈出資源池開通狀態選單。點擊資源池開通狀態,畫面會顯示該使用者資源池開通狀態。
        資源池需開通後,才可進行個主要功能操作。
    2. 點擊計算資源服務網,將連線至iService平台
    3. 點擊計劃名稱,可在彈出式選單選取該使用者參與之計劃。


  • 1. 儲存服務

    提供多樣最佳化的儲存服務,包括:
    (1) 專案共同的 S3 共同儲存服務,讓專案內的實驗資料及結果可以共享;
    (2) 高速平行儲存服務,是為輔助人工智慧訓練最佳化儲存服務,提高傳送資料到 GPU 內的計算速度。

            1.1  S3 共用儲存服務

                   操作說明:

                   1.點擊儲存服務內之S3共用儲存服務項目。
                   2.點擊任一金鑰,可檢視金鑰內容。
                  3.點擊金鑰左方之方格,可 選取/取消選取 該金鑰。

                   4.若有至少一個金鑰被選取,點選垃圾桶圖示,可刪除選取的金鑰。
                   5.點擊左上方之圖示,可創建金鑰。
                   6.若尚未安裝S3 browser並創建帳號,點擊畫面下方S3 Browser右側圖示

               

                 

                  7. 依Step指示,創建帳號並上傳檔案。

             


               1.2 高速平行儲存服務

                    操作說明:

                     1.點擊儲存服務內之高速平行儲存服務項目。            
                     2.
    畫面顯示FTP連線資訊。
                           
                    3. 以使用者ID與主機密碼連線至FTP以存取檔案。

                           
  • 2. 機器學習服務

    提供 on-demand 的 1, 2, 4, 8 核的 GPU 運算環境。

    2.1 服務列表

          操作說明:

           1.點擊機器學習服務內之服務列表項目。畫面會顯示所有已建立的服務。
          2.
    非自己所建立的服務會以灰色字顯示,無法檢視詳細資訊。
          3.
    點擊自己所建立的服務,在畫面下方會顯示詳細資訊。
          4.
    點擊服務左方之方格,可 選取/取消選取 該服務。
          5.
    點擊名稱左方之方格,可 全選/全不選 自己擁有的所有服務。
          6.
    點擊左上方之圖示,可新增服務。新增服務的操作,請參考新增服務段落。
          7.
    若至少一個服務被選取,點擊垃圾桶圖示,可刪除選取的服務。
          8.
    點擊頁面右上之計劃名稱,可選取其它計劃。服務列表會顯示該計劃的已建立之服務內容。

            


    2.1.1 使用 Jupyter notebook
             操作說明:
             1. 在服務列表選擇一個自己所擁有狀態為Running的服務。畫面下方會顯示該服務之詳細資訊。
             2.
    點擊Jupyter右側的"連線"。切換至Jupyter home視窗。     
             3.
    點擊下拉式選單New/Notebook內之項目(例如Python 2)。
                
           4. 或是點擊下拉式選單New/Terminal,畫面會切換至Terminal視窗。  
               



    2.1.2 使用遠端登入軟體 (使用 PuTTY)
             操作說明:
             1. Key convertion
                 使用PuTTYgen程式,將已下載之金鑰載入並轉換。
              

             
       

              2. PuTTY login w/ setting
                  執行PuTTY,在設定頁面輸入IP address (即使用者欲連線之TWGC服務外部IP)與轉換過之金鑰,進行連線。
                  外部IP與金鑰名稱,可利用服務列表取得。
              

                 


              Example (使用Tensorflow)

              ⊙ nvidia-smi
              ⊙ ipython -c "import tensorflow as tf; print (tf.__version__);"
              ⊙ ipython
                   then run

            a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
            b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
            c = tf.matmul(a, b) # Creates a session with log_device_placement set to True. sess = tf.Session(config=tf.ConfigProto(log_device_placement=True)) # Runs the op. print(sess.run(c))

          and output

            2018-08-22 01:46:23.647677: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1344] Found device 0 with properties: name: Tesla V100-SXM2-16GB major: 7 minor: 0 memoryClockRate(GHz): 1.53 pciBusID: 0000:1a:00.0 totalMemory: 15.78GiB freeMemory: 15.36GiB 2018-08-22 01:46:23.647731: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1423] Adding visible gpu devices: 0
            2018-08-22 01:46:24.048036: I tensorflow/core/common_runtime/gpu/gpu_device.cc:911] Device interconnect StreamExecutor with strength 1 edge matrix:
            2018-08-22 01:46:24.048092: I tensorflow/core/common_runtime/gpu/gpu_device.cc:917]      0
            2018-08-22 01:46:24.048099: I tensorflow/core/common_runtime/gpu/gpu_device.cc:930] 0:   N
            2018-08-22 01:46:24.048368: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1041] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 14870 MB memory) -> physical GPU (device: 0, name: Tesla V100-SXM2-16GB, pci bus id: 0000:1a:00.0, compute capability: 7.0)
            Device mapping: /job:localhost/replica:0/task:0/device:XLA_CPU:0 -> device: XLA_CPU device /job:localhost/replica:0/task:0/device:XLA_GPU:0 -> device: XLA_GPU device /job:localhost/replica:0/task:0/device:GPU:0 -> device: 0, name: Tesla V100-SXM2-16GB, pci bus id: 0000:1a:00.0, compute capability: 7.0 2018-08-22 01:46:24.269118: I tensorflow/core/common_runtime/direct_session.cc:297] Device mapping: /job:localhost/replica:0/task:0/device:XLA_CPU:0 -> device: XLA_CPU device /job:localhost/replica:0/task:0/device:XLA_GPU:0 -> device: XLA_GPU device /job:localhost/replica:0/task:0/device:GPU:0 -> device: 0, name: Tesla V100-SXM2-16GB, pci bus id: 0000:1a:00.0, compute capability: 7.0 MatMul: (MatMul): /job:localhost/replica:0/task:0/device:GPU:0 2018-08-22 01:46:24.270533: I tensorflow/core/common_runtime/placer.cc:884] MatMul: (MatMul)/job:localhost/replica:0/task:0/device:GPU:0 b: (Const): /job:localhost/replica:0/task:0/device:GPU:0 2018-08-22 01:46:24.270560: I tensorflow/core/common_runtime/placer.cc:884] b: (Const)/job:localhost/replica:0/task:0/device:GPU:0 a: (Const): /job:localhost/replica:0/task:0/device:GPU:0 2018-08-22 01:46:24.270574: I tensorflow/core/common_runtime/placer.cc:884] a: (Const)/job:localhost/replica:0/task:0/device:GPU:0
            [[ 22.  28.]
           [ 49.  64.]]
    

    2.2  新增服務
          操作說明:
          1. 點擊機器學習服務內之新增服務項目。系統顯示新增服務畫面。
          2. 在容器名稱欄位,輸入容器名稱。
          3. 在硬體配置欄位,選擇硬體配置。
          4. 在Framework欄位,選擇framework。
          5. 若尚未建立金鑰,點擊新建管理金鑰,在新建管理金鑰欄位輸入金鑰名稱並點選OK鍵。
              
           6.
      在選用白名單欄位,選擇白名單。若已建立金鑰,可選擇現有金鑰或新建。
                金鑰檔案(*.pem)會儲存至本機下載目錄。

           7.
      點擊下一步∣新建
           8.  在總覽頁面確認資料無誤後,點擊建立至計畫
              
              9. 服務建立後,系統會切換至服務列表畫面。

    2.3 使用說明

           連線至iService TWGC 使用說明


    2.4 管理金鑰
          操作說明:
          1. 點擊機器學習服務內之管理金鑰項目。
          2 .畫面會顯示所有金鑰。
          3. 點擊任一金鑰,在畫面下方會顯示該金鑰的詳細資訊。
          4. 點擊金鑰左方之方格,可 選取/取消選取 該金鑰。
          5. 點擊名稱左方之方格,可 全選/全不選 所有金鑰。
          6. 點擊左上方之圖示,可建立金鑰。
          7. 若有至少一個金鑰被選取,點擊垃圾桶圖示,可刪除選取的金鑰。
            
                     
            key 下載及轉換請參考此連結
  • 3. 歷程查詢
    3.1 使用紀錄
           操作說明:
            1. 點擊歷程查詢內之使用紀錄項目。系統會顯示操作紀錄畫面。
            2. 設定狀態(ALL, LOGIN, LOGOUT)、起始日期、結束日期,再點擊
                即會依設定條件顯示操作紀錄。
               


    3.2  訂單紀錄

    此功能連回 iService 平台

  • 4. 白名單

    此部份的功能有點像防火牆,需要 IP (Layer-3) 及 TCP/UDP (Layer-4),其中 IP 來源就是此處的功能(僅只有來源)。
    TCP/UDP (Layer-4) 的部份在 Container 開啟的時候會自動從設定檔 (YAML) 中取得。
    當容器運行後,此部份不能再修改(未來會新增此功能)。

    4.1 白名單管理

          操作說明:
          1. 點擊白名單內之白名單管理項目。系統會顯示已建立之白名單清單。
          2. 點擊任一白名單,在畫面下方會顯示該白名單的詳細資訊。2.
          3.
    點擊白名單左方之方格,可 選取/取消選取 該白名單。
          4.
    點擊左上方之圖示,可建立白名單。
          5.
    若有至少一個白名單被選取,點擊垃圾桶 圖示,可刪除選取的白名單。

             
  • 5. 使用者社群

    點擊使用者社群可連線至NCHC官方討論區


  • 6. 協助資源
    1. 官方 GitHub 1
    2.官方 Slack
    3. 聯絡我們
       
  • 人工智慧建模相關資源

    國網中心資源

    AI Training Scenario

    1 - Image Recognition (Tensorflow)

    2 - OpenNMT (pyTorch)

    3 - Image Segmentation (caffee)

    4 - Multi-Gpu GoogLeNet (Digits)