• Error message: No balance available for the User

    Q:Error message "qsub: No balance available for the User" was encountered
           [username@clogin4 job1]$ qsub job_script.sh
           qsub: No balance available for the User

    A:出現這訊息的幾個可能原因:
          1.使用了錯誤的計畫代碼
          2.計畫代碼的可用額度不足
          3.沒有計畫

    1. 使用了錯誤的計畫代碼:
        這表示PBS job script中的計畫代碼欄位有錯誤。換句話說,#PBS -P 這一行的設定有錯誤。 
        為了能夠順利送出計算工作,#PBS -P 這一行的參數,您需要設定有效的計畫代碼,例如 #PBS -P MSTxxxxxx。
        其他資訊:
        ※ 請參考台灣杉一號使用說明 5.3 Job submission,這章節的內容,可了解如何查詢正確的計畫代碼(計畫名稱) .
        ※ 關於如何撰寫與正確設定PBS job script,請參考台灣杉一號使用說明 5. PBS Pro job operation,這章節的內容,
           請特別注意紅字的部分。
     
    2.計畫代碼的可用額度不足:
       請登入到iService網站去進行購買額外額度。
       (假如您是該計畫成員,請通知您的計畫主持人或指導教授提出申請)。

    3.沒有計畫:
        請登入到iService網站去檢查您的計畫是否已經過期,如果過期請再重新提出申請。
       (假如您是該計畫成員,請通知您的計畫主持人或指導教授提出申請)。


    Q:Error message "qsub: No balance available for the User" was encountered
           [username@clogin4 job1]$ qsub job_script.sh
           qsub: No balance available for the User

    A:Potential reason for the error:
          1.A wrong project code was selected
          2.Insufficient balance under the project code
          3.No project available

    1. A wrong project code was selected:
        This indicates an error in the settings of the project under PBS. In other words,  #PBS -P  was set to a wrong value. 
        In the Job Script shell for "submit”, change the value for #PBS -P  to an available project, such as  #PBS -P MSTxxxxxx.
        Additional information
        ※ Please refer to the Taiwania HPC System User Operation Manual, section  5.3 Job submission, which contains a detailed description of how to perform an inquiry for Project ID (project name) .
        ※ Regarding the settings for PBS, please refer to the Taiwania HPC System User Operation Manual, section  5. PBS Pro job operation,  which contains a detailed description of the settings for Job Script .
           Please pay attention to the explanations in red .
        
    2.Insufficient balance under the project code:
       Please log on to the iService site to purchase additional credit. (If you are already a member, please inform your project leader or administrator to submit an application.)

    3.No project available :
       Please log on to the iService site to check whether your project has expired. If so, please resubmit an application. (If you are already a member, please inform your project leader or administrator to submit an application.)

  • qsub job_script.sh時出現bad interpreter: No such file or directory 錯誤訊息

    Q:
    [username@clogin4 job1]$ qsub job_script.sh
    時出現

    -bash: /var/spool/pbs/mom_priv/jobs/50622.srvc1.SC: /bin/bash^M: bad interpreter: No such file or directory


    A: 請修正
    job script檔案格式
    [username@clogin4 job1]$ 
    dos2unix job_script.sh

     

  • Job送出後一直在排隊,沒進入執行

    Q: Job送出後一直在排隊

       

    A: 當發現Job送出之後,等待超過7天以上都沒有進入執行,
    此時請先檢查您所撰寫的job script內容是否有錯誤。
    案例一: 
    #PBS -l select=1:ncpus=80

    這一個參數
    ncpus不可超過每個計算節點的資源上限,
    請注意ncpus數值要小於等於40

    案例二:
    $ qstat -f job_id  查詢 comment 欄位可以得知目前等待的原因

        comment = Can Never Run: Insufficient amount of resource: ngpus (R: 2 A: 0
            T: 0)

    因為本系統沒有提供GPU所以job script內使用這一個ngpus參數是錯誤的


    注意:
    包機環境送出job之後,若仍有job出現長時間排隊的情形,請通知系統管理員檢查包機的計算節點之中是否有硬體異常問題

  • 由於台灣杉一號主機帳號目前採用動態密碼,所以是不是就無法使用FileZilla Client,來達成上傳與下載資料的功能,還是有哪些地方需要調整?

    FileZilla Client程式的站台管理員中->傳輸設定->限制同時連線數1,就可以解決再問密碼的問題。

  • 怎麼利用Intel MPI編譯與執行平行程式? 是否有簡單的使用範例可參考

    請參考Youtube影片教學

  • 登入系統時出現Access denied錯誤訊息
    請先確認主機帳號是否錯誤;若非主機帳號錯誤,則為主機帳號之密碼或OPT碼錯誤造成。
    請依照您取得OTP碼的方式,先確認您的PC或手機有做系統時間的校時動作(時區:GMT+8標準時間),以免因為時間偏差,造成OTP認證碼取得錯誤,而無法登入主機。
    若系統時間無誤,請先嘗試變更主機帳號之密碼後,再次登入主機,如仍是出現 Access denied 訊息,則請提供相關資訊給客服人員進行處理。
  • 針對大檔案的傳輸或是重新執行斷線後的續傳
    請您先參考這一份文件:利用公鑰進行檔案傳輸使用說明
    先建立好SSH公鑰認證,即可以免輸入密碼登入到xdata1或xdata2節點。

    以下是將大檔案(>20GB)上傳到台灣杉一號的rsync指令使用範例:
    過程會顯示傳輸進度:
    [username@linux ~]# rsync -avP -e "ssh" ./20GB_file.dat username@140.110.148.21:~/twnia1_bigfile_dir/
    sending incremental file list
    20GB_file.dat
      9038233600  42%  108.97MB/s    0:01:51

    當傳輸結束會顯示速率:
    [username@linux ~]# rsync -avP -e "ssh" ./20GB_file.dat username@140.110.148.21:~/twnia1_bigfile_dir/
    sending incremental file list
    20GB_file.dat
     21474836480 100%  106.78MB/s    0:03:11 (xfer#1, to-check=0/1)

    sent 21477457999 bytes  received 31 bytes  111571210.55 bytes/sec
    total size is 21474836480  speedup is 1.00

    傳輸過程萬一發生網路不預期斷線,或是大檔案有異動需要再重新上傳,
    再次透過rsync指令,您就可以節省很多時間。
    [username@linux ~]# rsync -avP -e "ssh" ./20GB_file.dat username@140.110.148.21:~/twnia1_bigfile_dir/
    sending incremental file list

    sent 40 bytes  received 12 bytes  104.00 bytes/sec
    total size is 21474836480  speedup is 412977624.62

  • 台灣杉一號(Taiwania 1)系統的user priority設定
    台灣杉一號(Taiwania 1)系統使用的PBS Professional (workload manager and job scheduler)排程系統管理軟體,啟用FairShare公平排程機制,每一位用戶並沒有特別的priority。
    基本queue name的計算節點分配,可參考主機的使用說明內容中 5.1 job queue表格。
  • 台灣杉一號(Taiwania 1)系統有Intel、PGI等編譯器Environment

    1.Load Intel compiler environment 
       [user@clogin1]$ module load intel/2018_u1 
       # Choose a module to match the version to use. 
       Export license file 
       [user@clogin1]$ export INTEL_LICENSE_FILE=28518@sufi.nchc.org.tw

    2.Load PGI compiler environment 
       [user@clogin1]$ module load pgi/17.10  
       Export license file 
       [user@clogin1]$ export LM_LICENSE_FILE=27500@sufi.nchc.org.tw

      
    詳細Compile/link to program請參考台灣杉一號(Taiwania 1)系統操作手冊之4. Compile and Link章節內容。

  • 台灣杉一號(Taiwania 1)系統的Batch Job Status Check指令
    Display the list of all available Queues
            $ qstat –Q
    $ qstat -Qf queue_name
           Trace job id and monitor your job.
    $ qstat
            $ qstat -u your_account
            $ qstat -f
    Terminate your job.
            $ qdel job_id
  • 台灣杉一號(Taiwania 1)系統 simPlatform 服務說明
    simPlatform雲端應用平台功能
    初期先開放simHouse工作環境,讓使用者能輕易地上手使用大主機計算環境來執行工作,包含檔案總管(File Manager)、我的工作(My Jobs)、主機佇列(System Queues)、文字編輯(Text Editor)、計畫錢包(Project Wallet)等基本功能:

    File Manager:
    提供檔案複製、剪下、貼上、刪除等基本操作,支援上下載、壓縮、編輯、派送工作等作業,也可直接檢視一般圖檔與文件。
    My Jobs:
    檢視派送工作ID、狀態、運行時間等工作相關資訊。
    System Queues:
    大主機Queue的使用狀態資料。
    Text Editor:
    基本文件編輯功能。
    Project Wallet:
    查詢計畫錢包用量資訊。

    請參考simPlatform網頁詳細說明
  • 如何使用setacl指令自行設定需要分享目錄或檔案
    setacl設定分享資料之命令格式說明:
    $setfacl -m u:AccountName:rx file
    $setfacl -m g:GroupName:rx file
    $setfacl -R -m u:AccountName:rx directory
    $setfacl -R -m g:GroupName:rx directory

    setacl刪除分享資料之命令格式說明:
    $setfacl -x u:AccountName file
    $setfacl -x g:GroupName file
    $setfacl -R -x u:AccountName directory
    $setfacl -R -x g:GroupName directory

    其中 AccountName 是帳號名稱、GroupName是群組名稱

    若要查看是否設定成功,您可使用getfacl來查看,如:
    $getfacl /directory

    詳細說明請登入系統後執行命令$man setfacl 查詢
  • 檢查儲存空間quota的大小?
    請用以下指令查詢磁碟空間已使用的容量與限制:
    $lfs quota -hu username /home
    $lfs quota -hu username /project
    $lfs quota -hu username /work1
  • qsub: unauthorized request 的錯誤訊息
    [username@clogin1]$ qsub job_script.sh
    出現訊息「qsub: Unauthorized Request」是因為特殊專用queue有限制使用帳號或計畫代碼。
    若您確認所屬「計畫代碼」可以使用該專用queue,請在job script加入以下設定:
    #PBS -P MST107XXX
    #PBS -W group_list=MST107XXX