• No balance available for the User的錯誤訊息

    Q:遇到qsub: No balance available for the User的錯誤訊息

           [username@clogin4 job1]$ qsub job_script.sh
           qsub: No balance available for the User

    A:錯誤可能原因:
          1.計畫代號選錯
          2.計畫代號沒有額度可扣款
          3.沒有可用計畫



    1. 計畫代號選錯:
        這是指PBS設定的Project錯誤,就是 #PBS -P 這一行設錯值。 
       
    首先,請依照get_su_balance查詢到的計畫清單所顯示的Project
       
    submitJob Script shell內容中,將#PBS -P 設定改成可用的Project,如 #PBS -P MSTxxxxxx
      
        其他補充說明

         ※ 請參考主機的使用說明內容的 5.3 Job submission,有詳細提供說明如何查詢Project ID(project name)
       
    ※ 關於PBS設定,請參考主機的使用說明內容的 5. PBS Pro job operation 有詳細說明Job Script 的設定。

            請注意 紅字 的註解
        ※ 台灣杉一號(Taiwania 1 )主機的使用說明(包含Taiwania HPC System User Operation ManualPDF檔案)


    2.計畫代號沒有額度可扣款
       請登入服務網購買額度(若身份是成員,請告知計畫主持人或管理者提出申請)

    3.沒有可用計畫

        請上網確認計畫是否已到期,如到期,請再提出計畫申請(若身份是成員,請告知計畫主持人或管理者提出申請)


  • qsub job_script.sh時出現bad interpreter: No such file or directory 錯誤訊息

    Q:
    [username@clogin4 job1]$ qsub job_script.sh
    時出現

    -bash: /var/spool/pbs/mom_priv/jobs/50622.srvc1.SC: /bin/bash^M: bad interpreter: No such file or directory


    A: 請修正
    job script檔案格式dos2unix job_script.sh

     

  • Job送出後一直在排隊

    Q: Job送出後一直在排隊

         #PBS l select = 1:ncpus=80:ngpus=6


    A: ncpus, ngpus 
    不可超過每個計算節點的資源上限,

        請注意ncpus數值要小於等於40, ngpus數值要小於等於4
  • 由於台灣杉一號主機帳號目前採用動態密碼,所以是不是就無法使用FileZilla Client,來達成上傳與下載資料的功能,還是有哪些地方需要調整?

    FileZilla Client程式的站台管理員中->傳輸設定->限制同時連線數1,就可以解決再問密碼的問題。

  • 怎麼利用Intel MPI編譯與執行平行程式? 是否有簡單的使用範例可參考

    請參考Youtube影片教學

  • 登入系統時出現Access denied錯誤訊息
    請先確認主機帳號是否錯誤;若非主機帳號錯誤,則為主機帳號之密碼或OPT碼錯誤造成。
    請依照您取得OTP碼的方式,先確認您的PC或手機有做系統時間的校時動作(時區:GMT+8標準時間),以免因為時間偏差,造成OTP認證碼取得錯誤,而無法登入主機。
    若系統時間無誤,請先嘗試變更主機帳號之密碼後,再次登入主機,如仍是出現 Access denied 訊息,則請提供相關資訊給客服人員進行處理。
  • 登入系統時出現unexpectedly closed the network的錯誤訊息
    請您先更新所使用的SSH/Telnet Client軟體(如PuTTY)到最新的版本後,再嘗試登入系統。
  • 台灣杉一號(Taiwania 1)系統的queue priority設定
    台灣杉一號(Taiwania 1)系統使用的PBS Professional (workload manager and job scheduler)排程系統管理軟體,啟用FairShare公平排程機制,並沒有特別的priority。
    基本queue name的計算節點分配,可參考主機的使用說明內容中 5.1 job queue表格。
  • 台灣杉一號(Taiwania 1)系統有Intel、PGI、CUDA等編譯器Environment

    1.Load Intel compiler environment 
       [user@clogin1]$ module load intel/2018_u1 
       # Choose a module to match the version to use. 
       Export license file 
       [user@clogin1]$ export INTEL_LICENSE_FILE=28518@sufi.nchc.org.tw

    2.Load PGI compiler environment 
       [user@clogin1]$ module load pgi/17.10  
       Export license file 
       [user@clogin1]$ export LM_LICENSE_FILE=27500@sufi.nchc.org.tw

    3.Load CUDA compiler environment 
       [user@glogin1]$ module purg   
       [user@clogin1]$ module load cuda/8.0.61
       # Please choose a module to match the version to use.
      
    詳細Compile/link to program請參考台灣杉一號(Taiwania 1)系統操作手冊之4. Compile and Link章節內容。

  • 台灣杉一號(Taiwania 1)系統的Batch Job Status Check指令
    Display the list of all available Queues
            $ qstat –Q
    $ qstat -Qf queue_name
           Trace job id and monitor your job.
    $ qstat
            $ qstat -u your_account
            $ qstat -f
    Terminate your job.
            $ qdel job_id
  • 台灣杉一號(Taiwania 1)系統 simPlatform 服務說明
    simPlatform雲端應用平台功能
    初期先開放simHouse工作環境,讓使用者能輕易地上手使用大主機計算環境來執行工作,包含檔案總管(File Manager)、我的工作(My Jobs)、主機佇列(System Queues)、文字編輯(Text Editor)、計畫錢包(Project Wallet)等基本功能:

    File Manager:
    提供檔案複製、剪下、貼上、刪除等基本操作,支援上下載、壓縮、編輯、派送工作等作業,也可直接檢視一般圖檔與文件。
    My Jobs:
    檢視派送工作ID、狀態、運行時間等工作相關資訊。
    System Queues:
    大主機Queue的使用狀態資料。
    Text Editor:
    基本文件編輯功能。
    Project Wallet:
    查詢計畫錢包用量資訊。

    請參考simPlatform網頁詳細說明
  • 如何使用setacl指令自行設定需要分享目錄或檔案
    Setacl設定分享資料之命令格式說明:
    setfacl -m u:AccountName:rx file
    setfacl -m g:GroupName:rx file
    $setfacl -R -m u:AccountName:rx directory
    $setfacl -R -m g:GroupName:rx directory

    Setacl刪除分享資料之命令格式說明:
    $setfacl -x u:AccountName file
    $setfacl -x g:GroupName file
    $setfacl -R -x u:AccountName directory
    $setfacl -R -x g:GroupName directory

    其中 AccountName 是帳號名稱、GroupName是群組名稱

    若要查看是否設定成功,您可使用getfacl來查看,如:
    $getfacl /directory

    詳細說明請登入系統後執行命令$man setfacl 查詢
  • 檢查儲存空間quota的大小?
    請用以下指令查詢磁碟空間已使用的容量與限制:
    $lfs quota -hu username /home
    $lfs quota -hu username /project
    $lfs quota -hu username /work1
  • qsub: unauthorized request 的錯誤訊息
    [username@clogin1]$ qsub job_script.sh
    出現訊息「qsub: Unauthorized Request」是因為特殊專用queue有限制使用帳號或計畫代碼。
    若您確認所屬「計畫代碼」可以使用該專用queue,請在job script加入以下設定:
    #PBS -P MST107XXX
    #PBS -W group_list=MST107XXX