Description des queues pbs
Les queues PBS/Torque sur la grappe Mingan
Sur la grappe de calcul mingan, il y a deux queues d'exécution disponibles soit la queue générale ou queue par défaut et la queue debug servant au débogage et à la mise au point de vos programmes.
Queue debug
Cette queue est composée d'un seul nœud de calcul et sert à déboguer ou à faire la mise au point de vos programmes avant de les soumettre à la queue d'exécution générale. Le temps maximal d'exécution est de une (1) heure. On peut utiliser cette queue en mode interactif ou en y soumettant un script.
En mode interactif:
qsub -I -X -q debug [-l nodes=1:ppn=<nombre_de cpu>] [-l walltime=<temps_max_requis]
Votre session sera automatiquement fermée au bout d'une heure. Par exemple, pour démarrer une session interactive de 15 minutes demandant 30 processeurs:
qsub -q debug -X -l nodes=1:ppn=30 -l walltime=00:15:00
On peut aussi soumettre des tâches en utilisant un script:
#!/bin/bash #PBS -q debug #PBS -l walltime=00:20::00 # 20 minutes #PBS -l nodes=1:ppn=15 # 15 processeurs #PBS -n mon_debogue # nom de ma tâche ...
Queue générale
Lorsqu'on utilise la queue d'exécution générale sur mingan, il est inutile de spécifier quelle queue d'exécution utiliser. Toutes les tâches sont automatiquement acheminées vers une queue de gestion qui distribue les tâches en fonction du temps walltime demandé. Plus la valeur de walltime est petite, plus la tâche est prioritaire. La répartition se fait de la façon suivante:
- walltime <= 3 heures
- queue superexpress
- priorité 100
- 3 heures < walltime <= 6 heures
- queue express
- priorité 80
- 6 heures < walltime <= 24 heures
- queue court
- priorité 50
- nombre de tâches maximal 50
- 24 heures < walltime <= 120 heures
- queue medium
- priorité 30
- nombre de tâches maximal 500
- nombre de tâches maximal par utilisateur 60
- 120 heures < walltime <= 240 heures
- queue long
- priorité 10
- nombre de tâches maximal 10
La configuration actuelle des queues d'exécution ne permet pas de rouler une tâche au delà de 240 heures. Il faut donc que l'utilisateur utilise une procédure de redémarrage à chaud (hot start) pour une tâche demandant plus de 240 heures.
Si l'utilisateur ne précise pas de walltime, sa tâche ira dans la queue superexpress et se terminera après 3 heures d'exécution.
Paramètres communs à toutes les queues
Si on ne précise pas les ressources requises lors de la soumission d'une tâche, les critères suivants seront appliqués:
- Mémoire maximale : 10gb
- Nombre de processeurs : 1
- Temps maximal : le temps maximal attribué à la queue utilisée
Exemples de scripts PBS de soumission de tâche
Une tâche nécessitant 30 gb de mémoire, 10 CPUs et 12 heures de temps horloge. La tâche sera placée dans la queue court
#!/bin/bash #PBS -l nodes=1:ppn=10 #PBS -l mem=30gb #PBS -l walltime=12:00:00 ...
Une tâche nécessitant 40 gb de mémoire, 40 CPUs par nœud, sur deux nœuds (80) et 122 heures de temps horloge. La tâche sera placée dans la queue long
#!/bin/bash #PBS -l nodes=2:ppn=40 #PBS -l mem=40gb #PBS -l walltime=122:00:00 ...