Description des queues pbs

De POLR
Sauter à la navigation Sauter à la recherche

Les queues PBS/Torque sur la grappe Mingan

Sur la grappe de calcul mingan, il y a deux queues d'exécution disponibles soit la queue générale ou queue par défaut et la queue debug servant au débogage et à la mise au point de vos programmes.

Queue debug

Cette queue est composée d'un seul nœud de calcul et sert à déboguer ou à faire la mise au point de vos programmes avant de les soumettre à la queue d'exécution générale. Le temps maximal d'exécution est de une (1) heure. On peut utiliser cette queue en mode interactif ou en y soumettant un script.

En mode interactif:

 qsub -I -X -q debug [-l nodes=1:ppn=<nombre_de cpu>] [-l walltime=<temps_max_requis]

Votre session sera automatiquement fermée au bout d'une heure. Par exemple, pour démarrer une session interactive de 15 minutes demandant 30 processeurs:

 qsub -q debug -X -l nodes=1:ppn=30 -l walltime=00:15:00


On peut aussi soumettre des tâches en utilisant un script:

#!/bin/bash
#PBS -q debug
#PBS -l walltime=00:20::00  # 20 minutes
#PBS -l nodes=1:ppn=15      # 15 processeurs
#PBS -n mon_debogue         # nom de ma tâche

...



Queue générale

Lorsqu'on utilise la queue d'exécution générale sur mingan, il est inutile de spécifier quelle queue d'exécution utiliser. Toutes les tâches sont automatiquement acheminées vers une queue de gestion qui distribue les tâches en fonction du temps walltime demandé. Plus la valeur de walltime est petite, plus la tâche est prioritaire. La répartition se fait de la façon suivante:

walltime <= 3 heures
queue superexpress
priorité 100
3 heures < walltime <= 6 heures
queue express
priorité 80
6 heures < walltime <= 24 heures
queue court
priorité 50
nombre de tâches maximal 50
24 heures < walltime <= 120 heures
queue medium
priorité 30
nombre de tâches maximal 500
nombre de tâches maximal par utilisateur 60
120 heures < walltime <= 240 heures
queue long
priorité 10
nombre de tâches maximal 10

La configuration actuelle des queues d'exécution ne permet pas de rouler une tâche au delà de 240 heures. Il faut donc que l'utilisateur utilise une procédure de redémarrage à chaud (hot start) pour une tâche demandant plus de 240 heures.

Si l'utilisateur ne précise pas de walltime, sa tâche ira dans la queue superexpress et se terminera après 3 heures d'exécution.

Paramètres communs à toutes les queues

Si on ne précise pas les ressources requises lors de la soumission d'une tâche, les critères suivants seront appliqués:

  • Mémoire maximale : 10gb
  • Nombre de processeurs : 1
  • Temps maximal : le temps maximal attribué à la queue utilisée

Exemples de scripts PBS de soumission de tâche

Une tâche nécessitant 30 gb de mémoire, 10 CPUs et 12 heures de temps horloge. La tâche sera placée dans la queue court

#!/bin/bash
#PBS -l nodes=1:ppn=10
#PBS -l mem=30gb
#PBS -l walltime=12:00:00
 
...

Une tâche nécessitant 40 gb de mémoire, 40 CPUs par nœud, sur deux nœuds (80) et 122 heures de temps horloge. La tâche sera placée dans la queue long

#!/bin/bash
#PBS -l nodes=2:ppn=40
#PBS -l mem=40gb
#PBS -l walltime=122:00:00
 
...