strutture:pi:computing_center:theocluster:job:particular_submission_option
Differences
This shows you the differences between two versions of the page.
| Next revision | Previous revision | ||
| strutture:pi:computing_center:theocluster:job:particular_submission_option [2014/10/16 07:38] – created carusog@infn.it | strutture:pi:computing_center:theocluster:job:particular_submission_option [2014/10/16 08:04] (current) – carusog@infn.it | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| + | ==== ALTRI PARAMETRI DI SOTTOMISSIONE UTILI: ==== | ||
| + | |||
| + | |||
| + | //**opzion rerun:**// | ||
| + | |||
| + | |||
| + | Il rerun automatico di un job utente, avviene quanto un nodo di calcolo diventa non disponibile durante l' | ||
| + | |||
| + | Le seguenti condizioni causano il rerun di un job: | ||
| + | |||
| + | -Un nodo di calcolo diventa non disponibile durante l' | ||
| + | |||
| + | - Il sistema va in crash mentre un job è in esecuzione | ||
| + | |||
| + | Per utilizzare l' | ||
| + | |||
| + | |||
| + | |||
| + | //**opzione requeue: | ||
| + | |||
| + | |||
| + | Le seguenti condizioni causano il requeue di un job: | ||
| + | |||
| + | -NFS stale handle errors, | ||
| + | |||
| + | -disk full errors, | ||
| + | |||
| + | -process table full errors, | ||
| + | |||
| + | -network connectivity problems, | ||
| + | |||
| + | -external conditions (problemi di licenza software), o un bug software. | ||
| + | |||
| + | Per utilizzare l' | ||
| + | |||
| + | es. | ||
| + | bsub -Q "all ~1 ~2 " myjob | ||
| + | |||
| + | (questa stringa di sottomissione considera tutti gli exit code ad esclusione dell' | ||
| + | |||
| + | |||
| + | === Assistenza === | ||
| + | |||
| + | |||
| + | Per qualsiasi dubbio o informazione potete mandare una mail all'IT Division all' | ||
| + | |||
| + | < | ||
| + | |||
| + | Verrete contattati al più presto dal gruppo. | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | ---- | ||
| + | ---- | ||
| + | ---- | ||
| + | ---- | ||
| + | |||
| + | \\ | ||
| + | < | ||
| + | |||
| + | |||
| + | ==== OTHER USEFUL OPTIONAL SUBMISSION PARAMETERS: ==== | ||
| + | |||
| + | |||
| + | //**rerun options: | ||
| + | |||
| + | |||
| + | Automatic job rerun occurs when the execution host becomes unavailable while ajob is running. It does not occur if the job itself fails. | ||
| + | |||
| + | The following conditions cause LSF to rerun the job: | ||
| + | |||
| + | -The execution host becomes unavailable while a job is running | ||
| + | |||
| + | -The system fails while a job is running | ||
| + | |||
| + | To use this option is necessary adding the option **-r** in the job submission string | ||
| + | |||
| + | |||
| + | |||
| + | //**requeue options: | ||
| + | |||
| + | |||
| + | The following conditions cause LSF to requeue the job: | ||
| + | |||
| + | -NFS stale handle errors, | ||
| + | |||
| + | -disk full errors, | ||
| + | |||
| + | -process table full errors, | ||
| + | |||
| + | -network connectivity problems, | ||
| + | |||
| + | -external conditions such as a software license problems, or an occasional failure due to a bug in your application | ||
| + | |||
| + | To use this option is necessary adding the option **-Q** in the job submission string and the specific exit code that identify the specific problem. | ||
| + | |||
| + | i.e | ||
| + | bsub -Q "all ~1 ~2 " myjob | ||
| + | |||
| + | (this submission string involve all the exit code excluding the exit code 1 and 2) | ||
| + | |||
| + | ---- | ||
| + | |||
| + | === to request help === | ||
| + | |||
| + | For any questions or information users can send an email to the IT Division: | ||
| + | |||
| + | < | ||
| + | |||
| + | You'll be contacted asap by a member' | ||
| + | |||
| + | |||
| + | |||
