Вычисления на гибридном кластере
Технические характеристики
Технические характеристики кластера приведены на этой странице.
Очереди на кластере
Доступные очереди на данном кластере и их ограничения описаны на этой странице
Доступ к кластеру
Для получения доступа к к вычислителю необходимо подать заявку на исследование через систему Научного Парка СПбГУ. Процедура получения доступа к ПО более подродно описана в разделе "Информация для пользователей".
Запуск расчетов
Вначале задайте переменные окружения. Для этого выполните команду:
source /usr/local/examples/HPPBS.env
Данная команда задаст переменную PATH так, чтобы использовался пакет PBS Torque 6.0 (установленный в директорию /mnt/rhel-6/huawei/torque/6.0.0/bin/ ).
Для постановки задачи в очередь выполните команду:
qsub -q <очередь>@pbs-tp-new.hpc.cc.spbu.ru <скрипт>
Параметр <очередь> может принимать четыре значения: gpu3, gpu8, infi или long (укажите ту очередь, доступ к которой имеете).
Если не указать параметр "-q", то задача будет поставлена в очередь по умолчанию - очередь long.
Параметр <скрипт> задает тот скрипт, что будет поставлен в очередь, а затем запущен на кластере (собственно, пользовательская задача).
Так, для запуска тестового примера ~/examples/helloworld.sh на гибридном кластере (очередь gpu3) выполните:
qsub -q gpu3@pbs-tp-new.hpc.cc.spbu.ru ~/examples/helloworld.sh
Для запуска тестового примера ~/examples/helloworld.sh на гибридном кластере (очередь gpu8) выполните:
qsub -q gpu8@pbs-tp-new.hpc.cc.spbu.ru ~/examples/helloworld.sh
По окончании расчетов в директории, из которой выполнялась команда "qsub", появятся два файла с именами <имя_задачи>.o<id_задачи> (стандартный вывод) и <имя_задачи>.e<id_задачи> (ошибки). Для указанных примеров имена файлов будут приблизительно следующими:
helloworld.sh.o5270 helloworld.sh.e5270
В них будут содержаться стандартный вывод программы и ошибки (если есть).
Также для удобства можно указать параметр "-N" - он задает имя задачи:
qsub -N <имя> <скрипт>
Например,
qsub -q gpu8@pbs-tp-new.hpc.cc.spbu.ru -N HELLO ~/examples/helloworld.sh
Если этот параметр был указан, то стандартный вывод и ошибки будут содержать файлы с именами вида (для указанного примера):
HELLO.e5270 HELLO.o5270
Для просмотра состояния задач выполните команду:
qstat @pbs-tp-new -n
Опция "-n" позволит увидеть на каких именно узлах выполняется задача.
Для удаления задачи из очереди выполните команду:
qdel <id_задачи>
Параметр <id_задачи> можно узнать, выполнив команду "qstat" (значение в первом столбце).
Примеры:
qdel 5265.pbs-tp-new.hpc.cc.spbu.ru