Модернизация кластера Huawei
Уважаемые пользователи РЦ «Вычислительный центр» СПбГУ!
С целью проведения модернизации кластера Huawei с 29.04.2019 планируется поочередный вывод узлов из системы очередей для обновления их конфигурации.
В результате модернизации на узлах с графическими картам nVidia K40 будут обновлены драйверы графических плат до версии 410.104, благодаря чему на кластере станет возможен запуск современного ПО, построенного на базе библиотек CUDA 10.1 и ниже.
На всех узлах кластера будет увеличен раздел /tmp до 520Гб с обдновременным увеличением скорости чтения/записи, в результате чего станет возможен запуск задач с повышенным требованием к дисковой подсистеме.
С учетом нынешней загрузки кластера и длинных выходных планируется одновременный вывод из очереди до 5 узлов одновременно с ожиданием окончания уже запущенных задач.
В связи с этим, возможно увеличение времени ожидания задач в очереди на время проведения работ.
Просим Вас, по возможности, ставить в очередь меньшее число задач для снижения общей нагрузки на кластер и ускорения процесса обновления.
Планируемый срок полного завершения работ - до конца мая.
По окончании работ на кластере ожидайте обновления инструкций по использованию инструментов по работе с GPU, таких как CUDA Toolkit, PGI Compilers и других программ, использующих GPGPU-вычисления. Надеемся на Ваше понимание и желаем хороших выходных!
С Уважением, команда РЦ ВЦ.