Эксперименты с сетевым кластером

Постановку и анализ тестовых задач для сетевого кластера, настройка которого описана в прошлой статье, я решил осветить отдельно, т.к. при этом затрагиваются такие сложные элементы как декомпозиция модели, настройка кластера. Содержание статьи будет состоять в основном из скрин-шотов.

Задача

Рассчитать проникание КС в стену (пример из пакета поставки AUTODYN, wallimpact) при нескольких различных конфигурациях кластера и составить таблицу, показывающую влияние количества узлов на время расчета.

Оборудование и программное обеспечение

У меня в распоряжении находились 6 компьютеров с двуядерными процессорами AMD с конфигурацией, представленной на рис.
Параметры компьютера
ПО: MS Windows XP SP2, AUTODYN 6.1, WMPI II 2.4.1.

Пример расчета на кластере из 6-ти узлов

Настройка кластера (фактически редактирование файла группы процессов).

Настройка кластера

В данном случае рассматриваются двуядерные системы, поэтому в поле «Number of CPU» указывается число 2. Чисто задач (tasks) на узел назначается исходя из того, чтобы на каждое ядро приходилась минимум одна задача.

Число задач (tasks) является входным параметром для декомпозиции расчетной области на участки. При этом области можно задавать как вручную, так и назначать автоматически (делением на равное число отрезков по осям).

Настройка декомпозии

Параметры декомпозиции

Далее производят балансировку участков, также исходя из количества задач.

Балансировка

Настройка задачи в AUTODYN для параллельного вычисления завершена

Настройка параллелизма завершена. Во время расчета можно наблюдать характерные протоколы нагрузки процессоров.

Загрузка процессоров

Результаты экспериментов

Тесты практически всегда можно оспорить, этот эксперимент не исключение. Целью эксперимента являлось получение расчетного времени стандартной задачи в serial-режиме, в параллельном режиме на 2-х ядрах, на 4-х ядрах 2-х компьютеров и тд до 5-ти компьютеров одинаковой конфигурации. Оценивалось время инициализации slaves (с момента старта до 5-ого цикла расчета), время счета (с 5-ого цикла расчета, до 205-ого, а также 205-405). Время фиксировалось по созданию файлов результатов с точностью до секунды.

Initialization time, s Calc time
(cycl. 5-105), s
Calc time
(cycl. 105-205), s
Serial 80 1308 1475
2 cores / 1 computer 456 1323 1435
4 cores / 2 computers 256 475 538
6 cores / 3 computers 129 537 609
8 cores / 4 computers 117 474 535
10 cores / 5 computers 131 438 497


Комментировать результаты не берусь, т.к. все напрямую зависит от параметров декомпозиции, от количества задач и других факторов. Поэтому я привожу только «голые» числа.

0 comments ↓

There are no comments yet...Kick things off by filling out the form below.

Leave a Comment

or

Spam protection by WP Captcha-Free