Постановку и анализ тестовых задач для сетевого кластера, настройка которого описана в прошлой статье, я решил осветить отдельно, т.к. при этом затрагиваются такие сложные элементы как декомпозиция модели, настройка кластера. Содержание статьи будет состоять в основном из скрин-шотов.
Задача
Рассчитать проникание КС в стену (пример из пакета поставки AUTODYN, wallimpact) при нескольких различных конфигурациях кластера и составить таблицу, показывающую влияние количества узлов на время расчета.
Оборудование и программное обеспечение
У меня в распоряжении находились 6 компьютеров с двуядерными процессорами AMD с конфигурацией, представленной на рис.

ПО: MS Windows XP SP2, AUTODYN 6.1, WMPI II 2.4.1.
Пример расчета на кластере из 6-ти узлов
Настройка кластера (фактически редактирование файла группы процессов).

В данном случае рассматриваются двуядерные системы, поэтому в поле «Number of CPU» указывается число 2. Чисто задач (tasks) на узел назначается исходя из того, чтобы на каждое ядро приходилась минимум одна задача.
Число задач (tasks) является входным параметром для декомпозиции расчетной области на участки. При этом области можно задавать как вручную, так и назначать автоматически (делением на равное число отрезков по осям).


Далее производят балансировку участков, также исходя из количества задач.


Настройка параллелизма завершена. Во время расчета можно наблюдать характерные протоколы нагрузки процессоров.

Результаты экспериментов
Тесты практически всегда можно оспорить, этот эксперимент не исключение. Целью эксперимента являлось получение расчетного времени стандартной задачи в serial-режиме, в параллельном режиме на 2-х ядрах, на 4-х ядрах 2-х компьютеров и тд до 5-ти компьютеров одинаковой конфигурации. Оценивалось время инициализации slaves (с момента старта до 5-ого цикла расчета), время счета (с 5-ого цикла расчета, до 205-ого, а также 205-405). Время фиксировалось по созданию файлов результатов с точностью до секунды.
| Initialization time, s | Calc time (cycl. 5-105), s |
Calc time (cycl. 105-205), s |
|
| Serial | 80 | 1308 | 1475 |
| 2 cores / 1 computer | 456 | 1323 | 1435 |
| 4 cores / 2 computers | 256 | 475 | 538 |
| 6 cores / 3 computers | 129 | 537 | 609 |
| 8 cores / 4 computers | 117 | 474 | 535 |
| 10 cores / 5 computers | 131 | 438 | 497 |
Комментировать результаты не берусь, т.к. все напрямую зависит от параметров декомпозиции, от количества задач и других факторов. Поэтому я привожу только «голые» числа.
0 comments ↓
There are no comments yet...Kick things off by filling out the form below.
Leave a Comment