5.    Контроль потока служебной информации (легко регулируется периодичность запросов);

6.    Простота сбора данных.

В каждом запросе указывается объект определенной иерархии и запрашиваемая метрика:

·     вид ресурсов;

·     уровень иерархии;

·     номер объекта на данном уровне иерархии;

·     код запрашиваемой метрики для данного объекта.

Структура получаемой информации однозначно определяется типом объектов указанных в запросе.

Возможно получение информации сразу по всем объектам и/или всем метрикам – при указании специальных значений последних двух  полей. В данном случае в ответ на запрос возвращается массив однотипных структур.

Диспетчер, – выделенный процессор, управляющий и контролирующий параллельную систему, – осуществляет мониторинг, и сбор необходимой информации о системе в реальном времени. Определен прикладной программный интерфейс диспетчера, который может использоваться программами начального распределения задач, визуализации, анализа производительности, динамической оптимизации и др.

Таким образом, диспетчер поддерживает рабочий профиль параллельной программы. Общий вид структуры информации представляет собой двумерную матрицу. Одна размерность состоит из наименований однотипных объектов, другая – из наименований метрик, измеряемых для данных объектов. В качестве объектов используются процессоры, задачи и каналы. Таким образом, имеется три матрицы текущих параметров параллельной программы. Также, имеются вектора средних и общих параметров.

Для процессора вычисляются, например, следующие параметры: загруженность, количество памяти, время простоя и др.

Для задач вычисляются общее время вычисления, время обмена данными и др.

Для каналов: счетчики входов в процедуры обмена send/recv, объем переданных/принятых данных, среднее время нахождения в режиме приема/передачи и др.

5. Контроль производительности.

В данном разделе описываются идейные соображения для построения системы, анализирующей производительность параллельных программ в реальном времени.

Накопленная диспетчером информация – рабочий профиль – может использоваться для анализа выполнения параллельной программы. Далее описан примерный сценарий анализа.

Пусть задан вопрос: работает ли программа эффективно.

Гипотеза H0: программа работает эффективно.

Гипотеза H1: программа работает неэффективно.

Проверку гипотез производим из следующих соображений. Выделим основные типы неэффективной работы параллельной программы, один из них:

·     большая доля времени простоя задач от общего времени работы.

Упрощенно это выражается следующим выражением:


Можно взять критерий: Eп < 0,8.

Итак, если время простоя занимает более 20 процентов общего времени работы программы, то есть основания считать работу программы неэффективной.

Подтвердив данную гипотезу – первого уровня, – переходим к анализу гипотез второго уровня. Предположим, в программе имеется «узкое место» в плане обмена данных. Рассмотрим участок графа потоков данных программы, показанный на рисунке.


Взаимодействуют две задачи через канал. Задача T1 генерирует данные, они передаются по каналу, являющемуся выходным для T1, а задача T2 принимает их на свой входной порт и обрабатывает.

Существует два типа «узких мест»:

1.    T2 не успевает обрабатывать входные данные, T1 находится в состоянии ожидания обработки выходных данных. При этом наблюдается:

a)    загруженность T2 высока (> 90 %), загруженность T1 низка (< 50%),

b)    количество сгенерированных L1 и обработанных L2 данных находятся в отношении L1 – L2 > d > 0,

c)    длина очереди данных входного канала для T2 велика.

2.    T1 генерирует мало данных, T2 находится в состоянии ожидания входных данных. При этом наблюдается:

a)    загруженность T1 высока (> 90 %), загруженность T2 низка (< 50%),

b)    длина очереди данных входного канала для T2 мала.

В данном случае можно выдвинуть две соответствующие гипотезы. Их проверку можно осуществить из следующих соображений.

Рассмотрим метрику канала связи процессоров – среднее время обмена. Для первой задачи это функция send, для второй – recv.

Пусть процесс изменения этих метрик во времени выглядят примерно так, как показано на рисунке.


Если имеет место первая причина снижения производительности, то первая метрика будет превышать вторую, т.к. первый процесс относительно долго находится в режиме передачи, а второй при этом не принимает данные, а, скорее всего, вычисляет.

Если имеет место вторая причина, то все наоборот.

Для подтверждения тех или иных гипотез можно применить методы анализа случайных процессов.

Заключение

Описанная система параллельного программирования является основой для создания программ визуализации, анализа производительности, оптимального начального распределения задач, динамической оптимизации выполнения параллельных программ.

Программы визуализации и анализа производительности могут использоваться для изучения параллельных алгоритмов, как таковых.

В будущем, законченная система может использоваться для осуществления практических вычислительных задач большой сложности и оперирующих большими объемами данных.

Преимущество данной системы состоит в том, что она не требует применения мощных компьютерных систем, вместо этого она полноценно использует ресурсы любых локальных сетей на базе ОС Windows 95.

Литература:

1.    Сервер ВЦ РАН http://www.ccas.ru/paral/

2.    Ian Foster, “Designing and Building Parallel Programs”, 1995

3.    Barton P. Miller and others, “The Paradyn Parallel Performance Measurement Tools” Computer Sciences Department, University of Wisconsin-Madison. http://www.cs.wisc.edu/paradyn/

4.    Бертекас, Галлагер, “Сети передачи данных”, 1989.


Информация о работе «Менеджер управления распределенными вычислениями в локальной сети»
Раздел: Менеджмент
Количество знаков с пробелами: 17154
Количество таблиц: 0
Количество изображений: 5

Похожие работы

Скачать
181929
3
48

... сети. Коммутатор поддерживает и глобальные связи с топологией "точка-точка" по линиям T1/E1, позволяя связывать несколько локальных сетей, построенных на его основе, друг с другом. Рис. 7.1. Структура коммутатора ES/1 Коммутатор ES/1 работает по технологии коммутации с буферизацией, что позволяет ему транслировать протоколы канального уровня, осуществлять пользовательскую фильтрацию, сбор ...

Скачать
142638
22
20

... стоимость создания такой сети без учета затрат на подключения к сети каждой конкретной квартиры. Рисунок 2.1 – Общий вид расположения домов Основными целями проектирования «домашней» локальной сети, являются: 1)  совместная обработка информации; 2)  совместное использование файлов; 3)  централизованное управление компьютерами; 4)  контроль за доступом к информации; 5)  централизованное ...

Скачать
142396
4
1

... и в старых версиях Ethernet, а кабельные системы этих стандартов совместимы, для перехода к 100BaseT от 10BaseT требуются меньшие капитальные вложения, чем для установки других видов высокоскоростных сетей. Кроме того, поскольку 100BaseT представляет собой продолжение старого стандарта Ethernet, все инструментальные средства и процедуры анализа работы сети, а также все программное обеспечение, ...

Скачать
374863
43
0

... интерфеса и интерфейса локольной сети ·     Предложение о выборе вариантов загрузки При этом возможен вариант запгрузки как с SCSI устройства (диск, CDROM, лента, …) так и через локальную сеть. Загрузочный диск должен быть предварительно сконфигурирован. Так как обьем Boot ROM не может быть большим, в его задачи входит загрузка вторичного загрузчика ...

0 комментариев


Наверх