Личный кабинетuser
orange img orange img orange img orange img orange img
Курсовая работаИнформационные технологии
Готовая работа №14605 от пользователя Бобылев_Андрей
book

Верифицируемые контрольные точки восстановления для параллельных приложений

492 ₽
Файл с работой можно будет скачать в личном кабинете после покупки
like
Гарантия безопасной покупки
help

Сразу после покупки работы вы получите ссылку на скачивание файла.

Срок скачивания не ограничен по времени. Если работа не соответствует описанию у вас будет возможность отправить жалобу.

Гарантийный период 7 дней.

like
Уникальность текста выше 50%
help

Все загруженные работы имеют уникальность не менее 50% в общедоступной системе Антиплагиат.ру

file
Возможность снять с продажи
help

У покупателя есть возможность доплатить за снятие работы с продажи после покупки.

Например, если необходимо скрыть страницу с работой на сайте от третьих лиц на определенный срок.

Тариф можно выбрать на странице готовой работы после покупки.

Не подходит эта работа?
Укажите тему работы или свой e-mail, мы отправим подборку похожих работ
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных

содержание

Введение 3
Постановка задачи 5
Обзор литературы 6
Глава 1. Теоретические аспекты обеспечения отказоустойчивости параллельных приложений. 9
1.1 Основные понятия и определения 9
1.2 Сравнительный анализ подходов к обеспечению отказоустойчивости параллельных приложений 10
1.3 Обзор существующих решений 12
Глава 2. Верифицируемые контрольные точки восстановления для параллельных приложений 19
2.1 Реализация 19
2.2 Тестирование решения 22
Выводы 37
Заключение 38
Список литературы 39

Весь текст будет доступен после покупки

ВВЕДЕНИЕ

В настоящее время, задачи, решаемые компьютерными системами, становятся всё сложнее и объемнее. На компьютер возлагаются такие задачи как: автоматизированный сбор, хранение и обработка большого объема данных, моделирование процессов в различных сложных системах, визуализация комплексных физических явлений и многое другое.
Вычисления такого рода могут быть организованы либо как параллельные (оборудование находится в одном физическом месте, узлы тесно соединены между собой и все параметры их работы известны), либо как распределённые (нет тесной постоянной связи между узлами, узлы распределены по некоторой территории и параметры работы этой системы динамичны и не всегда известны).
Для каждого из типов организации вычислений существует устоявшийся набор инструментов, с помощью которого пользователь может адаптировать свои программы под систему с общей памятью (единая оперативная память, единая операционная система, единая подсистема ввода-вывода, процессоры образуют множество) или с распределённой (на каждом вычислительном узле функционирует собственные копии операционной системы, под управлением которых выполняются независимые программы).

Весь текст будет доступен после покупки

отрывок из работы

Глава 1. Теоретические аспекты обеспечения отказоустойчивости параллельных приложений.

1.1 Основные понятия и определения

Для обеспечения отказоустойчивости параллельных приложений, использующих MPI как способ взаимодействия, обычно используют один из следующих подходов:

1. system-level checkpoint/restart - периодическая остановка приложения операционной системой, выгрузка содержимого памяти всех параллельных процессов в файл и возобновление выполнения;
2. application-level checkpoint/restart - сохранение указанных разработчиком переменных в файл на каждой n-й итерации основного цикла программы и восстановление из файла до начала основного цикла программы.

Определение: контрольная точка – файл, содержащий значения переменных программы, в определённый момент времени, сохранённый в какой-либо файловой системе (локальной или распределённой) с целью восстановления значений этих переменных в случае перезапуска программы, сбоя, отказа оборудования или с целью продолжения вычислений с определённого этапа.

Таким образом, основой обеспечения отказоустойчивости параллельных приложений является создание контрольных точек в тот или иной момент времени одним из вышеописанных способов для дальнейшего восстановления состояния приложения из них.


1.2 Сравнительный анализ подходов к обеспечению отказоустойчивости параллельных приложений

Очевидный недостаток подхода system-level checkpoint/restart, заключается в том, что он неэффективен для большого количества параллельных процессов и сохраняет слишком много данных, если вызов создания контрольной точки происходит во время какой-либо фазы работы приложения с пиковым использованием памяти. Это связано с тем, что приложение рассматривается в данном подходе как чёрный ящик и механизм создания контрольных точек не может учитывать особенности его архитектуры или какие-либо внутренние характеристики. Однако, существенным преимуществом подхода создания контрольных точек на уровне системы является отсутствие необходимости модифицировать исходный код приложения для добавления отказоустойчивости.
Подход application-level checkpoint/restart в свою очередь подразумевает создание контрольных точек на более высоком уровне в сравнении с system-level checkpoint/restart, что даёт возможность учитывать структуры данных и выбирать переменные, которые разработчик хочет сохранить. Поэтому размер контрольных точек в данном подходе оптимален – в неё входят исключительно те данные, которые необходимы для восстановления работы программы, а не всё адресное пространство. Контрольные точки при данном подходе могут быть перенесены между гетерогенными машинами, поскольку система знает типы данных переменных в контрольных точках, а сам файл может быть сохранён в распределённую систему в поддерживаемом всеми машинами формате.
В таблице 1 приведена сравнительная характеристика двух подходов по основным параметрам:

Весь текст будет доступен после покупки

Список литературы

1. Message Passing Interface // Wikipedia: https://ru.wikipedia.org/wiki/Message_Passing_Interface (дата обращения: 26.05.2022).
2. Hargrove P. H., Duell J. C. Berkeley lab checkpoint/restart (BLCR) for Linux clusters //Journal of Physics: Conference Series. – IOP Publishing, 2006. – Vol. 46. – Issue 1. – P. 067
3. Application checkpointing // Wikipedia: https://en.wikipedia.org/wiki/Application_checkpointing (дата обращения: 26.05.2022).
4. Van der Wijngaart R. F., Wong P. NAS parallel benchmarks version 2.4. – 2002.
5. Heroux M. A. et al. Improving performance via mini-applications //Sandia National Laboratories, Tech. Rep. SAND2009-5574. – 2009. – Vol. 3
6. Ansel J., Arya K., Cooperman G. DMTCP: Transparent checkpointing for cluster computations and the desktop //2009 IEEE International Symposium on Parallel & Distributed Processing. – IEEE, 2009. – P. 1-12.
7. ECC Memory // Wikipedia: https://en.wikipedia.org/wiki/ECC_memory (дата обращения: 26.05.2022).
8. Shahzad F. et al. CRAFT: A library for easier application-level checkpoint/restart and automatic fault tolerance //IEEE Transactions on Parallel and Distributed Systems. – 2018. – Vol. 30. – Issue 3. – P. 501-514.
9. A. Moody, G. Bronevetsky, K. Mohror, and B. R. d. Supinski, “Design, Modeling, and Evaluation of a Scalable Multi-level Checkpointing System,” in Proceedings of the 2010 ACM/IEEE International Conference for High Performance Computing, Networking, Storage and Analysis, ser. SC ’10. Washington, DC, USA: IEEE Computer Society, Nov. 2010, pp. 1–11.
10. L. M. Silva and J. G. Silva, “System-level versus user-defined checkpointing,” in The Seventeenth Symposium on Reliable Distributed Systems, SRDS 1998,

Весь текст будет доступен после покупки

Почему студенты выбирают наш сервис?

Купить готовую работу сейчас
service icon
Работаем круглосуточно
24 часа в сутки
7 дней в неделю
service icon
Гарантия
Возврат средств в случае проблем с купленной готовой работой
service icon
Мы лидеры
LeWork является лидером по количеству опубликованных материалов для студентов
Купить готовую работу сейчас

не подошла эта работа?

В нашей базе 78761 курсовых работ – поможем найти подходящую

Ответы на часто задаваемые вопросы

Чтобы оплатить заказ на сайте, необходимо сначала пополнить баланс на этой странице - https://lework.net/addbalance

На странице пополнения баланса у вас будет возможность выбрать способ оплаты - банковская карта, электронный кошелек или другой способ.

После пополнения баланса на сайте, необходимо перейти на страницу заказа и завершить покупку, нажав соответствующую кнопку.

Если у вас возникли проблемы при пополнении баланса на сайте или остались вопросы по оплате заказа, напишите нам на support@lework.net. Мы обязательно вам поможем! 

Да, покупка готовой работы на сайте происходит через "безопасную сделку". Покупатель и Продавец финансово защищены от недобросовестных пользователей. Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. 

У покупателя есть возможность снять готовую работу с продажи на сайте. Например, если необходимо скрыть страницу с работой от третьих лиц на определенный срок. Тариф можно выбрать на странице готовой работы после покупки.

Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. Если администрация сайта принимает решение о возврате денежных средств, то покупатель получает уведомление в личном кабинете и на электронную почту о возврате. Средства можно потратить на покупку другой готовой работы или вывести с сайта на банковскую карту. Вывод средств можно оформить в личном кабинете, заполнив соответствущую форму.

Мы с радостью ответим на ваши вопросы по электронной почте support@lework.net

surpize-icon

Работы с похожей тематикой

stars-icon
arrowarrow

Не удалось найти материал или возникли вопросы?

Свяжитесь с нами, мы постараемся вам помочь!
Неккоректно введен e-mail
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных