Личный кабинетuser
orange img orange img orange img orange img orange img
Курсовая работаИнформатика
Готовая работа №10244 от пользователя Чистякова Наталья
book

MapReduce: вычисление группировки и агрегирования

520 ₽
Файл с работой можно будет скачать в личном кабинете после покупки
like
Гарантия безопасной покупки
help

Сразу после покупки работы вы получите ссылку на скачивание файла.

Срок скачивания не ограничен по времени. Если работа не соответствует описанию у вас будет возможность отправить жалобу.

Гарантийный период 7 дней.

like
Уникальность текста выше 50%
help

Все загруженные работы имеют уникальность не менее 50% в общедоступной системе Антиплагиат.ру

file
Возможность снять с продажи
help

У покупателя есть возможность доплатить за снятие работы с продажи после покупки.

Например, если необходимо скрыть страницу с работой на сайте от третьих лиц на определенный срок.

Тариф можно выбрать на странице готовой работы после покупки.

Не подходит эта работа?
Укажите тему работы или свой e-mail, мы отправим подборку похожих работ
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных

содержание

Введение 3
Глава 1. ОБЩАЯ ЧАСТЬ 6
1.1. Горизонтальное масштабирование 6
Глава 2. ТEХНОЛОГИЯ MAPREDUCE 7
2.1. Описание технологии MapReduce 7
2.2. Архитектура MapReduce 13
Глава 3. Вычисление группировки и агрегирование 18
3.1. Описание процесов 18
Map 18
Reduce 20
Заключение 27
Список использованных источников 28
Приложение 1 30
Приложение 2 31
Приложение 3 32
Приложение 4 34



Весь текст будет доступен после покупки

ВВЕДЕНИЕ

Мы производим огромное количество данных каждый день, знаем мы об этом или нет. Каждый клик в Интернете, каждая банковская транзакция, каждое видео, которое мы смотрим на YouTube, каждое электронное письмо, которое мы отправляем, каждый лайк в нашем посте в Instagram составляют данные для технологических компаний.
При таком огромном объеме собираемых данных компаниям имеет смысл использовать эти данные только для того, чтобы лучше понимать своих клиентов и их поведение. Именно по этой причине популярность науки о данных за последние несколько лет многократно возросла.
Большие данные — это именно то, что следует из названия, “большой” объем данных. Большие данные означают большой по объему и более сложный набор данных. Из-за большого объема и более высокой сложности больших данных традиционное программное обеспечение для обработки данных не может справиться с этим. Большие данные просто означают наборы данных, содержащие большое количество разнообразных данных, как структурированных, так и неструктурированных.
Большие данные позволяют компаниям решать проблемы, с которыми они сталкиваются в своем бизнесе, и эффективно решать эти проблемы с помощью аналитики больших данных. Компании пытаются выявить закономерности и извлечь информацию из этого моря данных, чтобы на ее основе можно было действовать для решения имеющихся проблем.
5 Преимуществ больших данных
Дуг Лейни представил эту концепцию 3 против больших данных, а именно. Объем, Разнообразие и Скорость.
• Объем относится к объему собираемых данных. Данные могут быть структурированными или неструктурированными.

• Скорость относится к скорости, с которой поступают данные.
• Разнообразие относится к различным видам данных (типам данных, форматам и т.д.), Которые поступают для анализа.
• За последние несколько лет также появилось 2 дополнительных типа данных – ценность и достоверность.
• Ценность относится к полезности собранных данных.
• Достоверность относится к качеству данных, поступающих из разных источников.

Весь текст будет доступен после покупки

отрывок из работы

Глава 1. ОБЩАЯ ЧАСТЬ
1.1. Горизонтальное масштабирование
Этот подход - лучшее решение для проектов, которым требуется высокая доступность или отказоустойчивость. При горизонтальном масштабировании мы повышаем производительность сервера, добавляя больше машин в сеть, разделяя рабочую нагрузку обработки и памяти между несколькими устройствами. Мы просто добавляем дополнительные экземпляры сервера к существующему пулу серверов и распределяем нагрузку между этими серверами. При таком подходе нет необходимости изменять мощность сервера или заменять сервер. Кроме того, как и при вертикальном масштабировании, при добавлении дополнительных серверов в сеть нет простоев. Большинство организаций выбирают этот подход, потому что он включает увеличение параллелизма ввода-вывода, снижение нагрузки на существующие узлы и увеличение емкости диска.
Одним из способов горизонтального масштабирования является разбиение кода. Важно разбить код на маленькие части дабы в дальнейшем иметь возможность распараллелить выполнение операций. Вкупе разбиение кода и его распараллеливание дает значительный эффект в работе программы, что позволяет работать с большими данными, не замечая особых трудностей. Конечно, для должной работы необходимо грамотно использовать не только программные алгоритмы, но и технические элементы (железо). Ведь без большого количества северов с мощным железом программ будет работать не так эффективно, как могла бы. Поэтому важно учитывать все тонкости работы с вычислениями и данными от мощного железа до эффективно работающего программного обеспечения.

Весь текст будет доступен после покупки

Список литературы

1. Уроки по программированию, DevOps и другим IT-технологиям [Электронный ресурс]. URL: https://coderlessons.com/tutorials/bolshie-dannye-i-analitika/izuchit-kartu-umenshit/mapreduce-kratkoe-rukovodstvo (дата обращения: 10.12.2021).
2. Medium [Электронный ресурс]. URL: https://medium.com/swlh/relational-operations-using-mapreduce-f49e8bd14e31 (дата обращения: 10.12.2021).
3. CodeProject [Электронный ресурс]. URL: https://www.codeproject.com/Articles/1272296/Map-Reduce-script-in-NetSuite-with-SuiteScript-2-0 (дата обращения: 10.12.2021).
4. Уроки по программированию, DevOps и другим IT-технологиям [Электронный ресурс]. URL: https://coderlessons.com/tutorials/bolshie-dannye-i-analitika/osnovy-bolshikh-dannykh/7-schetchiki-i-soedineniia-v-mapreduce (дата обращения: 10.12.2021).
5. MongoDB [Электронный ресурс]. URL: https://docs.mongodb.com/manual/core/map-reduce/ (дата обращения: 10.12.2021).
6. Edureka онлайн курсы [Электронный ресурс]. URL: https://www.edureka.co/blog/mapreduce-tutorial/ (дата обращения: 10.12.2021).
7. Talend единая платформа для надежных и доступных данных [Электронный ресурс]. URL: https://www.talend.com/resources/what-is-mapreduce/ (дата обращения: 10.12.2021).
8. Благиев А., Хапаева Н., Big data простым языком – Издательство АСT, 2019г., 256с.

Весь текст будет доступен после покупки

Почему студенты выбирают наш сервис?

Купить готовую работу сейчас
service icon
Работаем круглосуточно
24 часа в сутки
7 дней в неделю
service icon
Гарантия
Возврат средств в случае проблем с купленной готовой работой
service icon
Мы лидеры
LeWork является лидером по количеству опубликованных материалов для студентов
Купить готовую работу сейчас

не подошла эта работа?

В нашей базе 78761 курсовых работ – поможем найти подходящую

Ответы на часто задаваемые вопросы

Чтобы оплатить заказ на сайте, необходимо сначала пополнить баланс на этой странице - https://lework.net/addbalance

На странице пополнения баланса у вас будет возможность выбрать способ оплаты - банковская карта, электронный кошелек или другой способ.

После пополнения баланса на сайте, необходимо перейти на страницу заказа и завершить покупку, нажав соответствующую кнопку.

Если у вас возникли проблемы при пополнении баланса на сайте или остались вопросы по оплате заказа, напишите нам на support@lework.net. Мы обязательно вам поможем! 

Да, покупка готовой работы на сайте происходит через "безопасную сделку". Покупатель и Продавец финансово защищены от недобросовестных пользователей. Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. 

У покупателя есть возможность снять готовую работу с продажи на сайте. Например, если необходимо скрыть страницу с работой от третьих лиц на определенный срок. Тариф можно выбрать на странице готовой работы после покупки.

Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. Если администрация сайта принимает решение о возврате денежных средств, то покупатель получает уведомление в личном кабинете и на электронную почту о возврате. Средства можно потратить на покупку другой готовой работы или вывести с сайта на банковскую карту. Вывод средств можно оформить в личном кабинете, заполнив соответствущую форму.

Мы с радостью ответим на ваши вопросы по электронной почте support@lework.net

surpize-icon

Работы с похожей тематикой

stars-icon
arrowarrow

Не удалось найти материал или возникли вопросы?

Свяжитесь с нами, мы постараемся вам помочь!
Неккоректно введен e-mail
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных