1. Анализ актуального состояния технологий Big Data в России.
1.1 Раскрытие понятия Big Data
В последние годы тема "больших данных", или Big Data, и способы работы с ними стали основными в обсуждении развития технологий, применяемых во многих сферах человеческой жизни. Это связано в первую очередь с гигантским увеличением объема данных, генерируемых людьми. К 2022 году общий объем данных, собранных человечеством, составил около 97 зеттабайт, и к 2025 году это число возрастет до 180 зеттабайт.
Такой рост обусловлен внедрением в повседневную жизнь человека разнообразных технологий и измерительных датчиков, с которыми современный человек сталкивается намеренно или ненамеренно каждый день. Так, согласно типологии компании Kapow, источниками больших данных в настоящее время могут быть оцифрованные архивы, документы, медиа-материалы различного формата, социальные медиа, электроника, личные и бизнес-приложения, хранилища данных, а также в целом Интернет.
Находясь в медиапространстве и взаимодействуя с электроникой, человек, зачастую не задумываясь об этом, создает огромное количество информации ежедневно. Однако не весь этот объем информации пригоден, и поэтому за последнее десятилетие особый интерес вызывают технологии обработки больших данных и специалисты в этой области.
Основная задача этого направления - "расшифровать", то есть структурировать эти данные, выделить нужную информацию и обнаружить новые знания путем поиска корреляций. Поэтому понятие Big Data часто охватывает не только огромные массивы данных, но и ряд технологий для работы с ними.
Термин Big Data был впервые использован редактором журнала Nature Клиффордом Линчем 3 сентября 2008 года в его статье, посвященной росту объемов данных в мире и перспективам их использования в технологиях и бизнесе. Позднее этот термин получил широкое распространение, а само направление заняло свое место на кривой Gartner, будучи оцененным как второй по значимости тренд в информационных технологиях в 2011 году.
Дуглас Лэйни, аналитик из Gartner, уже в 2001 году в своей статье под названием "3D Data Management: Controlling Data Volume, Velocity and Variety" выделил три основные отличительные черты данных в целом: огромный объем данных; скорость как обработки, так и поступления новых данных; и неоднородность, как ключевая особенность, которую решают технологии больших данных.
Весь текст будет доступен после покупки