Личный кабинетuser
orange img orange img orange img orange img orange img
Дипломная работаПрограммирование
Готовая работа №68766 от пользователя Успенская Ирина
book

Исследование модели и программная реализация метода классификации текстов

1 600 ₽
Файл с работой можно будет скачать в личном кабинете после покупки
like
Гарантия безопасной покупки
help

Сразу после покупки работы вы получите ссылку на скачивание файла.

Срок скачивания не ограничен по времени. Если работа не соответствует описанию у вас будет возможность отправить жалобу.

Гарантийный период 7 дней.

like
Уникальность текста выше 50%
help

Все загруженные работы имеют уникальность не менее 50% в общедоступной системе Антиплагиат.ру

file
Возможность снять с продажи
help

У покупателя есть возможность доплатить за снятие работы с продажи после покупки.

Например, если необходимо скрыть страницу с работой на сайте от третьих лиц на определенный срок.

Тариф можно выбрать на странице готовой работы после покупки.

Не подходит эта работа?
Укажите тему работы или свой e-mail, мы отправим подборку похожих работ
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных

содержание

Содержание 4
ВВЕДЕНИЕ 5
1. АНАЛИЗ МЕТОДОВ И ВЫБОР АЛГОРИТМА КЛАСТЕРИЗАЦИИ 7
1.1. Анализ предметной области 7
1.2. Методы кластерного анализа 10
1.3. Описание методов кластерного анализа 18
1.4. Постановка задачи на разработку сетевого программного обеспечения для выполнения кластерного анализа 27
1.5. Анализ существующих программ для выполнения кластерного анализа 28
Выводы по разделу 1 35
2. РАЗРАБОТКА И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМА ДЛЯ ВЫПОЛНЕНИЯ КЛАСТЕРНОГО АНАЛИЗА 36
2.1. Разработка программной архитектуры реализации алгоритма k-means для выполнения кластерного анализа 36
2.2. Разработка логической модели программной реализации алгоритма для выполнения кластерного анализа 38
2.3. Выбор архитектуры и средств разработки программной реализации метода кластеризации 45
2.4. Описание работы программной реализации метода кластеризации в сетевом режиме 54
ЗАКЛЮЧЕНИЕ 57
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 58
ПРИЛОЖЕНИЕ А. Задание на магистерскую диссертацию 61
ПРИЛОЖЕНИЕ Б. Фрагмент кода программной реализации метода кластерного анализа. 62

Весь текст будет доступен после покупки

ВВЕДЕНИЕ

На протяжении нескольких десятилетий количество цифровых текстовых документов резко возросло. Несмотря на широкое использование фото и видео, текст остается одним из основных видов хранения информации. Большинство ресурсов и содержащейся в них информации превратило интернет в грандиозное хранилище неструктурированных данных. При этом хранение очень большого объема информации должно быть обусловлено тем, что ее поиск и обработка являются быстрыми и доступными.
Кластерный анализ считается базовой задачей в области поиска, исследования и анализа данных, статистических данных. Он распространенно используется во многих областях, в основном, а области машинного обучения. Кластерный анализ включает в себя распознавание образов, сжатие данных, исследование изображений, поиск информации и компьютерную графику.
Основными определениями кластеров являются группы с маленькими расстояниями между объектами кластера, интервалы, плотные области пространства данных или отдельные статистические распределения.
Важнейшая роль кластеризации - это оптимизация. Соответствующий метод кластеризации и задача параметров (включая такие значения, как используемая функция расстояния, порог плотности или количество выходных кластеров) зависят от индивидуального набора данных и предполагаемого использования результатов.

Весь текст будет доступен после покупки

отрывок из работы

1. АНАЛИЗ МЕТОДОВ И ВЫБОР АЛГОРИТМА КЛАСТЕРИЗАЦИИ
1.1. Анализ предметной области
Существует несколько приемов обработки текста:
- Первый опирается на модель языка и правил;
- Второй строится на основе машинного обучения.
Первый прием, в отличии от второго крайне трудоёмкий, но именно он позволяет получить наиболее точные результаты.
При увеличении обучающей выборки улучшаются результаты, что не требует совершенствования математических методов.
И первый, и второй подходы заключаются в:
• Анализирование мнений.
• Классификации текстов по схожествам.
• Соотношении текста к определенным группам.
Используется, например, в онлайн-библиотеках.
• Анализирование высказываний.
• Генерации компьютерной речи.
Используется в робототехнике, смартфонах, навигаторах.
• Ведении диалога.
Используется в робототехнике, например, говорящие роботы, голосовые помощники.
• Проверки грамматики и правописания.
Используется в текстовых редакторах, поисковых системах.
• Извлечении смысловой нагрузки из текста.
Поиск ключевых слов и словосочетаний, синонимизация. Применяется в новостных системах для агрегирования серии новостных сообщений, базах знаний для организации хранения знаний и вывода новых фактов.
• Поиске ответов на вопросы.
Поиск наиболее подходящего ответа на поставленный вопрос. Применяется в поисковых системах.
• Машинном переводе.
Одним из главных достоинств машинного перевода является автоматическая классификация входных электронных данных, модель которой сводится к считыванию, обработке текста и присвоению документу темы из заранее заданного списка.
Разделение неструктурированной группы документов на группы в соответствии с содержимым документов является основной задачей кластеризации текстов.
Неструктурированными являются данные без внутренней структуры или определения, соответствующего задаче, которую предполагается решать.

Весь текст будет доступен после покупки

Список литературы

1. Аливкин Т. В. Информационные аналитические системы: учебник; под ред. В. В. Дигка. - Москва : Синергия, 2019. - 379 с.
2. Кракина Е.В. Методы и средства проектирования информационных систем и технологий: учебное пособие / Кракина Е.В., 2017. -152 c.
3. Загребаньев А.А., Улькина Т.А., Кобичев Ю.Г. Методы математического программирования: учебное пособие – М.: МИФИ, 2017. – 332 с.
4. Трутнев Д. Р. Архитектуры информационных систем. Основы проектирования: учеб. пособие. – СПб.: НИУ ИТМО, 2012. – 66 с.
Электронные ресурсы
5. Интеллектуальный дизайнер для MySQL. - URL: https://www.deart.com/ru/dbfoge/mysql/studio (дата обращения 21.04.2022).
6. Компания StatSoft. - URL: http://statsoft.ru/products (дата обращения 01.05.2022).
7. Метод k-средних. – URL:https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%D0%BE%D0%B4_k-%D1%81%D1%80%D0%D0%B4%D0%BD%B8%D1 (дата обращения 20.04.2022).
8. Платформа ClusterDELTA.- URL: http://clusterdelta.com/platform (дата обращения 10.03.2022).
9. Программа Visual Volume .- URL: http://t-traders.com/other/forxsoft/2680-visual-volme-analiz-obema.html (дата обращения 09.02.2022).
10. Сервис калькулятор кластерного анализа. -URL: http://axd.smstr.ru/cluster.php (дата обращения 09.02.2022).

Весь текст будет доступен после покупки

Почему студенты выбирают наш сервис?

Купить готовую работу сейчас
service icon
Работаем круглосуточно
24 часа в сутки
7 дней в неделю
service icon
Гарантия
Возврат средств в случае проблем с купленной готовой работой
service icon
Мы лидеры
LeWork является лидером по количеству опубликованных материалов для студентов
Купить готовую работу сейчас

не подошла эта работа?

В нашей базе 78761 курсовых работ – поможем найти подходящую

Ответы на часто задаваемые вопросы

Чтобы оплатить заказ на сайте, необходимо сначала пополнить баланс на этой странице - https://lework.net/addbalance

На странице пополнения баланса у вас будет возможность выбрать способ оплаты - банковская карта, электронный кошелек или другой способ.

После пополнения баланса на сайте, необходимо перейти на страницу заказа и завершить покупку, нажав соответствующую кнопку.

Если у вас возникли проблемы при пополнении баланса на сайте или остались вопросы по оплате заказа, напишите нам на support@lework.net. Мы обязательно вам поможем! 

Да, покупка готовой работы на сайте происходит через "безопасную сделку". Покупатель и Продавец финансово защищены от недобросовестных пользователей. Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. 

У покупателя есть возможность снять готовую работу с продажи на сайте. Например, если необходимо скрыть страницу с работой от третьих лиц на определенный срок. Тариф можно выбрать на странице готовой работы после покупки.

Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. Если администрация сайта принимает решение о возврате денежных средств, то покупатель получает уведомление в личном кабинете и на электронную почту о возврате. Средства можно потратить на покупку другой готовой работы или вывести с сайта на банковскую карту. Вывод средств можно оформить в личном кабинете, заполнив соответствущую форму.

Мы с радостью ответим на ваши вопросы по электронной почте support@lework.net

surpize-icon

Работы с похожей тематикой

stars-icon
arrowarrow

Не удалось найти материал или возникли вопросы?

Свяжитесь с нами, мы постараемся вам помочь!
Неккоректно введен e-mail
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных