Личный кабинетuser
orange img orange img orange img orange img orange img
Дипломная работаИнформационные технологии
Готовая работа №109860 от пользователя Куклачев Дмитрий
book

Разработка веб-приложения для автоматической расстановки знаков пунктуации с использованием голосового ввода

1 150 ₽
Файл с работой можно будет скачать в личном кабинете после покупки
like
Гарантия безопасной покупки
help

Сразу после покупки работы вы получите ссылку на скачивание файла.

Срок скачивания не ограничен по времени. Если работа не соответствует описанию у вас будет возможность отправить жалобу.

Гарантийный период 7 дней.

like
Уникальность текста выше 50%
help

Все загруженные работы имеют уникальность не менее 50% в общедоступной системе Антиплагиат.ру

file
Возможность снять с продажи
help

У покупателя есть возможность доплатить за снятие работы с продажи после покупки.

Например, если необходимо скрыть страницу с работой на сайте от третьих лиц на определенный срок.

Тариф можно выбрать на странице готовой работы после покупки.

Не подходит эта работа?
Укажите тему работы или свой e-mail, мы отправим подборку похожих работ
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных

содержание

РЕФЕРАТ 3
СОДЕРЖАНИЕ 4
ВВЕДЕНИЕ 5
1 Анализ предметной области 7
1.1 Глоссарий 7
1.2 Постановка задачи 7
1.3 Существующие подходы к задаче восстановления пунктуации 8
2. Методы и технологии 14
2.1 Обзор используемых методов машинного обучения 14
2.2. Сбор данных для обучения модели восстановления пунктуации 16
2.3 Подготовка данных 19
2.4. Процесс обучения модели. 21
2.5 Используемые технологии 24
3. Реализация web-приложения 27
3.1 Технологическая реализация веб-приложения 27
3.2 Архитектура приложения 28
4. Разработка и реализация программных модулей 31
4.1 Схема базы данных 31
4.3 Интерфейс приложения 32
4.4Демонстрация работы приложения 36
5. Оценка производительности и качества работы модели 39
5.1 Загрузка модели и производительность 39
5.2 Анализ работы модели на примерах 40
5.3 Результаты обучения 41
ЗАКЛЮЧЕНИЕ 43
ЗАКЛЮЧЕНИЕ 45
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 46
ПРИЛОЖЕНИЕ А 48


Весь текст будет доступен после покупки

ВВЕДЕНИЕ

Автоматическая расстановка знаков пунктуации в текстах представляет собой важную задачу в области обработки естественного языка (Natural Language Processing, NLP). В современном мире, с развитием цифровых технологий и расширением информационного пространства, количество создаваемых текстов постоянно растет. Это приводит к повышению требований к качеству текстов и их автоматической обработке. Обнаружение и исправление ошибок в текстах становится все более важной задачей, влияющей на читаемость, понимание и автоматическую обработку текстов компьютерными системами.
Актуальность данной темы обусловлена необходимостью разработки автоматизированных методов для обнаружения и исправления пунктуационных ошибок, которые могут обеспечить сохранение смысла и целостности текста. В последние годы методы искусственного интеллекта (ИИ), и особенно глубокого обучения, получили широкое распространение в решении этой задачи. Эти методы адаптируются к сложным языковым структурам и обучаются на больших объемах текстовых данных, что делает их эффективными для восстановления пунктуации.
Настоящее исследование направлено на изучение применения методов искусственного интеллекта, основанных на нейронных сетях, для восстановления пунктуации в текстах. Мы рассмотрим существующие подходы и модели, используемые для этой задачи, и проанализируем их эффективность и применимость в различных контекстах.

Весь текст будет доступен после покупки

отрывок из работы

1 Анализ предметной области
1.1 Глоссарий
Сверточные нейронные сети (CNN) — тип нейронных сетей, способных извлекать локальные и глобальные признаки из входных данных с помощью операций свертки и пулинга.
Рекуррентные нейронные сети (RNN) — класс нейронных сетей, способных обрабатывать последовательные данные, сохраняя информацию о предыдущих состояниях и используя ее для обработки последующих элементов последовательности.
Трансформеры — Модель нейронной сети, способная обрабатывать последовательные данные.
Нейронные сети — математическая модель, которая представляет собой структуру искусственных нейронов, соединенных друг с другом и с внешней средой связями.
Лексема — единица языка, являющаяся единицей словарного состава языка.
Глубокое обучение — Метод машинного обучения, использующий нейронные сети с множеством слоев для извлечения признаков из данных и решения сложных задач.
Слой свертки— Слой в сверточной нейронной сети, выполняющий операцию свертки для извлечения признаков из входных данных.
Слой пулинга — Слой в сверточной нейронной сети, уменьшающий размерность признакового пространства путем агрегации признаков.
Скрытый слой — Слой в нейронной сети, который не доступен напрямую для внешних наблюдателей и отвечает за извлечение и обработку признаков.

Весь текст будет доступен после покупки

Список литературы

1. Ueffing N., Bisani M., Vozila P. Improved models for automatic punctuation prediction for spoken and written text //Interspeech. – 2013. – С. 3097-3101.
2. Collobert R. et al. Natural language processing (almost) from scratch //Journal of machine learning research. – 2011. – V. 12. – I. 8. – P. 2493-2537.
3. Kim Y. Convolutional neural networks for sentence classification //arXiv preprint arXiv:1408.5882. – 2014.
4. Zhang Y., Wallace B. A sensitivity analysis of (and practitioners' guide to) convolutional neural networks for sentence classification //arXiv preprint arXiv:1510.03820. – 2015.
5. Hochreiter S., Schmidhuber J. Long short-term memory //Neural computation. – 1997. – Т. 9. – №. 8. – С. 1735-1780.
6. Ling W. et al. Finding function in form: Compositional character models for open vocabulary word representation //arXiv preprint arXiv:1508.02096. – 2015.
7. Lample G. et al. Neural architectures for named entity recognition //arXiv preprint arXiv:1603.01360. – 2016.
8. Sutskever I., Vinyals O., Le Q. V. Sequence to sequence learning with neural networks //Advances in neural information processing systems. – 2014. – Т. 27.
9. Cho K. et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation //arXiv preprint arXiv:1406.1078. – 2014.
10. Bahdanau D., Cho K., Bengio Y. Neural machine translation by jointly learning to align and translate //arXiv preprint arXiv:1409.0473. – 2014.
11. Vaswani A. et al. Attention is all you need //arXiv preprint arXiv:1706.03762. – 2017.

Весь текст будет доступен после покупки

Почему студенты выбирают наш сервис?

Купить готовую работу сейчас
service icon
Работаем круглосуточно
24 часа в сутки
7 дней в неделю
service icon
Гарантия
Возврат средств в случае проблем с купленной готовой работой
service icon
Мы лидеры
LeWork является лидером по количеству опубликованных материалов для студентов
Купить готовую работу сейчас

не подошла эта работа?

В нашей базе 78761 курсовых работ – поможем найти подходящую

Ответы на часто задаваемые вопросы

Чтобы оплатить заказ на сайте, необходимо сначала пополнить баланс на этой странице - https://lework.net/addbalance

На странице пополнения баланса у вас будет возможность выбрать способ оплаты - банковская карта, электронный кошелек или другой способ.

После пополнения баланса на сайте, необходимо перейти на страницу заказа и завершить покупку, нажав соответствующую кнопку.

Если у вас возникли проблемы при пополнении баланса на сайте или остались вопросы по оплате заказа, напишите нам на support@lework.net. Мы обязательно вам поможем! 

Да, покупка готовой работы на сайте происходит через "безопасную сделку". Покупатель и Продавец финансово защищены от недобросовестных пользователей. Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. 

У покупателя есть возможность снять готовую работу с продажи на сайте. Например, если необходимо скрыть страницу с работой от третьих лиц на определенный срок. Тариф можно выбрать на странице готовой работы после покупки.

Гарантийный срок составляет 7 дней со дня покупки готовой работы. В течение этого времени покупатель имеет право подать жалобу на странице готовой работы, если купленная работа не соответствует описанию на сайте. Рассмотрение жалобы занимает от 3 до 5 рабочих дней. Если администрация сайта принимает решение о возврате денежных средств, то покупатель получает уведомление в личном кабинете и на электронную почту о возврате. Средства можно потратить на покупку другой готовой работы или вывести с сайта на банковскую карту. Вывод средств можно оформить в личном кабинете, заполнив соответствущую форму.

Мы с радостью ответим на ваши вопросы по электронной почте support@lework.net

surpize-icon

Работы с похожей тематикой

stars-icon
arrowarrow

Не удалось найти материал или возникли вопросы?

Свяжитесь с нами, мы постараемся вам помочь!
Неккоректно введен e-mail
Нажимая на кнопку, вы соглашаетесь на обработку персональных данных