Обзор существующихметодовполучениясубтитроввстроенных в видеопоток
Существующие методы обнаружения встроенных субтитров в видеопотоке обычно сначала разрезают видеоклип, чтобы получить серию изображений неподвижных кадров, а затем анализируют и обрабатывают эти изображения кадров. Поскольку видео содержит большое количество изображений кадров, лишь некоторые из которых содержат текст, и мы не можем предсказать, в каком кадре появится субтитр, поиск текста субтитров без анализа каждого кадра займет много времени и не сможет удовлетворить требованиям реального времени. Если ключевые кадры, содержащие текст субтитров, могут быть обнаружены и извлечены, это значительно сэкономит время и ускорит распознавание субтитров.
Метод, предложенный Чжун Цзи [15], сначала раздвигает небольшое окно на изображении видеокадра, чтобы получить смешанные особенности изображения в окне, а затем извлекает текст, отделяя его от фона с помощью классификатора на основе машины опорных векторов. Метод, предложенный Яном Лю [7], заключается в отслеживании цели путем выполнения операции разности на двух соседних изображениях в последовательности кадров и комбинирования ее с определенным порогом для оценки изменения области. Этот метод больше подходит для последовательностей видеокадров с относительно статичным фоном. Чун Чжи [6] охарактеризовал изображения кадров с точки зрения яркости, текстуры и других особенностей и использовал информацию об этих особенностях, а также разницу между изображениями соседних кадров для обнаружения ключевых кадров видеосубтитров, причем этот метод позволяет добиться динамического выделения ключевых кадров субтитров.
Поиск текста на сложном фоне - одна из ключевых и сложных задач при извлечении субтитров из видео. Информация о краях текстовой области особенно богата, а сила краев, плотность краев и переменные направления краев являются важными характеристиками текста. Сначала изображение обрабатывается алгоритмом обнаружения краев, который вычисляет значения градиента отдельных пикселей и объединяет их с количеством пикселей в небольшой области, чтобы определить, принадлежат ли они краям текста или нет.
Весь текст будет доступен после покупки