Модификация VGG-архитектуры в задачах унимодальной и мультимодальной биометрии [] / Стефаниди А. Ф., Приоров А. Л., Топников А. И., Хрящев В. В. // Цифровая обработка сигналов. - 2020. - № 3. - С. 35-40 : ил. - Библиогр.: с. 40 . - ISSN 2221-2574
УДК
ББК 32.811
Рубрики: Радиоэлектроника
   Теория информации. Общая теория связи

Кл.слова (ненормированные):
бимодальная биометрия -- идентификация диктора -- распознавание лиц -- сверточная нейронная сеть -- унимодальная биометрия -- цифровая обработка изображений -- цифровая обработка речевых сигналов
Аннотация: Рассматривается задача распознавания личности с применением нейросетевых подходов. Предложены два алгоритма на основе анализа аудио- и видеоданных. Оба подхода реализованы с использованием модификации сверточной нейронной сети VGG-архитектуры. Первый метод идентификации личности является унимодальным. Сверточная нейронная сеть CNN-VGGS анализирует мелчастотные кепстральные коэффициенты речевого сигнала. Второй алгоритм представляет собой мультимодальное решение на базе оригинальной архитектуры двунаправленной нейронной сети CNN-VGGMulti. Метод классифицирует личность, комбинируя результаты анализа голоса и лица. Результаты исследования доказали эффективность мультимодального алгоритма в задаче распознавания личности. Решение может быть использовано для разработки реальных биометрических систем.


Доп.точки доступа:
Стефаниди, А. Ф. (аспирант); Приоров, А. Л. (доктор технических наук; доцент); Топиников, А. И. (кандидат технических наук); Хрящев, В. В. (кандидат технических наук; доцент)
Нет сведений об экземплярах (Источник в БД не найден)