Модификация VGG-архитектуры в задачах унимодальной и мультимодальной биометрии [] / Стефаниди А. Ф., Приоров А. Л., Топников А. И., Хрящев В. В.> // Цифровая обработка сигналов. - 2020. - № 3. - С. 35-40 : ил. - Библиогр.: с. 40 . - ISSN 2221-2574
Рубрики: Радиоэлектроника Теория информации. Общая теория связи Кл.слова (ненормированные): бимодальная биометрия -- идентификация диктора -- распознавание лиц -- сверточная нейронная сеть -- унимодальная биометрия -- цифровая обработка изображений -- цифровая обработка речевых сигналов Аннотация: Рассматривается задача распознавания личности с применением нейросетевых подходов. Предложены два алгоритма на основе анализа аудио- и видеоданных. Оба подхода реализованы с использованием модификации сверточной нейронной сети VGG-архитектуры. Первый метод идентификации личности является унимодальным. Сверточная нейронная сеть CNN-VGGS анализирует мелчастотные кепстральные коэффициенты речевого сигнала. Второй алгоритм представляет собой мультимодальное решение на базе оригинальной архитектуры двунаправленной нейронной сети CNN-VGGMulti. Метод классифицирует личность, комбинируя результаты анализа голоса и лица. Результаты исследования доказали эффективность мультимодального алгоритма в задаче распознавания личности. Решение может быть использовано для разработки реальных биометрических систем. Доп.точки доступа: Стефаниди, А. Ф. (аспирант); Приоров, А. Л. (доктор технических наук; доцент); Топиников, А. И. (кандидат технических наук); Хрящев, В. В. (кандидат технических наук; доцент) Нет сведений об экземплярах (Источник в БД не найден) |