Программа обучения
1
Введение
Современное развитие методов машинного обучения в задачах распознавания речи и компьютерного зрения. Задачи классификации и распознавания. Линейная регрессия, SVM, каскады деревьев, искусственные нейронные сети.

Введение.pdf
2
Цифровая обработка сигналов
Основы цифровой обработки сигналов, параметризация речевого сигнала, Mel-Frequency Cepstral Coefficients. Методы нормализации и постобработки акустических признаков.
3
Автоматическое распознавание речи
Основные задачи распознавания речи. Алгоритм динамической трансформации временной шкалы (DTW), Скрытые Марковские Модели (HMM), задача декодирования временной последовательности наблюдаемых данных, алгоритм Витерби. Акустические модели, token passing algorithm. Искусственные нейронные сети в задачах распознавания речи: fully-connected deep neural networks, reccurent neural networks, long short-term memory.

Автоматическое рас…чи.pdf
4
Цифровая обработка изображений и видео.
Нормализация и постобработка изображений, histgram normalization, Haar-like features, Scale-invariant feature transform, выделение границ, фильтрация.

Цифровая_обработк…_и.pdf
5
Алгоритмы компьютерного зрения
Основные задачи компьютерного зрения. Метод Виолы — Джонса. Алгоритмы поиска характеристических точек: Active appearance model, Constrained Local Models, каскады регрессоров. Применение нейронных сетей к задачам компьютерного зрения, Convolutional Neural Networks.

Алгоритмы компьют…ия.pdf
6
Автоматическое распознавание речи по губам
Основные задачи. Выделение значимых признаков для изображений губ: Principal component analysis, Linear Discriminant Analysis, "Eigen lips". Нейросетевые методоы выделения значимых признаков: CNN autoencoders, bottleneck-признаки.
7
Автоматическое распознавание речи по губам и голосу
Способы объединения звука и видео: объединение признаков, объединение выходных cлоев нейронных сетей, объединение bottleneck-признаков. Архитектуры нейронных сетей для аудио-визуального распознавания речи.