Вот так проходило обучение в 2017 году
Преподаватели
Савченко Андрей Владимирович
Профессор кафедры информационных систем и технологий НИУ ВШЭ в Нижнем Новгороде
В 2008 году окончил Нижегородский государственный технический университет, специальность Прикладная математика и информатика. В 2010 защитил кандидатскую диссертацию, специальность 05.13.18. В 2016 году стал доктором технических наук, специальность 05.13.01. В настоящее время - профессор кафедры информационных систем и технологий, старший научный сотрудник международной лаборатории алгоритмов и технологий анализа сетевых структур, руководитель научно-учебной группы анализа мультимедийных данных НИУ ВШЭ- Н. Новгород. Область научных интересов - статистическое распознавание образов, обработка изображений. Автор болел 100 публикаций, в том числе монографии в издательстве Springer, статей в престижных международных журналах Pattern Recognition, Neurak Networks, Knowledge-based Systems, Pattern Recognition Letters и др. Соруководитель секции анализа изображений международной конференции analysis of images, social networks and texts (AIST).
Кореневский Максим Львович
ЦРТ-инновации
Родился и получил образование в Ленинграде/Санкт-Петербурге. В 1997 году окончил Физико-Механический Факультет Санкт-Петербургского Государственного Технического (ныне Политехнического) Университета. В 2000 году защитил диссертацию на соискание степени кандидата физико-математических наук по специальности 15.13.18. В 2010 году был принят на работу в компанию Центр Речевых Технологий на должность научного сотрудника в научно-исследовательский департамент. В настоящее время является старшим научным сотрудником отдела распознавания речи. За время работы в компании принял участие в ряде международных конференций, таких как SPECOM (2011,2014), ASRU (2014), TSD(2016) стал автором более 20 публикаций.
Кудашев Олег Юрьевич
ЦРТ-инновации
Родился и получил среднее образование в г. Нижневартовске. В 2010 году окончил факультет прикладной математики-процессов управления Санкт-Петербургского государственного университета. В этом же году был принят в компанию ООО "Центр речевых технологий" на должность программиста в научно-исследовательский департамент. В настоящее время являюсь руководителем проектов развития технологий голосовой биометрии отдела верификации и идентификации. За время работы в компании принял участие в ряде международных конференций, таких как SPECOM (2013), AVSS (2015), INTERSPEECH (2016), стал автором более 10 публикаций в международных журналах, защитил степень кандидата технических наук по специальности 05.13.11. На данный момент являюсь специалистом в области голосовой биометрии, распознавания речи, машинного обучения.
Тетерин Михаил Александрович
Старший инженер в компании «АО Сбербанк-Технологии».
Аспирант СПбГТИ (ТУ) и учусь по специальности 05.13.01. Являюсь ответственным руководителем трех проектов, связанных с управлением качеством полимерных пленок на производстве. Проекты выполняются при финансовой поддержке фонда содействия развитию малых форм предприятий в научно-технической сфере, Германской службы академических обменов (DAAD) и корпораций «Klockner Pentaplast GmbH», «Mondi Gronau», «Maria Soell». С 2014 по 2016 гг. являлся разработчиком компании «Клекнер Пентапласт Рус». С 2015 года по настоящее время работаю ассистентом, далее старшим преподавателем кафедры систем автоматизированного проектирования и управления СПбГТИ (ТУ). На данных момент являюсь специалистом в области анализа причин возникновения брака и прогнозирования качества на производстве.
Бойцов Сергей Владимирович
Инженер отдела верификации и идентификации диктора Группы ЦРТ
В 2013 году окончил Военмех по направлению "Информатика в телекоммуникациях». В 2015 закончил магистратуру Университета ИТМО по специальности Информатика и вычислительная техника, кафедру Вычислительной техники.
С 2013 года работал в должности специалиста в отделе первичной обработки и пеленгации, компания Специальный Технологический центр. С 2016 в научно-исследовательском департаменте ЦРТ.
Был спикером на таких мероприятиях как Science Slam и Курилка Гутенберга.
Наше жюри
С тем, кто выполнил задание достаточно хорошо, мы проводим беседу по скайпу для определения технического бэкграунда и определения лучших.
Муромцев Дмитрий Ильич
зав. кафедрой информатики и прикладной математики Университета ИТМО, руководитель подразделения Международная лаборатория "Интеллектуальные методы обработки информации и семантические технологии".
Матвеев Юрий Николевич
Главный научный сотрудник научно-исследовательского департамента ЦРТ
зав. кафедрой речевых информационных систем Университета ИТМО, руководитель подразделения Международная лаборатория "Многомодальные биометрические и речевые системы".
Левин Кирилл Евгеньевич
Директор научно-исследовательского департамента ЦРТ
Щемелин Вадим Леонидович
Руководитель отдела научно-исследовательского департамента ЦРТ
Исаев Илья Владимирович
Ассистент кафедры информатики и прикладной математики Университета ИТМО
Программа обучения
1
Современное развитие методов машинного обучения в задачах распознавания речи и компьютерного зрения. Задачи классификации и распознавания. Линейная регрессия, SVM, каскады деревьев, искусственные нейронные сети.
2
Цифровая обработка сигналов
Основы цифровой обработки сигналов, параметризация речевого сигнала, Mel-Frequency Cepstral Coefficients. Методы нормализации и постобработки акустических признаков.
3
Основные задачи распознавания речи. Алгоритм динамической трансформации временной шкалы (DTW), Скрытые Марковские Модели (HMM), задача декодирования временной последовательности наблюдаемых данных, алгоритм Витерби. Акустические модели, token passing algorithm. Искусственные нейронные сети в задачах распознавания речи: fully-connected deep neural networks, reccurent neural networks, long short-term memory.
4
Нормализация и постобработка изображений, histgram normalization, Haar-like features, Scale-invariant feature transform, выделение границ, фильтрация.
5
Основные задачи компьютерного зрения. Метод Виолы — Джонса. Алгоритмы поиска характеристических точек: Active appearance model, Constrained Local Models, каскады регрессоров. Применение нейронных сетей к задачам компьютерного зрения, Convolutional Neural Networks.
6
Автоматическое распознавание речи по губам
Основные задачи. Выделение значимых признаков для изображений губ: Principal component analysis, Linear Discriminant Analysis, "Eigen lips". Нейросетевые методоы выделения значимых признаков: CNN autoencoders, bottleneck-признаки.
7
Автоматическое распознавание речи по губам и голосу
Способы объединения звука и видео: объединение признаков, объединение выходных cлоев нейронных сетей, объединение bottleneck-признаков. Архитектуры нейронных сетей для аудио-визуального распознавания речи.
Отзывы студентов
Программированием занимался еще в школе с 9 класса, в 11 классе участвовал во Всероссийской олимпиаде школьников по программированию (могу сказать, что именно подготовка под руководством Михаила Густокашина заложила базу, которой пользуюсь до сих пор).

После школы я перестал заниматься программированием, и активно вернулся к нему только в 2014 году (алгоритмы, дискретная математика, Python, C++), и с этого момента почти каждый день программировал.
Работа на фрилансе позволяла заниматься активным обучением и развиваться.

В последний год я активно занимался изучением машинного обучения (прошел специализацию на Coursera по ML, курс cs231n по Deep Learning), также работал над задачей классификации и кластеризации текстов (распознанных разговоров). Интересовался распознаванием речи, поэтому очень захотел попасть в Летнюю школу, когда узнал.
О Летней школе узнал из одной из групп в Вконтакте (у меня есть особый "список для чтения" в ВК, состоящий из пабликов по машинному обучению). Не ожидал, что возьмут, так как задачей детектирования объектов никогда не занимался, хотя имел представление о том, какие способы решения существуют.

После школы мне предложили работу в ЦРТ, в октябре я приехал в Питер (я из Москвы), и вот уже 2 недели работаю.

Очень интересно и довольно непросто :)


Владимир Батаев
Я в 2012 году пришёл на Матмех и полюбил математику всей душой. При этом мне также очень понравился курс программирования на C++. По рекомендации преподавателя я вышел на Курсеру, тогда ещё молодую и малоизвестную. Там мне и попался курс по машинному обучению. Машинное обучение оказалось простой, но очень увлекательной идеей, оно непременно станет инструментом будущего!

Я нашёл себе хорошего научного руководителя в ИТМО и поступил туда в магистратуру. Однако вход в среду людей, занимающихся машинным обучением и ИТ вообще, был далеко не гладким. Очень сильно мне помогла интенсивная нагрузка в Computer Science центре, куда я поступил одновременно с магистратурой.

В августе 2017 я увидел в ленте ИТМО объявление о Летней школе машинного обучения. «Условия отбора выглядят суровыми, — думал я, — но попробовать точно стоит». В итоге мне удалось настроить сеть YOLOv2 на детекцию дорожных знаков, что было отборочным заданием — и я был очень рад получить приглашение.

Школа представила нам непростые, но весьма интересные задачи прямиком из рабочего процесса научно-исследовательского департамента ЦРТ. Конечно же, нам дали серию лекций для погружения, что оказалось очень полезным и познавательным для меня, никогда не имевшим дело с обработкой речи.

Сюрпризом стало, что прошедших школу готовы взять на работу в ЦРТ. Для меня это стало настоящим успехом. И теперь я здесь, занимаюсь верификацией диктора, и очень доволен тем, как я стал стремительно впитывать опыт. В скором будущем надеюсь поучаствовать в международной конференции ICASSP 2018.

Смело браться за задачи, заводить новых знакомых, не унывая, искать своё дело — и ты обязательно достигнешь успеха!


Иван Кремнев
Программирование я полюбил еще в детстве. Мне очень нравится тот простор для творчества, который дает программирование. Ты можешь без больших вложений попробовать создать сайт, игру, какую-нибудь полезную программку, ограничен ты только своей фантазией.

О школе я узнал за две недели до старта от своего преподавателя в универе. Мне очень нравится тема машинного обучения, поэтому я попробовал подать заявку и поступить. Все свободное время на следующей неделе я потратил на решение тестового задания и, после прохождения небольшого собеседования, меня взяли на обучение.

2 недели обучения прошли быстро, так как режим был довольно интересный и напряженный. До обеда лекции, потом практика. За эти две недели самыми интересными были последние 3 дня. Нас разделили на команды и дали задачу улучшить систему распознавания, которую мы сделали за предыдущие дни практики. Поскольку времени было очень мало, надо было выбрать, что мы будем изменять в текущей системе и договориться в команде, кто чем будет заниматься. Это был очень интересный опыт, мне очень понравилось.

Антон Митрофанов