Искусственный интеллект и машинное обучение PRO

Прогресс в обработке естественного языка меняет подходы финансовой отрасли к работе с текстовой информацией.

На программе участников ждут лекции и практические задачи по NLP, командная работа и решение практических кейсов, а также возможность представить результаты на конференции по искусственному интеллекту Data Fusion.
Описание программы
Программа посвящена обработке финансовых новостей и документов с помощью ИИ-моделей. На программе участники проходят теоретическое обучение, а затем получают возможность на практике применить полученные знания для решения практических кейсов от Банка России и ВТБ.
Эффективный анализ и принятие решений в финансовой отрасли опирается на обработку и интерпретацию большого объема источников неструктурированной и структурированной информации.
Поэтому неудивительно, что машинное обучение стало неотъемлемой частью банковской сферы, помогая улучшить эффективность, снизить риски и предоставить более качественное обслуживание клиентов

Машинное обучение помогает решать разнообразные задачи:
  • Поиск событий кредитного риска в новостном потоке
  • Обслуживание клиентов с помощью чат-ботов и виртуальных ассистентов
  • Мониторинг качества обслуживания и навыков сотрудников колл-центра
  • Обработка и подготовка юридически значимых документов по запросам клиентов и государственных органов и пр.
Для кого эта программа?
Программа предназначена для студентов профильных направлений российских вузов и ссузов (аналитика данных, информатика, прикладная математика, программная инженерия, системная инженерия, математическое обеспечение разработки программного обеспечения, экономика и математика и т.п.)

Программа подойдет желающим углубить знания и получить практические навыки по направлениям: обработке естественного языка, деплою и тестированию моделей, созданию ML-сервисов.

Теоретический модуль

Основы NLP
  • Основы предобработки текста.
  • Методы исправления опечаток.
Основы обработки изображений
  • Предобработка изображений (компенсация наклона, удаление шума, повышение контрастности и т.д.).
  • Работа с OCR (EasyOCR, Paddle OCR).
Языковые модели
Знакомство с современными архитектурами языковых моделей.
Извлечение сущностей и отношений
  • Распознавание именованных сущностей (NER).
  • Извлечение отношений (Relation Extraction).
  • Подходы для решения задачи NER и RE.
Саммаризация
Экстрактивные и генеративные модели.
Классификация
  • Работа с энкодерами текста.
  • Методы классификации и кластеризации текстовых коллекций.
Эффективная работа с LLM
  • Работа с генеративными моделями.
  • Знакомство с техниками эффективного дообучения моделей PEFT.
  • Квантизация.
MLOps
  • Работа с контейнерами.
  • FAST API.
  • Подключение БД.
Проектный модуль
В рамках проектной работы участники объединятся в команды с помощью менторов из Банка России и ВТБ решат прикладные задачи:

  1. Извлечение сущностей и отношений из запросов государственных органов
  2. Выделение смысловых блоков из сканов договоров и документов компаний для быстрой навигации
  3. Верификация пресс-релизов рейтинговых агентств
  4. Аналитика и сюжетизация новостного поток
  5. Интеллектуальный поиск по базе знаний и саммаризация результатов
Команде участников практического модуля предстоит презентовать разработанные проекты на конференции DATA FUSION, ежегодной международной конференции по машинному обучению и искусственному интеллекту, посвященной синергии данных и алгоритмов работы с ними.

В конференции принимают участие ведущие эксперты в области Data Science — представители бизнес- и технологических департаментов крупнейших компаний и госорганов, а также известные российские ученые.


Презентация проектов

Как это было в прошлом году

Этапы прохождения программы
01
03
04
05
Регистрация на программу
Теоретический модуль
Подготовка к конференции
Лекции и домашние задания от преподавателей программы (дистанционный формат)
По итогу аттестации лучшим командам предстоит выступить на конференции Data Fusion
12 февраля - 11 марта
Отборочные испытания
02
9 - 17 апреля
До 23 января 2024
06
DATA FUSION
18 апреля 2024
Проектный модуль
18 марта - 8 апреля
Заполнение анкеты
25 января - 2 февраля
Тестирование по машинному обучению

Проектная командная работа над одним из кейсов совместно с менторами (дистанционно с возможностью очных встреч)
Очно в Москве

Об организаторах

Подразделение Департамента финансовых технологий Банка России, которое проводит просветительские и образовательные программы и мероприятия в области финансовых технологий, инноваций в платежах и финансовой кибербезопасности.

Росссийская финансовая группа, включающая более 20 кредитных и финансовых компаний, работающих во всех основных сегментах финансового рынка. Программа подготовлена с участием экспертов команды Департамента анализа данных и моделирования Банка ВТБ.

Фотогалерея