Искусственный интеллект — один из самых активно растущих секторов IT. Курс поможет войти в мир искусственного интеллекта, станет тем самым «быстрым стартом», который позволит познакомиться со сферой ИИ, а в дальнейшем начать исследования и/или карьеру в этой области.
Введение в машинное обучение
Линейные алгоритмы
Метрики машинного обучения
Алгоритмы машинного обучения. Выбор модели
Нейронные сети: основы
Сверточные нейронные сети
Практика: классификация картинок
Задачи компьютерного зрения
Популярные архитектуры (ResNet), дообучение
Обработка текста, статистики
Эмбеддинги
Рекуррентные нейронные сети
Машинный перевод
Диалоговые системы
Жадный алгоритм
Вероятностный подход
Эмпирические наблюдения
Подкрутка простых решений
Классификация с помощью подсчета статистик
Курс поможет войти в мир программирования на Python. Слушатели познакомятся с базовыми аспектами этого языка для успешного программирования на начальном уровне. Пройдя этот курс, вы узнаете, в каких средах разработки программируют на Python и сможете выбрать для себя наиболее подходящую, разберётесь в работе с контейнерами и списками, узнаете, что такое циклы, множества и словари, поймёте, как реализовать свои функции и классы, как работать с .py и jupyter файлами, а также познакомитесь с некоторыми библиотеками языка Python.
Сценарии работы с языком. Работа в средах jupyter и .py файлах
Установка Python. Установка jupyter lab
Установка anaconda. Установка VSCode
Целые и вещественные числа. Операции с ними
Булевые условия. Условный оператор
Строки и индексация в Python
Списки и методы
Кортежи и их методы
Цикл while и for
Range. Zip. Enumerate
Множества и их методы
Словари и их методы
Функции и их области видимости
Классы. Инкапсуляция, наследование, полиморфизм
Работа с файлами. Менеджер управления контекстом
Декораторы. Атрибуты доступа классов
Написание своего модуля в виде .py файлов. Установка библиотек
Numpy, установка библиотеки иее приемущества. Numpy массивы
Встроенные функции в numpy
Matplotlib, установка библиотеки и примеры использования
17-20 марта 2022
7 задач по математике
3 задачи по программированию
3 задачи по машинному обучению
2 задачи на анализ данных
24 марта - 20 апреля 2022
Обучение пройдет в формате онлайн-лекций и работы над своим проектом. За время интенсивов будет прочитано более 10 лекций. Лекторы курса — преподаватели МФТИ и эксперты крупных IT-компаний. По результатам интенсивов лучшие студенты будут представлять жюри свои проекты.
В этой задаче участникам будет предложено на основе текста поста на медиуме определить его популярность — количество хлопки (claps). Хлопки — это аналог лайков на Medium, которые пользователи ставят посту, если он им понравился. Отличие хлопков от лайков в том, что один пользователь может ставить несколько хлопков к посту, а не только один.
Обучающие данные будут состоять из информации о постах, скачанных из интернета. Для каждого поста будет дан его заголовок, автор, текст и количество хлопков. Тестовые данные будут содержать ту же информацию, только без количества хлопков — этот параметр нужно будет предсказать. Участникам нужно будет обучить модель машинного обучения предсказывать количество хлопков для поста на основе обучающих данных, и в качестве ответа выдать количества хлопков для всех текстов из тестовой части датасета. Метрика оценки качества решения — MAE.
В процессе построения решения можно пользоваться любыми предобученными моделями. Дополнительные наборы данных, не предоставленные в задаче, использовать нельзя. Если вы используете предобученную модель, обязательно указывайте ее источник.
Это задача классического машинного обучения и text processing. Требуется построить алгоритм, который по описанию вакансии с сайта trudvsem.ru будет предсказывать среднюю зарплату, предлагаемую на этой вакансии.
Описание вакансии содержит множество полей: регион, компания, условия труда и социальные бонусы. Решение данной задачи поможет понять, насколько условия вакансии определяют зарплату и какие атрибуты наиболее влияют на размер компенсации.
Для решения задачи участникам будет предложен обучающий датасет в формате .csv, содержащий ~800-900 тысяч строк. В качестве решения нужно будет получить значения целевой переменной для тестовой части датасета. Конкурс будет проходить на платформе kaggle.
Это задача о применении машинного обучения к классической задачи вычислительной квантовой химии. Требуется построить алгоритм, который по трехмерному представлению (конформации) молекулы будет предсказывать энергию.
Описание молекулы содержит типы входящих в неё атомов и соответствующие им трехмерные координаты. Решение данной задачи поможет ускорить и масштабировать квантово-химические расчёты и упростить задачи поиска медицинских препаратов.
Для решения задачи участникам будет предложен обучающий датасет в формате базы данных ASE database, содержащей ~130 тысяч записей. В качестве решения нужно будет получить значения целевой переменной (энергии молекулярной конформации) для тестовой части датасета. Конкурс будет проходить на платформе kaggle.
23 апреля 2022
Зарегистрироваться на сайте Rucode.net
Пройти отборы на интенсивы
Придумать решение одной или нескольких из предложенных задач
Представить свое решение на чемпионате 23 апреля!
По методическим вопросам фестиваля RuCode 5.0
Задача от Deep Learning School