Этой весной сообщество Open Data Science и компания MTS AI делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.
Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:
Закон Ципфа;
TF-IDF;
Word2Vec;
RNN;
CNN;
Transformer.
Это набор инструментов, но конечно мы рассмотрим и задачи — классификации текста, тэггирования, генерации, включая само собой всеми любимый машинный перевод. Каждое занятие будет состоять из лекции и семинара. Полный список тем можно посмотреть на странице курса.
В этом запуске мы посвятим больше времени большим языковым моделям (LLM). Про ChatGPT в наше время не слышал только ленивый, но про него можно рассказать только слухи, поэтому я расскажу об открытых моделях, таких как Llama и Mistral, а на семинаре можно будет поработать с этими моделями.
Также в курсе будет два задания, одно на вышеупомянутый Word2Vec, одно в виде соревнования наподобие тех, что проводят на платформе Kaggle. Оба задания были недавно обновлены и, надеюсь, стали более интересными. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.
Лекции и семинары будут онлайн. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект — это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Проекты прошлых запусков можно найти на сайте ODS.
Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. В этом семестре семинары опять будет вести Салават, за что ему большое спасибо. В этом запуске мы сотрудничаем с тремя вузами: МФТИ, ИТМО и МИСиС. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.
В этом запуске все общение по курсу будет концентрировать в группе в Telegram.
Лекции будут проходить по вторникам в 18:40. Ссылка будет в группе и на странице курса. Первое занятие — 13 февраля, присоединяйтесь!
Надеюсь, я вас заинтересовал, еще раз ссылка на курс.
Источник: habr.com