Курс охватывает все аспекты работы с данными — от их сбора и обработки до моделирования и анализа. Участники курса научатся понимать бизнес-задачи, работать с Python, использовать Pandas для обработки данных и осваивать машинное обучение с помощью различных алгоритмов. Программа включает практическое применение SQL и Power BI для анализа данных, а также подробно затрагивает процесс моделирования и оценки эффективности моделей. Курс развивает навыки программирования, работы с базами данных, а также подготовки и очистки данных. К завершению курса студенты будут способны самостоятельно проводить разведочный анализ данных, строить предсказательные модели и интегрировать их с помощью API, обеспечивая мониторинг и оптимизацию работы моделей.
Цель курса
Цель курса – подготовить конкурентоспособных специалистов, способных полноценно работать с данными на профессиональном уровне.
Задача этого курса
Основная задача курса - обеспечить студентам практические и теоретические знания, необходимые для становления квалифицированных Data Scientists, готовых к вызовам современного мира данных.
Результат курса/ Навыки
Онлайн-обучение | Обучение в классе |
|
|
|
|
|
|
|
|
|
|
|
|
Месяц 1 |
Модуль 1 - Введение: принципы работы с данными. Сбор данных. Алгоритмы и функции |
|
Неделя 1-2 |
С чего начинается работа с данными. Business understanding Научитесь общаться с заказчиками: выявлять потребности, собирать и документировать требования, проводить интервью. Data Understanding: Введение и Excel Узнаете, как работать с табличными данными, познакомитесь с базовыми аналитическими и математическими функциями программы. |
|
Неделя 3 |
Алгоритмы Подробнее узнаете о списках в Python, познакомитесь с концепцией big О, которая поможет оценивать сложность алгоритмов. Получите представление о том, как работают бинарный поиск и сортировка. А ещё — освоите несколько полезных приёмов работы со строками. |
|
Неделя 4 |
Функции Узнаете, зачем программисты помещают код в функции. Научитесь принимать параметры и возвращать значения из функций. |
|
Домашнее задание |
Отработка компетенций из теоретического блока. Выполнение тестов по темам модуля для закрепления знаний |
|
Месяц 2 |
Модуль 2 – Сбор данных. Хранение и чтение данных в Python. Основы Git |
|
Неделя 5-6 |
Структуры данных Списки — не единственный способ хранить наборы данных в Python. В модуле вы узнаете о словарях, кортежах, множествах и поймете, для каких задач подходит каждая структура данных. Чтение файлов в Python и командной строке Научитесь открывать и читать файлы с помощью Python, работать в командной строке и подключать сторонние библиотеки. |
|
Неделя 7-8 |
Библиотека pandas Освоите важную для дата-сайентиста библиотеку Pandas, научитесь читать файлы в разных форматах и кодировках. Получение данных с помощью АРІ Узнаете, как получить данные от удаленного сервера при помощи АРІ- запросов, перевести их в нужный формат и сохранить результат в Pandas. Познакомитесь с Git. |
|
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
|
Месяц 3 |
Модуль 3 Машинное обучение и анализ данных: моделирование, постановка задач, выявление закономерностей |
|
Неделя 9-10 |
Modeling Узнаете про основные задачи этапа моделирования в машинном обучении и аналитике. Научитесь формулировать и проверять гипотезы. Машинное обучение Узнаете, как ставится задача машинного обучения, как происходит обучение модели с учителем и без. Будете использовать древесные модели для решения задачи классификации. |
|
Неделя 11-12 |
Линейные модели и нейронные сети Построите простой линейный классификатор и логистическую регрессию, обучите модели на данных, сделаете выводы. Научитесь подгружать готовые нейронные сети и делать на них прогнозы. Метрики в аналитике Познакомитесь с классификациями метрик и научитесь правильно определять их полезность для конкретной задачи бизнеса. |
|
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
|
Месяц 4 |
Модуль 4 Аналитика данных. Основы программирования и работа с данными. Введение в Python для анализа данных |
|
Неделя 13-16 |
Маркетинговая аналитика Узнаете, какие метрики используются в маркетинговой аналитике. Научитесь проводить анализ выручки компании, строить воронку продаж. Продуктовая аналитика Поймёте, в чём отличие метрик продукта от метрик роста, что такое когортный анализ, как он помогает объяснить динамику выручки и предсказать будущее для бизнеса. Введение в Python Поймёте, зачем вообще дата-сайентисту нужен Python. Напишете первую программу. Освоите работу с функцией print. Переменные и типы данных Узнаете, какие типы данных есть в Python, научитесь работать с переменными и оператором ввода input. |
|
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
|
Месяц 5 |
Модуль 5 Инструментарий в Data Science |
|
Неделя 17-18 -19 |
Условия Изучите основы работы с оператором іг, научитесь писать последовательные и вложенные условия, упрощать сложные выражения. Циклы Познакомитесь с циклами for, while, операторами continue и pass. Узнаете, как работать с параметрами функции range(): start, stop, step. Базы данных Научитесь подключаться к базам данных и работать с ER-диаграммами. Язык запросов SQL Освоите язык запросов SQL, будете уметь фильтровать данные, объединять таблицы и выгружать данные в файл. Power BI Познакомитесь с инструментом Power BI, который позволяет использовать любые источники данных для анализа. Научитесь визуализировать данные: строить таблицы, диаграммы, гистограммы. |
|
Неделя 20 |
Data Preparation Узнаете, какие бывают виды распределений, поймёте разницу между дискретными и непрерывными переменными. Разведочный анализ данных: Data cleaning & Data Visualization Научитесь находить пропущенные значения, неинформативные данные, выявлять аномалии и выбросы при помощи визуализации на matplotlib. |
|
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
|
Месяц 6 |
Модуль 6 – Структурирование данных. Моделирование и мониторинг |
|
Неделя 21-22 |
Разведочный анализ данных: Feature Engineering Будете генерировать дополнительные признаки и делать выводы о том, какие атрибуты полезны в построении модели. Modeling: заключение Построите несложные модели машинного обучения в Azure и аналитические в Power BI. Evaluation Научитесь оценивать качество работы модели. Познакомитесь с методиками проверки результатов моделирования в аналитике и машинном обучении. |
|
Неделя 23-24 |
Алгоритмы и структуры данных. Часть 2 Освоите продвинутые структуры данных: очереди, стеки и деки. Deployment Познакомитесь с основными этапами внедрения модели — ETL, подробнее разберете понятия Big Data, Data Lake и Data Warehouse. |
|
Неделя 25-26 |
Модель API Узнаете, как развернуть проект на удалённом сервере и обернуть в API, чтобы отправлять запросы напрямую модели. Мониторинг моделей Научитесь собирать метрики моделей и строить дашборды в Grafana. Airflow Узнаете, как устроены и работают пайплайны. |
|
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
Информация в разработке
Информация в разработке