Чем занимается Data Scientist?
Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.
Что вы получите
Больше 16 кейсов в портфолио
Выполните 90 домашних работ с фидбеком эксперта, а также онлайн-лабораторные и тесты
Доступ в профессиональные сообщества
Поможем вам найти единомышленников и будущих коллег
Участие в конкурсах Kaggle
Получите рейтинг на международной конкурсной площадке, подтвердите умение решать задачи в команде в условиях ограниченного времени
Помощь в трудоустройстве
Поможем составить резюме, подготовиться к собеседованию, проконсультируем по релокации
Кому будет полезен курс
Новичкам в Data Science
С нуля овладеете знаниями и навыками, необходимыми для работы Data Scientist, и получите новую востребованную профессию. Получите быстрый старт в Data Science
Разработчикам
Курс даёт хорошую базу для перехода из программирования в Data Science и анализ больших данных. Вас ждёт много практической работы, разбор кейсов и новые полезные знакомства.
Аналитикам
Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов. Освоите новые инструменты и перейдёте на новый уровень в сфере Data Science.
Чему научитесь?
- Работать с SQL
Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов
- Использовать Python и библиотеки
Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, полученные при анализе данных
- Проверять данные и определять проблемы
Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения, генерировать новые значимые признаки
- Обучать многослойные нейронные сети и строить модели машинного обучения
Быстро строить модели и проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных
- Применять математику в алгоритмах
Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями
- Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком
Структурировать результаты, формулировать гипотезы, выявлять потребности, находить области применения машинного обучения
Кому подойдет
- Людям без подготовки в IT
Вы овладеете технической специальностью и начнёте карьеру аналитика в IT, даже если у вас нет глубоких знаний в теории вероятности и статистике. - Начинающим аналитикам
Вы научитесь ставить гипотезы и делать выводы на основе данных, писать эффективный код на Python и R, понимать математику на основе статистики, а также обучать машины и прогнозировать результаты. Отшлифуете имеющиеся знания, увеличите скорость своей работы и добьётесь повышения. - Менеджерам и владельцам бизнеса
Вы автоматизируете рутину, сделаете бизнес-процессы прозрачными, поменяете Excel на продвинутые инструменты анализа.
Чему вы научитесь?
Программировать на Python
Освоите самый популярный язык для работы с данными.
Визуализировать данные
Сможете разрабатывать дашборды и интерактивную инфографику.
Создавать аналитические панели
Разработаете визуальные дашборды с интерактивной инфографикой на фреймворках Shiny и Dash
Работать с библиотеками и базами данных
Научитесь работать с библиотеками Pandas, NumPy и Matpotlib и освоите базы данных PostgreSQL, SQLite3, MongoDB.
Программировать на R
Разберётесь в специфике языка, сможете обрабатывать статические данные и работать с графикой.
Проводить А/B-тестирование
Научитесь проводить эксперименты в маркетинге и оценивать эффект предполагаемых изменений дизайна продукта.
Ваше резюме после обучения
- Владение Python для анализа данных
- Знание языка программирования R и основных библиотек
- Создание аналитических панелей (фреймворки Dash и Shiny)
- Работа с различными источниками данных: CSV, XML и XLS
- Визуализация данных с помощью Matplotlib
- Организация и проведение А/B-тестирования
- Выявление аномалий данных
- Работа с базами данных MongoDB, PostgreSQL, SQLite3 и SQL
Кому подойдет курс Data Science
- Новичкам
Даже если вы никогда не работали в IT, вы получите востребованную и высокооплачиваемую специальность. - Начинающим аналитикам
У вас будет всё для ускоренного карьерного роста: комплексные знания и опыт работы с продвинутыми инструментами, методологиями и стандартами. - Практикующим IT-специалистам
Подскажем, как перейти в востребованное направление и зарабатывать больше.
Что дадут?
- Все необходимые знания
Вы получите все навыки на курсах основного обучения и факультативах от компаний-партнеров. - Помогут оформить резюме
Вы подадите заявку в сервис трудоустройства, а HR-специалисты GeekBrains помогут создать резюме, которое выделит вас среди других кандидатов. - Предложат подходящие вакансии
Будете рассматривать предложенные ими позиции, откликаться на вакансии из раздела «Карьера» и участвовать в поиске идеального места работы. - Помогут пройти собеседования
Дадут советы по прохождению собеседования
Поддержка курса
- Преподаватели
Погрузят вас в новую сферу, поделятся знаниями и практическим опытом, ответят на вопросы по теме занятий. - Куратор
Сотрудник онлайн школы GeekBrains, который будет сопровождать вас на протяжении всего обучения. Поможет преодолеть трудности и достичь образовательной цели. - Ревьюер
Эксперт-практик, который проверит ваши домашние работы и даст подробную обратную связь. - Специалисты техподдержки
Возьмут на себя все технические вопросы по работе платформы и продлят дедлайн при необходимости. - Наставники
Студенты GeekBrains, которые уже прошли ваш путь. Поделятся опытом, помогут адаптироваться и погрузиться в процесс обучения. - Чат с одногруппниками
Здесь вы станете частью комьюнити GeekBrains, познакомитесь с единомышленниками и обменяетесь опытом.
Ваше резюме после обучения
- Владею методами машинного обучения
- Использую в работе методы прикладной статистики и теории вероятностей
- Умею обрабатывать большие данные с помощью разных технологий (Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming)
- Владею SQL и NoSQL СУБД
- Работаю с BI-системами (Power BI), формирую отчёты анализа данных
- Программирую на Python и работаю с библиотеками для анализа данных (NumPy, Matplotlib, scikit-learn)
Кому подойдет курс
- Людям без подготовки в IT
Вы получите базовые навыки по программированию, аналитике, статистике и математике, которые откроют путь к карьере в Data Science и Machine Learning. Сможете использовать свои знания сразу на практике. - Программистам
Программистам
Вы прокачаете свои знания и навыки в программировании на Python и R. Подтянете математику и умение мыслить как аналитик, использовать алгоритмы машинного обучения для решения бизнес-задач — и усилите портфолио мощными проектами. - Менеджерам и владельцам бизнеса
Менеджерам и владельцам бизнеса
Научитесь использовать данные для построения прогнозов и оптимизации бизнес-процессов и переведёте компанию на новый уровень.
Чему вы научитесь на курсе Data Science
- Программировать на Python
Освоите самый популярный язык для работы с данными. - Визуализировать данные
Сможете разрабатывать дашборды или интерактивную инфографику. - Работать с библиотеками и базами данных
Научитесь работать с библиотеками Pandas, NumPy и Matpotlib и освоите базы данных PostgreSQL, SQLite3, MongoDB. - Применять нейронные сети для решения реальных задач
Освоите фреймворки для обучения нейронных сетей Tensorflow и Keras. Узнаете, как устроены нейронные сети для задач компьютерного зрения и лингвистики. - Строить модели машинного обучения
Изучите разные алгоритмы, научитесь решать задачи регрессии, классификации и кластеризации. - Создавать рекомендательные системы
Построите рекомендательную систему и добавите её в своё портфолио.
Преподаватели
- Валентин Пановский
Chief Data Scientist в Skillbox. Блоки «Аналитика и машинное обучение. Начальный уровень» - Михаил Овчинников
Главный методист технического направления Skillbox - Алла Тамбовцева
Преподаватель НИУ ВШЭ - Александр Джумурат
Руководитель команды разработки рекомендательной системы в ivi.ru - Дмитрий Коробченко
Deep Learning R&D инженер и менеджер в NVIDIA. Блок «Машинное обучение. Средний уровень» - Алексей Мастов
Deep Learning инженер в NVIDIA. Блок «Машинное обучение. Средний уровень» - Лидия Храмова
Team Lead Data Scientist группы бизнес-моделирования в QIWI. Блок «Статистика и теория вероятностей» - Артемий Козырь
Старший аналитик данных Wheely. Блок «Аналитика. Начальный уровень» - Андрей Мещеряков
Data Scientist в EPAM. Блок «Аналитика. Начальный уровень» - Роман Булгаков
Преподаватель информатики и программирования по специализации Python со стажем 5 лет
Ваше резюме после обучения на курсе
- Владение Python для машинного обучения
- Применение алгоритмов машинного обучения
- Работа с различными источниками данных: CSV, XML и XLS
- Написание рекомендательных систем
- Работа с базами данных MongoDB, PostgreSQL, SQLite3 и SQL
- Работа с нейронными сетями
- Работа с библиотеками pandas, numpy, matplotlib
Кому подойдет этот курс
- Людям без опыта в IT
Вы получите базовые навыки по программированию, аналитике, статистике и математике, которые откроют путь к карьере в Data Science и Machine Learning. Сможете использовать свои знания сразу на практике. - Программистам
Вы прокачаете свои знания и навыки в программировании на Python и R. Подтянете математику и умение мыслить как аналитик, использовать алгоритмы машинного обучения для решения бизнес-задач — и усилите портфолио мощными проектами. - Начинающим аналитикам
Вы научитесь ставить гипотезы и делать выводы на основе данных, писать эффективный код на Python и R, превращать сырые данные в полезную информацию для компании, понимать математику на основе статистики, а также обучать машины и прогнозировать результаты. Отшлифуете знания, увеличите скорость своей работы и добьётесь повышения.
Ваше резюме после прохождения обучения
- Владение Python для анализа данных и машинного обучения
- Работа с различными источниками данных: CSV, XML и XLS
- Знание языка программирования R и основных библиотек
- Создание аналитических панелей (фреймворки Dash и Shiny
- Применение алгоритмов машинного обучения
- Работа с базами данных MongoDB, PostgreSQL, SQLite3 и SQL
- Организация и проведение А/B-тестирования
- Написание рекомендательных систем
- Работа с нейронными сетями
Кем вы сможете работать после обучения
- Data Engineer
- Инженер дата-центра
- DWH-аналитик
- Data Science
- Инженер пайплайнов данных для машинного обучения (ML Engineer)
Кому подойдет курс
- Всем, кому интересно работать с данными.
Вы научитесь обрабатывать самые разные источники и форматы данных, освоите обработку больших массивов данных (Big Data) на распределенных системах, максимизируйте пользу, извлекаемую из данных. - Начинающим аналитикам и разработчикам.
У вас будет всё для ускоренного карьерного роста: комплексные знания и опыт работы с продвинутыми инструментами, методологиями и стандартами. Прокачайте свои навыки для выхода на новый уровень. - Практикующим IT-специалистам.
Рассмотрим знакомые темы с новых углов, приумножим имеющиеся знания, подскажем, как перейти в востребованное направление и зарабатывать больше.
Преимущества курса
Даём обратную связь
Обучение на 70% состоит из вебинаров: преподаватели разбирают практические задания, отвечают на вопросы и делятся кейсами. Все вебинары можно пересмотреть в записи.
Постоянно обновляем программу
Вы получаете актуальные навыки и знания: программа учитывает требования работодателей по компетенциям дата-инженера.
Сопровождаем на всех этапах
Менеджеры школы GeekBrains помогают записаться на курс, освоиться в личном кабинете и решить технические проблемы. Если попалось сложное задание, можете обратиться за помощью к личному наставнику.
Программа обучения курса
Научитесь собирать и обрабатывать данные, проектировать хранилища и витрины, работать с инфраструктурой и с современными фреймворками обработки данных.
Длительность курса по Data Science:
- 141 час обучающего контента
- 279 часов практики
- 2-3 вебинара в неделю
Ваши будущие компетенции
- Разработка, поддержка и оптимизация пайплайнов обработки данных и машинного обучения на Python и Spark
- Проработка архитектуры разрабатываемых решений
- Опыт проектирования аналитических систем хранения и обработки больших данных
- Знание принципов работы БД (SQL/noSQL) и методологий моделирования
- Опыт работы с Airflow и другими инструментами для запуска регулярных задач
- Опыт с Devops (Docker, Kubernetes) инструментами
- Понимание принципов машинного обучения и подготовки данных для ML-приложений
- Опыт работы с ОС Linux
- Сбор процессов очистки и валидации данных
- Опыт работы с ETL-инструментами и сервисами
- Опыт работы с пакетной и потоковой выгрузкой данных в аналитическое хранилище
- Разработка витрин данных для бизнес-пользователей аналитики
- Опыт работы с Hadoop кластером и HDFS, мониторинг своих приложений
Образование поможет вам
- Перейти в профессию в области Data Science с высоким окладом, которая не устареет через 10 лет
Положите начало своему развитию в востребованной во всех отраслях бизнеса профессии - Освоить ключевые технологии и опередить запрос рынка
Станете востребованным специалистом сразу после обучения и не растеряете накопленные знания и навыки - Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science
Получите знания в концентрированном формате и с обратной связью от экспертов-практиков ведущих компаний
Что вы получите на курсе
Больше 10 кейсов в портфолио
Выполните 80 домашних работ с фидбеком эксперта, а также онлайн-лабораторные и тесты
Доступ в профессиональные сообщества
Поможем вам найти единомышленников и будущих коллег
Помощь в трудоустройстве
Поможем составить резюме, подготовиться к собеседованию, проконсультируем по релокации
Чему научитесь
- Работать SQL
Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов - Использовать Python и библиотеки
Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, сделанные на основании данных - Проверять данные и определять проблемы
Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения, генерировать новые значимые признаки - Строить модели машинного обучения
Быстро строить модели и проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных - Применять математику
Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями - Лидировать Data Science проект
Структурировать результаты, формулировать гипотезы, выявлять потребности, находить области применения машинного обучения
Программа обучения
Часть 1. Получение и подготовка данных (SQL и Python)
Программа построена от простого к сложному. Первый модуль научит вас понимать, где взять данные, и находить между ними связи.
Узнаете, как писать SQL запросы, чтобы получать данные из хранилищ — и не тратить время разработчиков или администраторов на поиск информации.
Научитесь быстро создавать материалы исследований, чтобы получать инсайты для принятия решений. Познакомитесь с основами статистических проверок гипотез — чтобы больше ни один вывод не был сделан «потому что так было всегда» или «так кажется».
Часть 2. Обработка данных и создание признаков для моделей (Feature Engineering)
Научитесь проверять данные на полноту, целостность, наличие шумов, ошибок, выбросов и пропусков и работать с проблемами, делая качество предсказаний достаточным для принятия решений. Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения и экономить время заказчика.
Строить деревья решений, модель логистической регрессии, использовать Random Forest в задачах классификации, строить линейную и полиномиальную регрессию — одним словом, знать где применять и что ожидать от работающих и математически обоснованных методов решения бизнес-задач.
Часть 3. Суперсила: машинное обучение для 5 ключевых областей применения
В этом модуле вы научитесь строить рекомендательную систему, чтобы решить проблему нехватки данных, возвращать клиентов и увеличивать средний чек.
Решать задачу распознавания и преобразования изображений, чтобы узнавать наиболее привлекательные товары на полках.
Выделять признаки для анализа изображений: лиц, почерка, особенностей предметов, чтобы конвертировать рукописный текст в электронный или узнавать постоянных покупателей.
Обучать нейронную сеть там, где стандартным машинным обучением уже не обойтись.
Что вы получите
- Кейсы
Вы будете практиковаться на реальных бизнес-задачах. Самостоятельно напишете и обучите модели разной сложности: от линейных регрессий и классификаторов до гибридных рекомендательных систем или моделей с использованием нейронных сетей. Выведете вашу модель в Production с помощью написания сервиса на Flask. - Уроки
Уроки помогут закрепить на практике теоретический материал и отработать в нюансах подходы к решению задач машинного и глубинного обучения. Вы наработаете навыки машинного обучения, построите рекомендательную систему с использованием алгоритмов и научитесь работать с временными рядами. - Soft Skills
Перевод технических задач на понятный бизнесу язык. Постановка задач и их декомпозиция. Навыки эффективных коммуникаций с заказчиками и стейкхолдерами. Управление проектом в Data Science.
Что вас ждет во время обучения
- Эксперты и поддержка
Команда экспертов в Data Science проверяет и комментирует ваши работы, помогает разобраться в сложностях и обучает собственным профессиональным приёмам. - Сообщество студентов
Вы будете учиться в группе таких же новичков, как и вы, давать друг другу обратную связь на ваши проекты, обмениваться кодом, помогать искать ошибки и делиться бизнес-задачами. - Помощь тьютора
Начиная с первых недель обучения тьютор поможет вам определить карьерные цели, а в течение программы — не сойти с намеченного пути. - Карьерный центр
Карьерный центр поможет вам оформить резюме и начать проходить собеседования.
Ваше резюме
- Использую основные алгоритмические конструкции и структуры данных Python для проектирования алгоритмов
- Умею получать данные из веб-источников или по API
- Умею визуализировать данные с помощью Pandas, Matplotlib
- Умею создавать модели с помощью классического машинного и глубокого обучения для решения задач Data Science
- Умею оценивать качество модели вне зависимости от задачи
- Применяю методы математического анализа, линейной алгебры, статистики и теории вероятности для обработки данных
- Строю математические и ML-модели с использованием временных рядов
- Применяю алгоритмы для рекомендательных систем (от ассоциативных правил до advanced-алгоритмов)
- Специализируюсь на в ML/CV/NLP-инженерии (в зависимости от выбранной специализации), применяю современные продвинутые модели для решения соответствующих задач
- Умею конвертировать бизнес-задачи в технические и наоборот
- Умею выводить и поддерживать модели в Production с учетом специфики выбранной специализации
- Обладаю дополнительными компетенциями в зависимости от выбранного майнора (продвинутый SQL, продвинутый Python, Reinforcement Learning или Data Engineering)
Кому подойдет курс
- Тем, кто интересуется Data Science
Вы узнаете математические основы Machine Learning, поймёте, для чего нужна математика в машинном обучении и сделаете первый шаг к карьере в Data Science. - Начинающим специалистам
Вы научитесь работать со сложными математическими функциями, узнаете больше об основах Machine Learning, сможете быстро решать задачи с помощью Python и повысите свой уровень.
Чему вы научитесь
- Понимать математические термины
Усвоите основную терминологию, сможете читать сложные статьи по Data Science и получать новые знания без постоянных обращений к поисковику. - Работать с формулами и функциями
Перестанете бояться переменных и функций и сможете с их помощью решать практические задачи. - Разбираться в основах машинного обучения
Изучите математические основы Machine Learning и узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения. - Описывать прикладные задачи на языке математики
Сможете сформулировать практическую задачу с помощью математических формул. - Автоматизировать решение задач
Узнаете, как использовать Python для решения сложных математических задач.
Преподаватели курса
- Николай Герасименко
Data Scientist в Сбербанке, математик в ВЦ РАН. Блок «Основы математики для Data Science»
Опыт преподавания высшей математики более 4 лет. Многократный призёр математических олимпиад. - Вячеслав Архипов
Консультант программы курса, эксперт в Data Science в стартапе Banuba.
Опыт преподавания в ведущем университете Беларуси (БГУ) более 8 лет, автор и ведущий youtube-канала du/dv stud.