Fishlake-scripts.ru

Образование и уроки
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Обучение big data

Девять лучших курсов по Big Data для дата-сайентистов и менеджеров

Редактор раздела «Технологии»

Специалисты по большим данным востребованы в ритейле, банковской сфере, E-Commerce и многих других областях. Мы отобрали девять коротких курсов, которые помогут научиться применять навыки и инструменты Big Data в реальных проектах.

Дата-сайентист — одна из самых высокооплачиваемых и востребованных профессий за рубежом и в России. Специальные подразделения для разработки data science-проектов в последние годы открывают многие крупные компании: от «Яндекса» до X5 Retail Group.

В подборку Rusbase вошли самые известные курсы для руководителей таких проектов и их разработчиков — начиная с бесплатных для новичков и заканчивая углубленными программами с акцентом на проекты конкретных отраслей.

Для менеджеров и руководителей:

1. A crash course in Data Science на Coursera

Для кого этот курс: этот курс — первый из пяти курсов группы Executive Data Science («Большие данные для руководителей»), разработанный в университете Джона Хопкинса. Он предназначен для тех, кто хочет быстро разобраться в том, что такое большие данные и где можно их применять.

Слушатели изучат основные термины и инструменты, которые используют дата-аналитики, и способы оценки успешности data science-проектов. Для этого у них будут видеолекции и материалы для самостоятельного изучения. Курс идет на английском, но есть субтитры на русском языке.

Продолжительность: 1 неделя, 4-6 часов.

Даты: курс стартовал 20 августа, но на него еще можно записаться.

Стоимость: первый курс — бесплатно. Для обучения на следующем курсе придется заплатить 2468 рублей за месяц. Этого хватит на все оставшиеся четыре курса — каждый из них длится неделю.

2. Курс Business Analytics в Udacity

Для кого этот курс: для новичков. Здесь они смогут получить навыки анализа больших данных и изучить инструменты, которые помогут в любой области: будь то инженерное дело, продажи, маркетинг или что-то еще. В рамках программы они изучат Excel, SQL и Tableau, и научатся анализировать данные для того, чтобы принимать лучшие стратегические решения.

Программа является подготовительной для двух других курсов Udacity — Data Analyst и Business Analyst Nanodegree programs. Студентам доступны видеолекции, текстовые инструкции и консультации менторов. Обучение ведется на английском.

Продолжительность: 3 месяца, 10 часов в неделю. После окончания программы студентам дается еще около 4 недель (130 часов) на завершение всех проектов.

Даты: запись открывается 21 августа.

Стоимость: 599 долларов (около 40 тысяч рублей).

3.

Data MBA Школы анализа данных

Для кого этот курс: для тех, кто хочет научиться применять инструменты Big Data в зависимости от индустрии и конкретной бизнес-задачи. Среди основных тем: как повысить продажи, управлять лояльностью, рисками, предсказывать эффективность кандидата для HR-менеджеров, делать банковский скоринг и т. д.

Продолжительность: 5 недель, 10 занятий.

Даты: 28 августа.

Стоимость: 100 тысяч рублей.

4.

Курс «Аналитика для руководителей» на «Нетологии»

Для кого этот курс: для коммерческих директоров, директоров по маркетингу, а также руководителей и владельцев бизнеса. В рамках курса они должны научиться исследовать рынок и выявлять тренды, прогнозировать продажи, проводить сегментацию клиентов, а также набирать команду для проектов с использованием больших данных и ставить задачи для разработчиков.

Программа состоит из нескольких блоков: BI аналитика в Tableu (построение дашбордов и интерактивных отчетов), data-driven менеджмент (разработка стратегии улучшения бизнес-процессов на основе этих отчетов), продуктовая аналитика, машинное обучение для бизнеса и др. Лекцию в рамках программы читает директор по маркетингу сервисов компании «Яндекс» Андрей Себрант.

Для дипломной работы потребуется спроектировать аналитическую структуру для своей компании или отдельного продукта/проекта, а также настроить дашборды в BI Tableau Software по ключевым метрикам. После окончания программы обещают помощь в трудоустройстве.

Продолжительность: 8 недель. Занятия проходят офлайн в кампусе Нетологии дважды в неделю по три часа. Видеозапись и материалы после каждого занятия добавляются в личный кабинет участника.

Даты: 23 августа — 14 октября.

Стоимость: 100 тысяч рублей.

Продолжительность: 5 недель, 10 занятий.

Даты: с 28 августа.

Стоимость: 100 тысяч рублей.

5. Курс «Специалист по большим данным 9.0» от «Лаборатории Новых Профессий»

Для кого этот курс: Для разработчиков, аналитиков и продакт-менеджеров. Курс состоит из двух модулей, первый из которых посвящен технологиям больших данных и машинному обучению, а второй – рекомендательным системам для e-commerce, медиа, соцсетей, банкинга и рекламы.

Продолжительность: три месяца. Курс достаточно интенсивный: лекции и мастер-классы проходят три раза в неделю по три часа, для решения лабораторных работ надо еще минимум 5-7 часов в неделю. При желании можно заниматься онлайн.

Даты: 20 сентября — 11 декабря.

Стоимость: 200 тысяч рублей, при оплате в августе — 170 тысяч рублей.

Для разработчиков:

1. Dataquest

Для кого этот курс: для новичков в Data Science — включая тех, кому большие данные необходимы для работы над бизнес-проектами. При выборе программы студент должен определить, насколько ему знаком Python. После этого ему предлагается отнести себя к одной из пяти групп:

  • те, кто хочет работать с Data Science;
  • те, кому большие данные нужны для текущей работы;
  • стартаперы, которые используют большие данные в своем проекте;
  • студенты, которые планируют затем продолжать обучение;
  • просто интересующиеся.

Если знаний Python совсем нет, начинать придется с азов. Программа будет состоять из девяти курсов, в каждом из которых — по 2-3 блока занятий по отдельным темам (каждый блок состоит из 10 уроков). Ближе к середине обучения можно будет потренироваться в разработке data science-проектов с использованием машинного обучения. Обучение ведется на английском.

Читать еще:  Плюсы и минусы прямого обучения

Продолжительность: проходить «квест» можно в своем темпе, отслеживать свой прогресс — на инфографике.

Дата: в любое время.

Стоимость: бесплатно.

2. «Введение в машинное обучение» от «Яндекса» и ВШЭ на Coursera

Для кого этот курс: для тех, кого не пугают слова «матрица», «вектор» и «производная». Для выполнения практических заданий потребуются базовые навыки программирования. Очень желательно знать Python. Задания рассчитаны на использование этого языка и его библиотек numpy, pandas и scikit-learn.

Чтобы успешно завершить курс, нужно набрать проходную сумму баллов за тесты и практические задания, а также выполнить финальный проект, посвящённый решению прикладной задачи анализа данных.

Продолжительность: 7 недель, 3-5 часов в неделю.

Даты: курс стартовал 6 августа, но на него еще можно записаться.

Стоимость: бесплатно, сертификат для подтверждения окончания курса стоит 1835 рублей.

3. «Машинное обучение и анализ данных» от «Яндекса» и МФТИ на Coursera

Для кого этот курс: для дата-сайентистов, которые смогут применять свои навыки в бизнес-проектах. Для обучения им требуются базовые знания математики и основ программирования. Основные темы обучения: современные методы классификации и регрессии, поиск структуры в данных, построение выводов, базовая фундаментальная математика и основы программирования на Python.

В конце программы слушатели должны будут применить свои знания в работе над реальным проектом. На выбор предлагается несколько областей: E-Commerce, социальные медиа, информационный поиск и бизнес-аналитика. Выпускники могут воспользоваться программой трудоустройства «Яндекса».

Продолжительность: все зависит от собственного темпа обучения. В среднем на это надо 3-6 месяцев.

Даты: в любое время.

Стоимость: первые 7 дней — бесплатно, после этого — 5000 рублей в месяц. Можно выбрать не все курсы специализации, а только один.

4. Школа анализа данных

Для кого этот курс: для тех, кто знаком с математической статистикой и имеет навыки программирования на Python. Кроме лекций, в программу входит решение реальных бизнес-задач. Тем, у кого навыков программирования пока нет, разработчики предлагают сначала пройти курс «Введение в Data Science».

Продолжительность: 3,5 месяца. Занятия проходят по будням два раза в неделю с 19.00 до 21.00. Учиться можно онлайн.

Даты: с 3 сентября.

Стоимость: 100 тысяч рублей.

Если вы вспомнили другие российские и зарубежные курсы для дата-сайентистов и менеджеров, пишите о них в комментариях.

Об учебном центре «Школа больших данных»

Школа Больших Данных (ООО «Учебный центр «Коммерсант») – единственный специализированный учебный центр по технологиям Big Data в Москве с государственной лицензией на образовательную деятельность по программам дополнительного профессионального образования. Мы реализуем краткосрочные образовательные курсы повышения квалификации для руководителей, аналитиков, инженеров и администраторов по следующим направлениям:

  • администрирование кластера Big Data – локальные и облачные экосистемы Apache Hadoop (ArenaData, Cloudera, HortonWorks), Apache Spark, Apache Kafka, Apache HBase, Apache NiFi;
  • инженерия больших данных – стек технологий Hadoop, Hive, HBase, Impala, SQL- и NoSQL базы данных, архитектура моделей данных;
  • аналитика больших данных и машинное обучение – Data Mining и Machine Learning средствами R, Python, Microsoft Azure.

Отличные результаты обучения в нашем центре достигаются за счет соответствия всем обязательным требованиям к образовательным организациям:

  • наличие учебно-методической документации по всем образовательным программам направления BigData для руководителей проектов цифровизации, аналитиков, исследователей, администраторов и инженеров больших данных;
  • высокий профессиональный уровень преподавательского состава – с вами будут заниматься кандидаты наук и отраслевые эксперты с 20-летним опытом практики в администрировании кластерных решений, Data Science, Data Mining, Cloud Computing и других технологиях Big Data;
  • партнерство с ведущими разработчиками и вендорами Big Data решений, в частности, c отечественной компанией Arenadata;
  • просторные и удобные учебные классы, расположенные в стационарном офисном помещении, оснащены индивидуальными рабочими местами и современным оборудованием. Также возможен дистанционный формат обучения в режиме интерактивного удаленного взаимодействия или проведение корпоративных курсов на территории заказчика.

Во время обучения вы прослушаете теоретический минимум, чтобы самостоятельно, под руководством опытного преподавателя, выполнять практические задания. Благодаря интенсивной образовательной программе вы получите знания и навыки, необходимые для прикладной работы Data Analyst, Data Scientist, Data Engineer и Administrator Big Data. Для руководителей предусмотрена отдельная программа по ведению проектов цифровой трансформации и эффективному применению технологий Big Data для оптимизации ваших бизнес-процессов. По окончании наших курсов дополнительного профессионального образования вы получите сертификат или удостоверение государственного образца о повышении квалификации и профессиональной переподготовке ИТ-специалиста.

Выбирайте свое направление и обучайтесь! Школа Больших Данных поможет вам стать востребованным ИТ-специалистом и повысить степень цифровизации вашего предприятия.

Big Data, блокчейн, машинное обучение — объясняем термины на ёжиках

Искусственный интеллект и машинное обучение всё чаще используются компаниями в маркетинге. О том, как и для чего они применяются в работе, расскажем в следующих статьях. А чтобы лучше понимать, как устроены эти технологии, мы подготовили для вас тематический словарь с наглядными примерами. Объясняем термины так просто, чтобы и ежу стало понятно.

Искусственный интеллект
Он же ИИ, Artificial Intelligence, AI

Точного определения не существует, совсем как в философии. Всё зависит от того, что именно понимать под словами «разум» и «интеллект». Считать это только свойством людей? Или некоторые животные тоже разумны и обладают интеллектом? В целом, искусственный интеллект — это свойство систем имитировать либо психические процессы человека, либо разумное поведение и возможность совершать выбор.

Читать еще:  Обучение на бизнес тренера дистанционно

Представьте, вы мечтаете завести ежа. Останавливает только аллергия на этих животных. Тогда друзья предлагают купить робоёжика. Он должен уметь воспроизводить поведение настоящего ежа: фыркать, выражая своё недовольство, сворачиваться в клубочек, когда его пытаются погладить, громко топать лапками по ночам, любить хозяина и кусать незнакомых ему людей. Если ваш робоёж умеет всё это, то можете смело говорить, что он обладает искусственным интеллектом.

Большие данные
Они же Big Data

Вроде сразу понятно, большие данные — это много каких-то данных. Но всё не так просто. Для начала, много — это сколько? Три, десять, миллион, миллиард? А чего — мегабайтов, гигабайтов, терабайтов? Насчёт этого нет единого мнения. Кто-то думает, что это когда данные нельзя посчитать на одном компьютере, кто-то — когда ежедневный поток информации превышает 100 Гб в день. Принято считать, что большие данные — это не только сами данные, но ещё и инструменты, подходы и методы обработки информации.

Допустим, есть задание от Гринпис: каждый день считать белобрюхих, ушастых и африканских карликовых ежей, живущих на территории заповедника. Это нужно, чтобы сравнить их количество между собой и посмотреть, не уменьшается ли популяция одного из видов ежей.

Каждый день вы собираете всех ёжиков и распределяете по трём комнатам.

Если в заповеднике 100 ёжиков, задача кажется легкой. С 1000 ежей становится сложнее (не забывайте, они могут выбегать). А если у вас самый большой в мире ежиный заповедник, то вручную животных уже не посчитать — в этот момент они станут большими данными. Вам придётся обзавестись инструментом обработки больших данных — умным автоматическим сортировщиком ежей. Он не только распределит и посчитает животных, но и найдёт новые зависимости, например, сезонные колебания в ежиной популяции.

Блокчейн
От англ. Blockchain

Блокчейн — это не только про криптовалюту! Это технология хранения информации в цепочке блоков. Каждый из блоков содержит данные о всей предыдущей цепочке: известно, что именно хранится в предыдущих блоках, кто и когда создал информацию, переместил её или изменил. Все сведения дублируются на разных компьютерах, возможно, в разных странах. Благодаря этому подделать их просто невозможно.

Представьте, что у вас есть лучший друг — ёж Соник. Прибегает сосед, грозится вызвать полицию и кричит, что у него есть видео, где Соник два дня назад крадёт огромный алмаз, закопанный в саду. Но такого не может быть: весь вечер вы с ежом смотрели сериалы и ели пиццу.

Предположим, все записи с камер наблюдения района хранятся с помощью технологии блокчейн: запись одного дня с одной камеры — один блок, в новом блоке содержится видеозапись нового дня и код-идентификатор предыдущего блока. Полицейский получает доступ ко всем камерам, на которых виден сад соседа. Затем он ищет код с нужной камеры, смотрит на идентификатор видео, где Соник крадёт алмаз и понимает, что видео сфабриковано. Теперь можно дальше счастливо есть пиццу, а сосед будет отрабатывать наказание за клевету!

Машинное обучение
Оно же МО, Machine Learning, ML

Это алгоритмы, обучающиеся самостоятельно или с помощью учителя. Выглядит это примерно так:

  1. Собираются данные.
  2. Делятся примерно в отношении 80/20 для обучения и проверки.
  3. Выбирается модель, подходящая для нашей задачи.
  4. Модель обучается.
  5. Результаты оцениваются и отправляются на доработку при недостаточной точности.

С помощью методов машинного обучения можно научить компьютеры распознавать ёжиков или рисовать их. Ниже расскажем про два разных подхода с конкретными примерами.

1. Градиентный бустинг

От англ. Gradient Boosting

Это способ последовательного построения алгоритмов. Каждый новый алгоритм создаётся, чтобы исправить недостатки предыдущего.

Например, мы придумываем алгоритм, определяющий породу ежей. Для начала смотрим их размеры: большой ёж, средний или маленький. Это наше первое простое дерево решений. Затем ещё несколько:

  • по длине иголок;
  • по основному цвету;
  • по форме ушек.

Далее соединяем все признаки в одно дерево и получаем заготовку, словно мы делаем тест «Какой вы ёжик». Все породы такой тест не покроет, поэтому придётся построить ещё одно дерево с учётом получившейся ошибки. Каждое новое дерево будет уменьшать ошибку и точнее определять породу ежей.

2. Нейронные сети

От англ. Artificial neural network

Это аналог нейронных сетей человеческого мозга. Много маленьких нейронов решают свои простейшие операции. Они взаимосвязаны и вместе выполняют сложные функции.

Предположим, мы много раз сфотографировали и нарисовали ежей, показали компьютеру и сказали: «Смотри, всё это ёжики». Он проанализировал картинки, наложил их друг на друга и выделил признаки ежа. В результате получилось представление — его называют слоем свёртки. Человек, который посмотрит на него, скорее всего, не поймет, почему алгоритм так видит ёжиков. Он увидит только набор пикселей. Такой сверточной нейронной сети теперь можно показать видео из заповедника, а она посчитает, сколько ежей там живет.

Модель машинного обучения
Она же ML model

Это конкретный обученный алгоритм. Модель со своим набором признаков (фич) решает только тот тип задач, для которого была построена. Как ёжик, которого научили ловить определённый вид гусениц.

Фича
От англ. feature — особенность, характеристика, свойство

Это сленговое обозначение признаков, применяющихся в моделях. Помните, мы в градиентном бустинге строили деревья для определения породы ежа? Так вот, форма ушек — это фича. Как и длина иголок.

Читать еще:  Ruby on rails обучение

Если вы хотите подробнее узнать, как устроено машинное обучение, где мы сталкиваемся с ним в жизни и как оно используется в маркетинге, переходите на статью «Вторжение машинного обучения: от заказа такси до персонализации контента».

Курс 20773А: Анализ больших данных (Big Data) с помощью Microsoft R

Бизнес-аналитика

Этот курс в нашем Центре
успешно закончили
3056 человек!

Course 20773A: Analyzing Big Data with Microsoft R

Этот курс предназначен для специалистов, анализирующих огромные наборы данных, а также разработчиков, использующих R в своих проектах.

Цель курса – предоставить слушателям знания и навыки, необходимые для создания и запуска сценариев анализа больших данных на сервере Microsoft R. Также в курсе описано как работать с Microsoft R в средах обработки больших данных как Hadoop, кластер Spark или база SQL Server.

Курс читается на русском языке!

По окончании курса Вы будете уметь:

  • описывать работу Microsoft R;
  • использовать клиента R и Server R для обработки больших данных из разных хранилищ;
  • визуализировать данные с помощью графиков и схем;
  • преобразовывать и очищать наборы больших данных;
  • использовать способы разделения аналитических задач на параллельные задачи;
  • строить и оценивать регрессионные модели, генерируемые на основе больших данных;
  • создавать, оценивать и разворачивать партиционированные модели на основе больших данных;
  • использовать язык R в средах SQL Server и Hadoop.

Специалисты, обладающие этими знаниями и навыками, в настоящее время крайне востребованы. Большинство выпускников наших курсов делают успешную карьеру и пользуются уважением работодателей.

Продолжительность курса — 24 ак. ч.

Отзывы о Центре

Cлушатель: Загер Давид Константинович

Удобство организации учебного процесса от момента заказа курсов до непосредственного обучения. Информационный обмен на высшем уровне. Обратная связь с кураторами и «бумажный» документооборот организованы прекрасно.

Cлушатель: Милованов Антон Михайлович

Предварительная подготовка

Требуемая подготовка: Успешное окончание курса Программирование на языке R. Уровень 1. Базовые знания или эквивалентная подготовка.

Требуемая подготовка: Английский язык. Уровень 2. Elementary, часть 2, или эквивалентная подготовка. Определить уровень владения языком вам поможет тест.

Рекомендуемая подготовка (необязательная): Успешное окончание курса Введение в статистику или эквивалентная подготовка.

Рекомендуемая подготовка (необязательная): Успешное окончание курса М20767С: Разработка и эксплуатация хранилищ данных на SQL Server 2016 или эквивалентная подготовка.

Получить консультацию о необходимой предварительной подготовке по курсу Вы можете у наших менеджеров: +7 (495) 232-32-16.

Наличие предварительной подготовки является залогом Вашего успешного обучения. Предварительная подготовка указывается в виде названия других курсов Центра (Обязательная предварительная подготовка). Вам следует прочитать программу указанного курса и самостоятельно оценить, есть ли у Вас знания и опыт, эквивалентные данной программе. Если Вы обладаете знаниями менее 85-90% рекомендуемого курса, то Вы обязательно должны получить предварительную подготовку. Только после этого Вы сможете качественно обучиться на выбранном курсе.

Рекомендуемые курсы по специальности

Чтобы стать профессионалом, мы рекомендуем Вам вместе с этим курсом изучить:

Курсы по Big Data и анализу больших данных на русском языке

Аналитик Big Data изучает большие массивы данных, которые собирает и хранит компания, чтобы разрабатывать и внедрять продукты, которые повысят эффективность решения задач, увеличат доход или улучшат обслуживание клиентов. Курсы Big Data нацелены на изучение задач и подходов к их решению. Комплексная работа с большими данными включает их анализ, обработку и визуализацию для дальнейшего применения в решении бизнес-задач.

Технологии Big Data применяются в IT, телекоме, финансах, государственном управлении, онлайн-торговле. Инженеры и аналитики больших данных должны уметь разбираться в математике, статистике, информатике, бизнес-процессах. Публикуем курсы по Big Data на русском языке или с русскими субтитрами.

Базы данных (Databases)

Автор: СПбГУ
Платформа: Coursera
Язык: русский
Уровень: продвинутый

Курс Базы данных направлен на изучение и применение языка SQL для создания, модификации объектов баз данных и управления данными в произвольных реляционных базах данных. Рассматриваются этапы проектирования баз данных, составление запросов, методы индексирования. Помимо этого обозреваются основные изменения и тенденции в науке о данных в связи с появлением Big Data.

Продолжительность: 20 часов
Стоимость: бесплатно

Big Data — основы работы с большими массивами данных

Автор: Университет Нетология
Платформа: Нетология
Язык: русский
Уровень: продвинутый

Курс Big Data от Нетологии подойдет тем, кто хочет расширить знания в аналитике. В программе курса обучение сбору, хранению и обработке больших данных, работа в Hadoop и MapReduce. Также обозреваются облачные платформы для анализа и работы с Big Data: AWS, EMR, Azure и другие, рассматриваются основы реализации проектов.

Продолжительность: 39 часов
Стоимость: 27 900 рублей

Managing Big Data with MySQL

Автор: Duke University
Платформа: Coursera
Язык: английский, русские субтитры
Уровень: начальный

Курс Managing Big Data with MySQL в специализацию от Duke University «От Excel до MySQL: способы анализа бизнес-данных» на Coursera и представляет собой введение в использование реляционных баз данных в бизнес-анализе. Вы узнаете, как собирать данные самостоятельно, работать с базами и использовать визуализацию для отображения структуры в данных.

Продолжительность: 24 часа
Стоимость: по подписке Coursera

Managing Data Analysis

Автор: Johns Hopkins University
Платформа: Coursera
Язык: английский, русские субтитры
Уровень: начальный

Курс Managing Data Analysis входит в специализацию «Data science для руководителей» и знакомит с процессом анализа больших данных. Он описывает, как управлять аналитической деятельностью команды, чтобы достигать полезных для компании результатов.

Продолжительность: 7 часов
Стоимость: по подписке Coursera

Ссылка на основную публикацию
Adblock
detector