10 книг по Big Data на русском языке

Что почитать про анализ больших данных? Собрали подборку лучших книг по Big Data на русском языке, которые стоит изучить.

Революция в аналитике. Билл Фрэнкс

Книга Революция в аналитике

Внедрив технологию big data для обработки данных многие компании и IT-корпорации сделали мощный рывок в бизнесе. Автор книги имеет 20-летний опыт работы с аналитическими проектами в реальном масштабном бизнесе и делится опытом внедрения.

Достоинства:

  • все темы рассматриваются со стратегической точки зрения;
  • практическое руководство по операционной аналитике;
  • охвачено широкий круг вопросов;
  • имеются советы для создания успешного сотрудничества между IT-отделом и аналитическим отделом.

Недостатки:

  • много воды;
  • сплошной текст, книга не имеет никаких схем и картинок.

~120 000 ₽ – средняя зарплата аналитика Big Data в Московском регионе (по данным hh.ru)

Убийственные большие данные. Кэти О’Нил

Книга Убийственные большие данные

Математические алгоритмы давно превратились в мощное оружие для корпораций и государства. При помощи математических приложений страховые компании, банки и другие компании способны отслеживать каждый шаг человека.

Достоинства:

  • множество практических примеров;
  • взгляд на биг дата с моральной точки зрения и вред для обычных людей;
  • книга будет интересна и понятна гуманитариям.

Недостатки:

  • нет технической информации, просто интересное чтиво для расширения кругозора.

Онлайн-курс по Big Data

Теоретический минимум по Big Data. Анналин Ын, Кеннет Су

Книга Теоретический минимум по Big Data

Анализ больших данных – это большой бизнес. Книга обучает основам стремительно развивающейся технологии аналитики и обработки больших данных. В каждой главе рассматривается отдельный алгоритм. Есть примеры их использования на реальных задачах.

Достоинства:

  • наглядные иллюстрации;
  • комментарии, которые позволяют лучше понять тему;
  • хорошо описан теоретический минимум.

Недостатки:

  • слишком поверхностно, без углубления в тему;
  • тем, кто не сталкивался с Большими Данными, будет тяжело воспринимать информацию.

BIG DATA. Вся технология в одной книге. Андреас Вайгенд

Книга BIG DATA. Вся технология в одной книге

Автор убежден, что система Больших Данных несет в себе не только большие риски, но и колоссальные возможности, как для корпораций, так и для обычных людей. Основной вопрос рассмотренный в книге: как при помощи Big Data компании собирают информацию о пользователе, следят за их поведением и определяют его круг интересов.

Достоинства:

  • интересно и полезно для новичков;
  • примеры реальных компаний.

Недостатки:

  • слишком размыто описывается материал;
  • нет технических данных, кодов и алгоритмов.

Основы Data Science и Big Data. Дэви Силен, Арно Мейсман, Мохамед Али

Книга Основы Data Science и Big Data. Python и наука о данных

В каждой главе отдельно описывается один из аспектов анализа и обработки данных системы Data Science. Изучение начинается с основ, далее переходит к освоению алгоритмов, работы с большими массивами данных, анализа и визуализации информации.

Достоинства:

  • книга хорошая для изучения основ;
  • описаны возможности языка Python для работы с данными.

Недостатки:

  • примеры поверхностные, многое остается непонятным;
  • опечатки в тексте;
  • встречаются не соответствия между заголовком раздела и его содержанием;
  • мало практики.

Большие данные. Виктор Майер-Шенбергер, Кеннет Кукьер

Книга Большие данные

В книге рассказывается о стремительном развитии вычислительных методов для новых открытий и прогнозов. Описываются основы big data, и влияние на жизнь обычного человека. Даются рекомендации, как можно обезопасить себя от опасности утери конфиденциальности.

Достоинства:

  • даются общие понятные сведения о Big Data;
  • практические советы по защите конфиденциальности;

Недостатки:

  • информация размазана;
  • примеры повторяются;
  • явно видно поклонение авторами системе Больших Данных, не видит ее явных недостатков.

Укрощение больших данных. Билл Фрэнкс

Книга Укрощение больших данных

Автор является ведущим аналитиком компании TeraData. Подробная информация об элементах системы Больших данных: трендах, методах, тенденциях развития, технологиях, и как это все повлияет на развитие бизнеса и жизнь человека.

Достоинство:

  • подходит для первого знакомства с возможностями аналитики;
  • хорошее введение в тему;
  • легко читается;

Недостатки:

  • методы анализа описаны общими фразами;
  • имеющиеся технические детали не достаточно расписаны для того, чтобы брать и делать.

Big data простым языком. Алексей Благирев, Наталья Хапаева

Книга Big data простым языком

Автор книги пытается донести принципы программирования и создания интерфейсов для управления бизнесом и жизнью человека. Девайсы на телефоне делают его уже не просто средством для связи. При развитии этой системы телефоны могут оказаться намного умнее своего обладателя, не говоря уже о других устройствах, которые постепенно собирают всю информацию жизнедеятельности человека.

Достоинства:

  • материал книги систематизирован и структурирован;
  • чувствуется опыт автора;
  • затрагиваются не только Big Data, но и приближенные темы.
  • интересные выводы.

Spark для профессионалов. Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс

Книга Spark для профессионалов

Авторы рассматривают Spark комплексно и описывают паттерны, которые позволяют выполнить крупномасштабный анализ данных. В книге раскрываются вопросы выявления мошенничества с кредитными картами, рекомендации множества товаров множеству людей, создание моделей оценки финансовых рисков на основе имитации ценных бумаг. Все эти возможности недоступны, если не научится правильно обрабатывать информацию. Именно для этого создана наука о данных.

Достоинства:

  • в книге описываются сложные методы анализа на простых примерах из жизни;
  • краткий справочник, который ответит на многие вопросы обработки массива данных.

Недостатки:

  • не хватает более широкого описания темы;
  • мягкая обложка.

Работа с BigData в облаках. Александр Сенько

Книга Работа с BigData в облаках

Первое издание на русском языке, в котором описывается технология big data простым языком. В нем рассматриваются многие секреты обработки больших данных в облаках на легких примерах. В книге описаны все этапы процесса: от получения исходных данных до сложного анализа. Автор приводит преимущества информационного облака над другими технологиями.

Достоинства:

  • наличие множества иллюстраций для примеров;
  • подробно описываются все этапы работы MS Azure и AWS;
  • хорошо раскрывается работа в облаке и приводится анализ больших данных.

Недостатки:

  • мягкая обложка.

Выводы

  1. Лучшая книга для того, чтобы освоить основы big data: «BIG DATA. Вся технология в одной книге» Андреас Вайгенд, «Укрощение больших данных» Билл Фрэнкс и «Большие данные» Виктор Майер-Шенбергер, Кеннет Кукьер.
  2. Для тех, кто уже знаком с технологией Big Data, чтобы увеличить свой опыт в этой теме рекомендуется прочитать книгу «Spark для профессионалов» Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс.
  3. Для общей информации и ознакомления с темой можно прочитать книги: «Big data простым языком» Алексей Благирев, Наталья Хапаева, «Работа с BigData в облаках» Александр Сенько и «Теоретический минимум по Big Data» Анналин Ын, Кеннет Су.

Делитесь мнениями и хорошими книгами по технологии Big Data не попавшими в эту подборку в комментариях!

Онлайн-курс по Big Data

Оцените статью
Библиотека программиста
Добавить комментарий

  1. Аватар
    Dimon Star

    Для работы с анализом больших данных в первую очередь нужно изучать python и машинное обучение. Именно по этим направлениям нужно читать книги. В этой подборке большинство книг теоретические и подойдут разве что для общего развития и понимая сути технологии.

    Ответить
  2. Аватар
    Антон Головко

    А вообще реально по книгам освоить биг дату и анализ данных с нуля, чтобы устроиться на работу аналитиком? Или нужно какие-то курсы изучать?

    Ответить
    1. Александр Соболев
      Александр Соболев автор

      Я бы вам не советовал надеяться ворваться в Data Science с нуля без особых знаний в смежных областях. Обычно в эту тему подтягиваются мидловые питонисты с хорошим знанием математики.

      Ответить