Размышления о будущем

Как стать Data Scientist и получить работу!

А вы уверены, что это вам нужно? Ведь работа в роли Data Scientist всего лишь одна из наиболее востребованных профессий в 21 веке. Сейчас об этом не говорит только ленивый. Как же получить эту должность и стать Data Scientist профессионалом?

Спасибо робототехнике, искусственному интеллекту и машинному обучению, которые «отправляют в небытие» множество профессий и рождают новый класс профессионалов, которые умеют из сухих данных извлечь совершенно новые знания и изменить существующие модели ведения бизнеса.

Выбираем правильные навыки

Существует огромное множество технологий и знаний, которыми должен обладата Data Scientist. Если попытаться их сгруппировать, то можно выделить ключевые 10 областей, в которых необходимо постоянно совершенствоваться:
  1. Матчасть. Основы. База, которую многим посчастливилось получить в ВУЗе, освоив прикладную математику и компьютерную инженерию. Постоянно требует обновления;
  2. Статистика. Во всех ее проявлениях, моделях и методах;
  3. Программирование. С этим все понятно, тут даже углубляться не нужно. Паттерны и принципы объектно-ориентированного и функционального программирования нужно знать «как отче наш»;
  4. Машинное обучение. И еще лучше машинное самообучение — построение моделей, результат выполнения которых будет улучшать существующие алгоритмы, а значит и саму модель;
  5. Анализ текстов. NLP (Natural Language Processing). Мы переходим из неструктурированного мира в Digital, в котором мы обязаны принимать решения на базе вероятностных моделей;
  6. Визуализация. Мы живем в мире, в котором видео и инфографика уже обогнали фото и тексты. Необходимо не просто красивое представление, а умение быстро и точно донести свою идею;
  7. Большие Данные. Технологии хранения, параллельной обработки, быстрого поиска и извлечения нужных фактов, и многих других технологических современных подходов к работе с данными;
  8. Извлечение данных. Интеграция с системами, умение «слушать» потоки информации;
  9. Обогащение данных. Трансформация, объединение из разных источников, нормализация;
  10. Технологии и инструменты. Java, Python, R, Hadoop, Spark, ELK и многие другие.

Погружаемся в бизнес контекст

Профессионал должен уверенно чувствовать себя в трех ключевых областях:
  • Уметь программировать;
  • Уметь работать с данными;
  • Понимать бизнес потребности;
Data Scientist должен быть одновременно математиком и экспертом в статистике, программистом и гуру в высоконагруженном программном обеспечении и бизнес-аналитиком, который может «на пальцах» объяснить бизнес-заказчику в чем его проблема и как ее безболезненно и эффективно решить.
Сложно? Никто и не говорил, что самая популярная профессия в скором будущем, будет доступна каждому.
Data Scientist может вырасти, только получая опыт реальных проектов и задач. Разные индустрии требуют разных решений, а разные решения требуют разных методик, их применения и воплощения в жизнь. Чтобы уметь выбрать правильные решения и уметь их эффективно применять, можно посоветовать всем тем, кто собрался развиваться как Аналитик данных, активно участвовать во всевозможных соревнованиях, которые устраиваются в интернет. Например, на Kaggle.com.
Чем более разнообразный опыт вы сможете получить, тем острее будет ваш ум и у вас будет больше возможностей для нестандартного подхода к решению задач.

Что должен помнить работодатель

Несколько советов работодателям и всем тем, кто ищет пока еще редких специалистов для роли Data Scientist:
  • Не бойтесь отсутствия таких специалистов на рынке! Один из важнейших навыков — это отраслевая специализация. Легче освоить инструменты, чем восполнить отраслевой опыт. Ищите тех, кто понимает ваши задачи (и задачи ваших клиентов) и горит желанием узнавать что-то новое;
  • За углом таких специалистов тоже нет! Не ждите, что вы их сможете быстро найти. Не факт, что они будут рядом. Роль Data Scientist позволяет участвовать в проекте на расстоянии. Digital технологии не только меняют работу наших клиентов, но и наши подходы к выполнению проектов. Пользуйтесь этим;
  • Дорого нанимать? — готовьте своих! Не бойтесь обучать. Принимайте как должное, что ваши ученики могут от вас уйти. Продолжайте обучать. Если вы не будете останавливаться, то у вас всегда будут нужные вам ресурсы.
Big Data и уж тем более Data Science — новые тренды на нашем рынке.
Специалистов не так много, но бурный рост технологий и быстрого проникновения и развития индустрии анализа данных во всем мире, а также все большего появления числа доступных для обучения ресурсов, подтверждают только одно — роль Data Scientist уверенно занимает позицию одной из наиболее востребованных.
Вопрос: А вы приготовились к будущему? Готовы стать новым Data Scientist профессионалом?