Категория: Блог
Автор: Иван Марьин

Учимся работать с вакансиями в Big Data | Part 2

 

 

Итак, ключевую роль во внедрении Data Science в компаниях играет фигура data scientist — аналитика Big Data, знакомого со всеми новейшими технологиями и инструментами по добыванию, хранению, обработке и анализу данных. В идеале этот человек должен обладать рядом компетенций:

 

1. Иметь развитую бизнес-интуицию и понимать сферу, в которой они применяют свои технологии. Без этого данные просто ничего не смогут «рассказать», более того — без этого невозможно понять, какие данные брать и откуда. А вот опыт в конкретной сфере приложения Big Data необязателен. Даже если data scientist совершенный новичок, например, в телекоме (а до этого работал для банков) — вполне в его компетенции быстро увидеть сходства и различия в той работе, которую он делал до вас, и в той, которую ему предлагаете вы.


2. Хорошо знать статистику, теорию вероятностей и другие математические дисциплины. Знать — не на уровне «сдал и забыл в вузе», а действительно уметь пользоваться, иметь под рукой. Полученные данные надо приводить к пригодному для анализа виду, а затем анализировать. Совсем хорошо, если есть опыт проведения фундаментальных исследований для больших корпораций, но это уже из области фантастики. Лучшие data scientists планеты с мировым именем — это ученые со степенью даже не в математике, а, например, в биологии или астрофизике.


3. Быть крутым программистом-практиком, уметь эффективно решать практические инженерные задачи. Скажем сразу — с предыдущим пунктом это стыкуется крайне редко. Ведь талантливые программисты обычно рано начинают зарабатывать деньги своим ремеслом и не тратят время на чистую науку. Что проще — натаскать смышленого программиста на математические методы или научить математика программировать? Об этом стоит подумать заранее. В любом случае на данный момент наш data scientist должен быть знаком с основными языками — R (для статистических данных и обработки графиков), SQL (язык структурированных запросов), Python, Java, Scala. Кроме того, data scientist должен понимать проблемы «грязных» данных и знать, как с ними справляться, а на выходе — уметь визуализировать полученные результаты. Неудивительно, что более трети data scientists выходят именно из студентов-программистов.


4. Иметь навык работы в команде и быстрой эффективной коммуникации. Сейчас это называют модным словом «быть agile», что можно приблизительно перевести как «быстрый, живой, с разогнанным мозгом». То есть, data scientist должен быстро и самостоятельно соображать, как именно пригодятся его инструменты в конкретных условиях вашей компании, а также какие дополнительные вещи стоит купить, внедрить, разработать, каких помощников нанять.


5. Data scientist умеет объяснять руководству специфику своей работы, говорить с ними на бизнес-языке, грамотно выставлять сроки и адекватно оценивать риски (как по срокам, так и по бюджетам), доходчиво убеждать, почему стоит потратить деньги на тот или иной инструмент. А также — каким образом, по каким причинам и на какой процент после этого вырастут те или иные бизнес-данные. То есть, он немного предприниматель в рамках большой компании, который сам умеет вести и «продавать» руководству проекты в своей области. Немаловажно, что ему придется разбираться и в том, какие именно бизнес-данные будут являться маркером роста — возможно, совсем не те, о которых думали в компании до него.


6. Настоящий data scientist обязан относиться к данным неформально, в чем-то даже творчески: задавать себе нестандартные вопросы и находить ответы, комбинировать и сопоставлять, принимать неожиданные решения. В каком-то смысле он «хакер» по способу мышления.

Может показаться, что парня, сочетающего в себе все описанные нами пункты, просто не существует в природе. Возможно, так оно и есть, но если человек действительно хорошо умеет хотя бы что-то одно, а в остальном знает хотя бы что-то и, главное, готов быстро обучаться — его уже можно назвать годным кандидатом. Многое зависит и от того, что на данный момент нужно работодателю, насколько далеко он сам продвинулся в своем желании работать с Data Science. Если он готов перестраивать на основе больших данных весь бизнес-процесс и собирается нанять целую Data Science-команду, то отдельные члены этой команды безусловно могут специализироваться на разных аспектах деятельности по внедрению и использованию Data Science. Если же цель — быстро разобраться в том, что именно будет полезно бизнесу в море больших данных, то для начала нанимаемый data scientist должен быть тем самым универсальным парнем. Имеет смысл подготовить для собеседования ряд вопросов, которые позволили бы вам проверить знания кандидата как в области статистики и теории вероятностей, так и в программировании, и в бизнес-процессе. То есть — собеседования стоит проводить втроем-вчетвером. Отнестись к подбору data scientist стоит всерьез — ведь это тот самый человек, который, шутка ли, помогает бизнесу принимать решения. А это, во всех смыслах, дорогого стоит.

В следующей статье мы расскажем о том, где обучают data scientists и вообще откуда они берутся!

https://vk.com/ichar

Читать также Учимся работать с вакансиями в Big Data | Part 1

Читать также Где учат на Data Scientist | Part 3