Как вырастить ученого данных

Автор: Judy Howell
Дата создания: 26 Июль 2021
Дата обновления: 21 Июнь 2024
Anonim
Наука - всё? За что арестовывают учёных? Кто переписывает историю? Кому теперь нельзя читать лекции?
Видео: Наука - всё? За что арестовывают учёных? Кто переписывает историю? Кому теперь нельзя читать лекции?

Содержание


вынос:

Чтобы воспитать ученых по данным, компаниям необходимо больше сосредоточиться на культуре и организационной структуре.

Среди технологических стартапов ученый данных - это все более распространенный термин, используемый для обозначения фанатов данных, способных соединить традиционно отдельные функциональные области интеллектуального анализа данных. Специалист по данным - это тот, кому удобно выполнять несколько (если не все) аспекты проектов по обработке данных:

  1. Сбор данных: это может повлечь за собой написание пользовательских анализаторов и веб-сканеров или сценариев, предназначенных для конкретных веб-служб или API-интерфейсов для нетрадиционных источников данных.
  2. Управление данными: ETL, манипулирование, запрос и поддержка данных в базах данных, хранилищах значений ключей или Hadoop.
  3. Визуализация информации. Раскрытие шаблонов с помощью статических инструментов визуализации и / или интерактивных платформ на основе Flash, JavaScript или Processing.
  4. Аналитика: это может варьироваться от простых до сложных методов в многомерной статистике, машинном обучении и НЛП.
  5. Понимание: извлечение, обобщение и представление ключевых результатов для широкой аудитории.

Есть много инструментов, навыков и технических деталей, и можно потратить годы на освоение каждого из перечисленных выше предметов. Хотя специалист по данным может не обладать истинными экспертными знаниями ни в одной из областей, ему или ей удобно прыгать туда-сюда и выполнять основные задачи во всех из них. В результате вы получите достаточно шустрый специалист по данным, чтобы быстро исследовать проект данных и получить ответы на вопросы (высокого уровня) от руководства. (Узнайте больше об ученых данных в Data Scientists: Новые рок-звезды технического мира.)


Чтобы воспитать ученых по данным, компаниям необходимо больше сосредоточиться на культуре и организационной структуре. Многие работники, занимающиеся данными, обладают достаточными навыками и обучением, чтобы быстро стать продуктивными во многих областях интеллектуального анализа данных. Проблема заключается в том, что большинство из них не работают в средах, которые побуждают их стать исследователями данных. Они застряли в бункерах и ограничены одной или двумя областями сбора данных. Зачастую они ограничены в использовании инструментов, «одобренных» их менеджерами.

После работы в больших и малых компаниях мне стало ясно, что строгое разделение задач является основным препятствием, с которым сталкиваются исследователи данных. Наиболее распространенным проявлением является разделение между анализом данных и управлением данными. Во многих крупных компаниях большинству аналитиков / статистиков приходится ждать данных от назначенной группы хранилищ данных, и во многих случаях они ждут данных от нескольких владельцев различных хранилищ данных.


Как поощрять науку о данных в организации

На данный момент ученые, занимающиеся данными, процветают в небольших стартапах, интернет-компаниях и других организациях, где меньше внимания уделяется определенным ролям и задачам. Но на самом деле нет причин, по которым крупные и зрелые организации не могут присоединиться к веселью. (Нет никаких причин, почему ваши статистики не могут научиться писать простые веб-скреперы и почему ваши сотрудники базы данных не могут изучить простую статистику и визуализацию.) Вот несколько советов о том, как это сделать:

После того, как вы посвятите себя формированию команды исследователей данных, вы можете начать с определения текущих сотрудников, которые могут соответствовать профилю. Они должны быть непредубежденными, ориентированными на команду и иметь некоторые навыки программирования в одной из областей, описанных выше. В идеале у вас должно быть сочетание людей из компьютерных наук, статистики / количественных или ориентированных на данные. Члены команды должны быть готовы делиться друг с другом простыми инструментами, приемами и приемами. Перекрестное оплодотворение произойдет естественным образом, если члены команды будут в восторге от обучения друг друга. Сотрудники, которые не хотят делиться методами, инструментами и идеями, будут препятствовать прогрессу.

Вы не можете улучшить свои навыки программирования, когда никто не заботится о качестве программного обеспечения.

Как только менеджеры почувствуют, что команда играет с новыми источниками данных, они могут попытаться устранить препятствия («Как насчет целостности данных? Они не используют надлежащие методы машинного обучения / статистики! Экспериментальный дизайн ошибочен! Как они могут объединить это с нашими данными? "). Без политической поддержки ваша команда исследователей данных столкнется с (не) дружественным огнем. Новые вещи, как правило, воспринимаются как угрозы, поэтому лучше всего быстро заверить менеджеров в том, что исследователи данных дополняют то, что они делают. Выводы, раскрытые вашей небольшой командой исследователей данных, могут быть использованы для информирования о более формальных данных / аналитических проектах. Ученые, занимающиеся данными, не собираются устранять необходимость в статистике, но могут указывать на разные наборы данных и вопросы.

Используйте вашу первоначальную команду ученых данных в качестве евангелистов

Если вы правильно выбрали свою первоначальную команду исследователей данных, им будет удобно представить свои выводы другим в вашей компании. Еще лучше, они были бы в восторге от этого! Используйте их, чтобы влиять на то, как остальная часть компании рассматривает интеллектуальные данные, и медленно разрушать эти бункеры.

Я не говорю, что новые учебные и корпоративные инструменты в конечном итоге не понадобятся, поскольку вы формируете собственную команду исследователей данных. Но я думаю, что, обращаясь к культурным и организационным структурам, многие компании могут использовать своих собственных сотрудников вместе с бесплатными инструментами, чтобы создать небольшую команду исследователей данных. Я говорю по своему опыту, работая в крупных компаниях - талант есть, и методы не так сложны в освоении, но организационные трудности трудно преодолеть. Их ряды уже включают в себя группу талантов, готовых сиять, если не для жестких корпоративных структур, которые ограничивают то, что они могут сделать.


Переиздано с разрешения http://practicalquant.blogspot.ca и Ben Lorica. Оригинальную статью можно найти здесь: http://practicalquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html