Data Scientists: новые рок-звезды технического мира

Автор: Robert Simon
Дата создания: 24 Июнь 2021
Дата обновления: 1 Июль 2024
Anonim
Data Science - Миллионные зарплаты, нейросети, Илон Маск
Видео: Data Science - Миллионные зарплаты, нейросети, Илон Маск

Содержание


Источник: Онрадио / iStockphoto

вынос:

Роль исследователя данных быстро становится самой востребованной карьерой в мире технологий. Мы спросили главного исследователя данных Джейка Порвея из «Нью-Йорк Таймс» о том, как он получил свою работу, и о его советах для достижения успеха в этой области.

Роль исследователя данных быстро становится самой востребованной карьерой в мире технологий. Такие компании, как Google, Amazon и LinkedIn, используют исследователей данных, чтобы помочь им сохранить это инновационное преимущество в эпоху цифровых данных. И теперь энтузиасты данных и технологий стремятся стать исследователями данных так же, как некоторые музыканты стремятся стать рок-звездами. Возможно, именно поэтому некоторые люди называют исследователей данных новыми рок-звездами эпохи технологий.

К сожалению, эта роль все еще настолько нова, что в ней все еще есть некоторая степень неясности, а это означает, что многие исследователи, работающие с данными, ездят по своим автобусам не по той дороге. Заслуживают ли ученые по изучению данных репутацию рок-звезды? Мы погружаемся в мир науки о данных с интервью с Джейком Порвеем, ученым по данным из исследовательской лаборатории The New York Times.


Ученые Данных: Техники Рок-Звезд?

Так почему же исследователей данных называют новыми рок-звездами мира технологий? Эта аналогия на самом деле идет глубже, чем стремление данных озвучить ультрахолодное. Как и рок-звезда, карьера исследователей данных включает в себя разнообразие, свободу творчества и адаптивность. И, как рок-звезды в мире развлечений, лучшие ученые, работающие с данными, стремятся привлечь большое количество людей из всех областей индустрии данных и технологий.

То, что делает ученый данных, очень разнообразно; Подобно тому, как музыканты используют разные инструменты, инструменты и методы для воспроизведения музыкальных стилей, которые столь же разнородны, как джаз и дэт-метал, ученый также владеет определенным инструментом и областью. Theres стиль вовлечен, тоже. И нет правильного или неправильного способа выполнения работы - речь идет о влиянии работы на других людей.

Когда «Битлз» писали свои песни, не было ни одного человека, диктующего, как играть каждую ноту на каждом инструменте. Они собрались вместе и застряли; благодаря творческому открытию они нашли песни, которые работали. То же самое для ученых данных. Они должны почувствовать ритм, войти в паз и согласовать решение. Это возможно только при наличии достаточного количества художественной свободы, чтобы попробовать любые подходы, инструменты и методы, которые могут прийти на ум в данный момент - и гибкость, чтобы вносить изменения, когда что-то кажется неважным.


Как только специалист по данным овладеет основными принципами, он или она становятся адаптируемыми и обретают уверенность в том, что могут найти решения в других областях. Мы поговорим об этих основных принципах позже. Смысл в том, что когда вы овладеете наукой о данных, вы сможете перейти к любой области, которую захотите, потому что данные есть везде.

Конечная цель ученого данных - создать огромное количество ценности для максимально возможного числа людей. В то время как специалист по обработке данных работает за кулисами, это мало чем отличается от игры для большой аудитории: чем лучше вы выполняете свою работу, тем больше людей вы достигаете - и тем больше вознаграждений вы видите.

Ученые данных делают что?

Так что же конкретно делают ученые-данные? Давайте рассмотрим это на примере, к которому мы все могли бы обратиться.

Нет ошибок, нет стресса - ваше пошаговое руководство по созданию изменяющего жизнь программного обеспечения без разрушения вашей жизни

Вы не можете улучшить свои навыки программирования, когда никто не заботится о качестве программного обеспечения.

Допустим, однажды вы осознаете, что у вас не будет того же количества энергии в тот день, что вы привыкли. Итак, вы поставили перед собой цель: иметь больше энергии в течение дня. Теперь это довольно широкая и неоднозначная цель. Таким образом, первый шаг исследователя данных заключается в устранении этой двусмысленности и количественной оценке измеримости этих целей. Есть способы для этого. Мы не будем вдаваться в подробности, но давайте просто скажем, что вы теоретизируете, что не высыпаетесь, и поэтому ставите себе цель получить восемь часов сна каждую ночь.

Хотя эта цель немного более измерима и менее двусмысленна, у нее есть свои проблемы. Вы не можете запустить таймер, как только заснете, и даже если вы запустите таймер после того, как вы легли спать, вы не можете сразу заснуть. Кроме того, трудно объяснить, когда ты просыпаешься среди ночи. Наконец, существуют различные типы сна, такие как глубокий сон и легкий сон. Суть в том, что трудно точно измерить сон и, следовательно, еще труднее измерить его влияние на уровень вашей энергии.

Так что ты можешь сделать? Ну, как специалист по данным, вы будете искать новейшие технологии и обнаруживать, что существуют устройства для мониторинга сна.И если бы вы использовали такое устройство для измерения и цифровой записи вашего сна, вы могли бы получить более точные данные о вашем сне и со временем собирать эти данные для построения графика.

Одно это может дать вам лучшее понимание того, что происходит. Визуальное представление даст вам осознанность, ясность и направление. Вы сможете увидеть, достигаете ли вы своей цели восьмичасового сна в сутки, и, что более важно, сможете действовать, если это не так.

Это основная работа ученого по обработке данных: предлагать новые способы измерения и отображения данных, чтобы тем, кто смотрит на них, предоставлялось больше осведомленности, ясности и направления.

Но хороший специалист по данным не останавливается на достигнутом. Как только данные собраны, они могут быть интегрированы с любой другой измеренной активностью, которую вы выполняете в течение дня. Интегрируйте его с вашей производительностью на основе данных из вашей системы управления задачами. Интегрируйте его с вашим настроением на основе твитов и обновлений статуса. Интегрируйте это с вашим здоровьем, основанным на посещениях спортзала или потере веса. С количеством уже доступных данных и легкостью, с которой они могут быть получены, возможности безграничны.

Как стать специалистом по данным

Заинтересованы в карьере в науке о данных? Поскольку наука о данных настолько нова, мы попросили одного из ведущих специалистов в области данных изучить эту область. Джейк Портвей (Jake Porway) - специалист по данным в The New York Times и основатель DataKind (первоначально известного как Data Without Borders), который сопоставляет некоммерческие организации, нуждающиеся в науке о данных, с внештатными и бесплатными учеными. Porway имеет опыт работы в области компьютерных наук и докторскую степень. в статистике из UCLA. Вот что он сказал о том, как войти в науку о данных, как хорошо работать и как избежать ключевых ошибок в этой области.

1. Получить правильные навыки

По словам Порвея, выход на поле сводится к трем ключевым моментам:

  • Практические навыки работы с компьютером
  • Статистические навыки
  • Желание учиться

«Вам нужно уметь писать сценарии для очистки данных, а также кодировать алгоритмы, которые вы придумали в своей голове», - говорит Порвей. «Вы должны знать свою базовую статистику (и в идеале больше), если вы действительно хотите оценить, что модели, которые вы создаете, или алгоритмы, которые вы пишете, выполняют то, что вы хотите».

2. Сделать подключения

Перед тем, как присоединиться к научно-исследовательской лаборатории New York Times, Портвей работал в области машинного обучения и компьютерного зрения и проводил много времени за роботами для идентификации наземных мин и летающих самолетов (насколько это круто это?). Только после того, как он получил работу в «Нью-Йорк Таймс», он получил возможность расширяться до более широких задач по науке о данных, а именно Project Cascade, который отслеживает ссылки из публикации в социальных сетях.

По словам Порвея, самое важное, что нужно сделать, - это учиться.

"Получить на проект науки о данных!" Porway говорит. "Загрузите некоторые данные, возьмите немного R и начните играть ... Я бы сказал, чтобы сосредоточиться на использовании чего-то вроде R наряду с базовой книгой статистики, которая поможет вам в изучении некоторых данных. С этим придут навыки машинного обучения и вычислений Конечно, это зависит от вашего прошлого опыта - если вы уже статистик, подберите немного Python!)

Затем пришло время установить некоторые связи. Porway рекомендует местную группу встреч - потому что участие в сообществе по науке о данных - это «самый быстрый способ узнать то, чего вы не знаете». И в области, которая постоянно развивается, это имеет значение.

3. Войдите в игру

Porway имеет докторскую степень в статистике из Калифорнийского университета, но он подчеркивает, что вам не нужно делать хорошую работу.

«Это может помочь, но не думайте, что вы должны уйти и провести еще пять лет в школе, чтобы называться ученым данных», - сказал Портвей.

Наука о данных - это относительно новая область. Это означает, что тем, кто хочет попасть в поле, нужно подходить к нему непредвзято.

«Специалист по данным в Foursquare будет сильно отличаться от специалиста по данным в Goldman Sachs», - говорит Порвей.

4. Рок свою новую роль

Наука о данных - это прояснение целей, изучение предположений, оценка доказательств и оценка выводов. Но есть один маленький кусочек головоломки, который пропускают многие. Сможете угадать, что это? По словам Порвея, секретным ингредиентом является критическое мышление.

«Для меня это действительно отличает хакеров от настоящих ученых», - говорит Порвей. «Вы будете поражены тем, сколько раз я видел, как кто-то строил модель и сообщал о результатах, не осознавая, что он не задумывался критически о том, откуда поступают данные или правильно ли был разработан их эксперимент. Вы должны ДОЛЖНЫ быть в состоянии поставить под сомнение каждый шаг». вашего процесса и каждый номер, который вы придумаете. "

Дорога к большим данным

Порвей говорит, что когда он осознал способность использовать огромные объемы данных, чтобы обучать себя машинам, это взорвало его сознание. Именно эта страсть - и его образование и навыки - помогли ему получить высшую работу в области информационных технологий. Если вы хотите получить большие данные, покопайтесь в книгах, загрузите данные и начните играть. Вы никогда не знаете, какая куча необработанных данных окажется.

Для полной расшифровки стенограммы интервью, перейдите на DataScientists.Net.