Должность: ученый данных

Автор: Roger Morrison
Дата создания: 28 Сентябрь 2021
Дата обновления: 11 Май 2024
Anonim
Наука - всё? За что арестовывают учёных? Кто переписывает историю? Кому теперь нельзя читать лекции?
Видео: Наука - всё? За что арестовывают учёных? Кто переписывает историю? Кому теперь нельзя читать лекции?

Содержание


Источник: Сергей Хакимуллин / iStockphoto

вынос:

Специалисты по обработке данных имеют широкий спектр задач, которые значительно различаются в зависимости от приложения. Но их объединяет общее стремление эффективно использовать данные.

Что делает ученый в области искусственного интеллекта и машинного обучения? Многие профессионалы, которые занимаются такими проектами каждый день, скажут, что на этот вопрос сложно ответить просто. Лучше было бы задать вопрос: что НЕ делают ученые, занимающиеся данными?

Специалист по данным является неотъемлемой частью процесса ИИ или ОД в том смысле, что все эти проекты зависят от больших данных или сложных входных данных. Специалист по данным - важный специалист по карьере, который знает, как работать с данными для получения результатов.

Тем не менее, есть несколько способов рассказать о том, что делает ученый, какие квалификации ему или ей нужны, и какова его или ее роль в этом процессе.

Читать: 6 ключевых понятий науки о данных, которые вы можете освоить с помощью онлайн-обучения


Различные определения, различные обязанности

Многие эксперты, которые описывают работу ученого, говорят об этом в широком смысле.

«В небольших компаниях или при работе на новом рынке роль ученого в данных заключается в том, чтобы преобразовать относительно новые (но очевидные) источники данных в материал, который решает проблему для конечного пользователя, что ранее было бы невозможно. там, где применяемые технологии не существовали », - говорит Антонио Хикс, менеджер по работе с клиентами Mercury Global Partners. «Идеальным кандидатом является тот, кто частично математик, частично разработчик программного обеспечения и частично предприниматель».

Другие повторяют эту основную идею, упоминая, что ученым, занимающимся данными, нужно заниматься проектами моделирования.

«Самым важным атрибутом, который нужен ученому в области данных, является глубокое любопытство к окружающему миру - независимо от того, отвечают ли они на вопросы или строят модели, ключевым является желание понять стоящую перед ними проблему», - говорит Эрин Акинчи, менеджер Data Scientist в асане. «Оттуда большинству людей потребуются навыки математики и программирования, чтобы найти решения, но конкретные виды математики и программирования сильно различаются в зависимости от области знаний в области науки о данных».


Нет ошибок, нет стресса - ваше пошаговое руководство по созданию изменяющего жизнь программного обеспечения без разрушения вашей жизни

Вы не можете улучшить свои навыки программирования, когда никто не заботится о качестве программного обеспечения.

«Отличная научная работа больше связана с тем, как ученый думает о проблеме, чем с инструментами, которые они используют для ее решения», - добавляет Чарли Бургойн, основатель и генеральный директор Valkyrie Intelligence. Valkyrie - это консалтинговая компания, специализирующаяся в области прикладных наук, с впечатляющими проектами под своим крылом, такими как Mark I, специализированное сетевое устройство, которое ускоряет обучение и тестирование нейронных сетей, улучшая возможности, которые возможны с предшествующими облачными платформами машинного обучения.

«Рынок требует от ученых, обладающих знаниями в области разработки на Python, проектирования нейронных сетей и умения преобразовывать хранилище данных в новейшую архитектуру баз данных», - говорит Бургойн. «Однако эти возможности - настольные ставки для талантливого ученого. Что менее очевидно, так это склонность ученого к бесстрашному любопытству, агрессивной изобретательности и приверженности научному методу ».

Навыки Ученого Данных

Таким образом, что касается практических навыков, ученым, занимающимся данными, требуется определенное количество творчества и смекалки в области моделирования. Они также могут извлечь большую пользу из наличия «сложных навыков», таких как опыт написания кода на Python, C ++ или других распространенных языках, применяемых к проектам ML.

«Python и C ++ важны, и способность сочетать навыки кодирования с анализом и обработкой данных, а статистика - это основные навыки, которые позволят ученому выделиться в качестве сильного кандидата или сотрудника», - говорит Вэл Стрейф из Pramp, платформы для онлайн-интервью. для разработчиков программного обеспечения, разработчиков и ученых данных. «Несмотря на то, что некоторые навыки программирования можно было бы решить, соединяя ученого с разработчиком, гораздо проще, если вы объедините оба навыка в одном, с точки зрения компании».

Другие эксперты добавляют в список R, Hadoop, Spark, Sas и Java, а также такие технологии, как Tableau, Hive и MATLAB.

Все это приводит к впечатляющему резюме, но некоторые из тех, кто имеет опыт в подборе данных, говорят, что важна и другая «человеческая» сторона. (Одним из типов исследователей данных является специалист по гражданским данным. Узнайте больше о роли ученых-граждан по данным в мире больших данных.)

«Традиционно люди с разнообразным гуманитарным образованием делают отличных ученых данных», - говорит Бургойн, проводя различие между инженерами, занимающимися строительством, и специалистом по данным, чья работа может быть гораздо более концептуальной. Он продолжает:

Экспертиза в традиционной области STEM с дополнительным акцентом на гуманитарных науках, искусстве или сфере бизнеса дает те качества, которые делают превосходного ученого, ориентированного на отрасль. Надо сказать, что столь же важно для способности организации использовать эти качества и формировать их усердие и методы продуктивным образом. Я заметил, что когда инициатива в области науки о данных не приносит успеха, организация может быть так же виновна, как и ученые. Ученые не инженеры. Их не заставляют выполнять и строить. Они стремятся открывать и понимать. Организации, которые понимают это различие, хорошо вознаграждены за культивирование обоих полей.

Что касается того, к чему обычно применяют ученые, это связано с основными целями компании. Некоторые фирмы гоняются за децентрализованным Интернетом - некоторые играют с IoT или SaaS. Другие пытаются создать «удобный для пользователя», «этический» или «прозрачный» ИИ.

В любом случае, ученые, работающие с данными, вероятно, преодолеют разрыв между жесткими метриками данных, которые они используют, в каком бы технологическом стеке они ни находились, и свободной работой по концептуализации функций AI / ML.

«Мы нанимаем ученых-данных для управления сбором и очисткой данных, а также переводом этих данных в значимую информацию», - говорит Майкл Хапп, менеджер по науке и аналитике данных в G2 Crowd. Он разрабатывает:

Как правило, это означает управление любыми важными алгоритмами, управляющими движком данных компании и беглым владением ключевыми инструментами и языками аналитики, но в последние годы также появились новые области, такие как обработка естественного языка, машинное обучение, другие формы анализа с использованием ИИ. Наиболее успешными учеными в области данных являются те, кто сочетает свои сложные навыки со способностью к быстрому обучению и способностью эффективно обмениваться информацией, которую они раскрывают, чтобы они могли иметь значение для их бизнеса.

Благодаря такому пониманию молодым специалистам или студентам легче выяснить, будет ли для них полезен специалист по данным, и как приобрести навыки. Обучение в STEM становится все более доступным в школах по всей стране, но ничто не заменит страсть к программированию и технологиям, а также способность учиться на лету.