Наука о данных или машинное обучение? Вот как определить разницу

Видео: Искусственный интеллект (AI) vs Машинное обучение (ML) vs Нейронные сети (DL). В чем разница?

Содержание

Наука о данных и машинное обучение: широкая и узкая терминология
Наборы навыков по науке и машинному обучению
Нет ошибок, нет стресса - ваше пошаговое руководство по созданию изменяющего жизнь программного обеспечения без разрушения вашей жизни
Как определить машинное обучение
Две передовые дисциплины

Источник: Эльнур / Dreamstime.com

вынос:

Наука о данных и машинное обучение различны в ключевых отношениях. В некотором смысле одно можно рассматривать как подмножество другого. Оба важны в текущем ИТ-прогрессе.

В этом новом мире искусственного интеллекта и управления данными легко запутаться в некоторых терминах, наиболее часто используемых в мире ИТ.

Например, наука о данных и машинное обучение имеют много общего друг с другом. Неудивительно, что многим людям, имеющим лишь мимолетное знание этих дисциплин, будет трудно понять, чем они отличаются друг от друга.

Вот лучший способ отделить науку о данных от машинного обучения, как принцип и как технологический подход.

Наука о данных и машинное обучение: широкая и узкая терминология

Прежде всего, наука о данных - это действительно широкая, всеобъемлющая категория технологий, охватывающая множество различных типов проектов и творений. (Подробнее о том, что входит в работу по науке о данных, см. Роль работы: Data Scientist.)

Наука о данных - это, по сути, практика работы с большими данными. Он возник как закон Мура, и распространение более эффективных устройств хранения данных привело к тому, что компании и другие стороны собирают огромные объемы данных. Затем платформы и инструменты для работы с большими данными, такие как Hadoop, начали пересматривать вычисления, изменив методы управления данными. Теперь, благодаря облачным технологиям и контейнерам, а также новым моделям, большие данные стали основной движущей силой нашей работы и жизни.

В своей простейшей форме наука о данных - это способ управления этими данными, начиная с очистки и уточнения их и заканчивая их использованием в форме инсайтов.

Определение машинного обучения гораздо уже. В машинном обучении технологии берут данные и используют их с помощью алгоритмов, чтобы имитировать когнитивные процессы человека, описанные как «обучение». Другими словами, взяв данные и обучив их, компьютер способен обеспечить свои собственные результаты. где технология, кажется, извлекла уроки из процессов, которые создают программисты.

Наборы навыков по науке и машинному обучению

Еще один способ противопоставить науку о данных и машинное обучение - взглянуть на различные навыки, которые наиболее ценны для профессионалов в любой из этих областей.

Нет ошибок, нет стресса - ваше пошаговое руководство по созданию изменяющего жизнь программного обеспечения без разрушения вашей жизни

Вы не можете улучшить свои навыки программирования, когда никто не заботится о качестве программного обеспечения.

Существует общее мнение, что специалисты по данным извлекают выгоду из глубоких аналитических и математических навыков, практического опыта работы с технологиями баз данных и знания языков программирования, таких как Python, или других пакетов, которые используются для анализа больших данных.

«Любой, кто заинтересован в создании сильной карьеры в области (науки о данных), должен получить ключевые навыки в трех отделах: аналитика, программирование и знание предметной области», - пишет Срихари Сасикумар из Simplilearn. «Пройдя еще один уровень глубже, следующие навыки помогут вам занять нишу в качестве специалиста по данным: глубокие знания Python, SAS, R (и) Scala, практический опыт кодирования баз данных SQL, способность работать с неструктурированными данными из различные источники, такие как видео и социальные сети, понимают множество аналитических функций (и) знание машинного обучения ».

Что касается машинного обучения, эксперты часто ссылаются на навыки моделирования данных, знания вероятностей и статистики, а также навыки программирования в качестве полезных инструментов в наборе инструментов для машинного обучения.

Как определить машинное обучение

Ключевым моментом здесь является то, что всевозможные вещи включают в себя работу с данными, но это не машинное обучение, если у вас не установлен очень строгий режим, помогающий компьютеру учиться на его входах.

Когда это происходит, это делает некоторые удивительно способные системы, которые могут иметь широкий спектр влияния на нашу жизнь.

«Многое из того, что мы делаем с машинным обучением, происходит под поверхностью», - сказал основатель Amazon Джефф Безос, указав на некоторые применения этих типов систем. «Машинное обучение стимулирует наши алгоритмы прогнозирования спроса, ранжирования поиска товаров, рекомендаций по продуктам и предложениям, размещения товаров, обнаружения мошенничества, переводов и многого другого. Хотя влияние машинного обучения будет менее заметным, оно будет такого рода - незаметно, но значительно улучшит основные операции ».

Одним из наиболее полезных примеров здесь является появление нейронной сети - это распространенный и популярный метод настройки процессов машинного обучения.

В своей основной форме нейронная сеть состоит из слоев искусственных нейронов. Каждый отдельный искусственный нейрон имеет функциональность, эквивалентную биологическому нейрону, но вместо синапсов и дендритов у него есть входы, функция активации и возможные выходы.

Нейронная сеть создана для того, чтобы действовать как человеческий мозг, и специалисты по машинному обучению часто используют эту модель для получения результатов машинного обучения.

Однако это не единственный способ сделать машинное обучение. Некоторые более элементарные проекты машинного обучения просто включают в себя демонстрацию на компьютере широкого спектра фотографий (или предоставление ему других необработанных данных), внесение идей в процессе использования контролируемого машинного обучения и данных меток, и наличие у компьютера в конечном итоге возможности различать различные формы или предметы в поле зрения. (Для основ на машинном обучении, проверьте Машинное обучение 101.)

Две передовые дисциплины

В заключение, машинное обучение является важной частью науки о данных. Но наука о данных представляет собой более обширную границу и минус, в котором происходит машинное обучение.

В некотором смысле, вы можете сказать, что машинное обучение никогда бы не произошло без больших данных. Однако большие данные сами по себе не создавали машинного обучения - вместо этого, после того, как мы собрали в совокупности так много данных, что мы почти не знали, что с ними делать, высшие умы придумали эти процессы биомоделирования в качестве наддува. предоставления идей.

Здесь также следует помнить, что науку о данных можно применять двумя основными способами: мы можем использовать машинное обучение и искусственный интеллект, позволяя компьютерам думать за нас, или мы можем вернуть науку данных к более ориентированному на человека подходу, где компьютер просто представляет результаты, и мы, как люди, принимаем решения.

Это побуждает некоторых экспертов, в том числе некоторых ведущих мировых новаторов, к более активному учету способов использования этих технологий.

«(ИИ) способен на гораздо большее, чем кто-либо знает, и степень улучшения является экспоненциальной», - цитирует Элон Маск, предупреждая, что программы машинного обучения и ИИ требуют надзора.

В любом случае, как наука о данных, так и машинное обучение являются основными составляющими прогресса, которого мы, общества, делаем сегодня в области технологий.