Какие тенденции больших данных на горизонте?

Автор: Roger Morrison
Дата создания: 18 Сентябрь 2021
Дата обновления: 1 Июль 2024
Anonim
Большие данные и машинное обучение
Видео: Большие данные и машинное обучение

Содержание


Источник: Имгерман / Dreamstime.com

вынос:

Область больших данных постоянно растет и меняется, но на горизонте есть некоторые основные тенденции.

Большие данные - все еще относительно новая область в науке о данных. Это оказало значительное влияние в мире аналитики, и технологии и платформы больших данных будут продолжать меняться по мере развития технологий. Вот почему так важно понимать будущие тенденции в больших данных, которые будут хорошо видны в ближайшие годы.

В течение последних нескольких лет было много дискуссий о Hadoop и технологиях больших данных, и ИТ-индустрия много спорила о своем будущем. Основная проблема заключалась в том, будут ли Hadoop и большие данные считаться частью основной технологии или же они будут считаться нишевой областью. Как мы видели в прошлом, было много инноваций в технологии, которые никогда не использовались в основной индустрии, а использовались в бункерах для специальных вычислительных целей.

За очень короткий промежуток времени большие данные стали основной технологией. В 2013 и 2014 годах мы увидели, как предприятия предпринимают инициативы по внедрению приложений больших данных в производство. В ранние годы это был только тип POC (подтверждение концепции), когда компании проверяли технологию и ее результаты. Теперь, в 2015 году и в последующие годы, будет много внедрения новых вариантов использования. Большинство из этих вариантов использования будут основаны на аналитике в реальном времени и получении более действенного понимания.


В ближайшие годы мы увидим огромное влияние больших данных практически во всех отраслях. Данные лежат в основе каждого бизнеса, поэтому они должны быть тщательно проанализированы и проанализированы. Большие данные и связанные с ними технологии позволят нам собирать, обрабатывать и анализировать данные, чтобы получить осмысленное представление. Тенденция к большим данным будет продолжать расти и даст нам возможность понять ее ценность, как никогда раньше.

Теперь давайте взглянем на некоторые важные тренды в области больших данных, которые будут хорошо видны в ближайшие годы.

Естественная прогрессия поставщиков Hadoop

Hadoop - это базовая технологическая платформа для обработки больших данных. Однако базовая платформа Hadoop не обеспечивает всех гибких возможностей и преимуществ, необходимых для правильной обработки всех данных, поэтому обработка больших данных на этой базовой платформе Hadoop может быть утомительной и сложной.

В настоящее время существует ряд технологий, связанных с Hadoop, таких как Hive, Pig и многие другие, которые известны как «экосистема Hadoop». Эти технологии основаны на платформе Hadoop и делают обработку больших данных более управляемой. Существуют разные поставщики, такие как Cloudera, MapR, Hortonworks, а также IBM, которые предоставляют технологические стеки Hadoop. Эти технологические платформы построены на базовой платформе Hadoop, но более удобны для пользователя и компактны по своей природе. Они также предоставляют надлежащие пользовательские интерфейсы для работы над различными задачами обработки. Как следствие, компании могут сосредоточиться больше на бизнес-логике, а не на платформах.


Рост этих поставщиков Hadoop продолжится в ближайшие годы, и их предложения окажут большое влияние. Поставщики Hadoop позиционируют себя в качестве поставщиков решений и помогают организациям внедрять свои приложения для работы с большими данными.

Нет ошибок, нет стресса - ваше пошаговое руководство по созданию изменяющего жизнь программного обеспечения без разрушения вашей жизни

Вы не можете улучшить свои навыки программирования, когда никто не заботится о качестве программного обеспечения.

Интеграция больших данных и облака

В современном мире облачные вычисления и связанная с ними инфраструктура неизбежны. С другой стороны, приложения для больших данных быстро растут. Организации внедряют все больше и больше приложений для обработки данных, чтобы лучше понять ценные данные. Как мы знаем, приложения для больших данных работают с огромными объемами данных, и эти данные обрабатываются в кластерной среде. Распределенные вычисления лежат в основе всех приложений для обработки больших данных. Следовательно, инфраструктура распределенных вычислений должна поддерживаться должным образом, чтобы преодолевать сбои, ошибки или любые другие фатальные проблемы. Облачная среда является наиболее подходящей для решения всех этих проблем. Приложения для больших данных могут работать в этой облачной инфраструктуре (состоящей из кластерной среды) и обеспечивать эффективный и непрерывный вывод. Организациям не нужна собственная инфраструктура и ИТ-команда; вместо этого они могут полагаться на облачную инфраструктуру, которая также является экономически эффективной. Поэтому облачная интеграция с большими данными станет мощной силой.

Большие данные и проблемы безопасности

Проблемы безопасности являются серьезной проблемой для всех приложений с большими данными. Как мы знаем, данные - это ключ ко всем приложениям для работы с большими данными, поэтому нам нужно заблаговременно понять угрозы безопасности. Организации работают над приложениями больших данных для анализа структурированных, полуструктурированных и неструктурированных данных, которые дадут им осмысленное понимание и направление бизнеса. Эти ценные данные и их выходные данные являются ключом ко всем бизнес-решениям и, следовательно, должны храниться в секрете внутри организации. К сожалению, не все приложения для работы с большими данными разрабатываются с учетом проблем безопасности. В результате эти приложения с большими данными столкнутся с угрозами безопасности. Поэтому внедрение решений безопасности для приложений с большими данными будет основной задачей в ближайшие годы.

Предложение больших данных в качестве услуги

Все мы были знакомы с моделью SaaS, где приложения работают в облачной среде и пользователи получают к ней доступ как к услуге. Модель оплаты также гибкая, когда пользователи платят только за то, что они используют. Та же концепция будет применяться и к приложениям больших данных. Различные компании, выпускающие большие объемы данных, уже размещают свои приложения в облаке и предлагают его как услугу, а пользователи получают доступ к нему как к услуге и платят за использование. В ближайшие годы все больше информационных компаний будут предлагать большие данные в качестве услуги.

Большие данные и Интернет вещей (IoT)

Интернет вещей (IoT) - последнее модное слово в технологической индустрии. IoT в основном состоит из различных устройств, оснащенных датчиками для сбора данных. Теперь сбор всех этих данных и извлечение значимых результатов является самой большой проблемой. Эти устройства используются повсеместно - дома, в промышленности и даже носимых технологиях - и они собирают значительный объем данных. Эти данные датчиков также являются типом больших данных, поэтому их использование и обработка в большой платформе данных станет большой проблемой для организаций.

Заключение

Большие данные, кажется, здесь, чтобы остаться, и способы, которыми мы обращаемся с ними, продолжат изменяться и расти. Помимо этих пяти тенденций, в ближайшие годы будет еще много проблем и новых тенденций. Облако и IoT будут всегда присутствовать вместе с приложениями для больших данных, и эти технологии в сочетании станут мощным инструментом для анализа данных.