Аналитика больших данных с открытым исходным кодом

Автор: Laura McKinney
Дата создания: 1 Апрель 2021
Дата обновления: 14 Май 2024
Anonim
Потоковая обработка больших данных — эталонная архитектура с … тью и надежностью уровня предприятия
Видео: Потоковая обработка больших данных — эталонная архитектура с … тью и надежностью уровня предприятия

Содержание

Определение - Что означает Open-Source Big Data Analytics?

Под анализом больших данных с открытым исходным кодом понимается использование программного обеспечения и инструментов с открытым исходным кодом для анализа огромных объемов данных с целью сбора актуальной и полезной информации, которую организация может использовать для достижения своих бизнес-целей. Крупнейшим игроком в области анализа больших данных с открытым исходным кодом является Apache Hadoop - это наиболее широко используемая программная библиотека для обработки огромных наборов данных на кластере компьютеров с использованием распределенного процесса для параллелизма.


Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.

Techopedia объясняет аналитику больших данных с открытым исходным кодом

Аналитика больших данных с открытым исходным кодом использует программное обеспечение и инструменты с открытым исходным кодом для выполнения аналитики больших данных с использованием либо всей программной платформы, либо различных инструментов с открытым исходным кодом для различных задач в процессе анализа данных. Apache Hadoop - самая известная система для анализа больших данных, но для создания реальной аналитической системы требуются другие компоненты.

Hadoop - это реализация алгоритма MapReduce с открытым исходным кодом, впервые внедренная Google и Yahoo, поэтому сегодня она является основой большинства аналитических систем. Многие инструменты для анализа больших данных используют открытый исходный код, включая надежные системы баз данных, такие как MongoDB с открытым исходным кодом, сложную и масштабируемую базу данных NoSQL, очень подходящую для приложений больших данных, а также для других.


Услуги по анализу больших данных с открытым исходным кодом включают в себя:

  • Система сбора данных
  • Центр управления для администрирования и мониторинга кластеров
  • Библиотека машинного обучения и интеллектуального анализа данных
  • Служба координации приложений
  • Вычислить двигатель
  • Рамки исполнения