Содержание
- Определение - Что означает Open-Source Big Data Analytics?
- Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.
- Techopedia объясняет аналитику больших данных с открытым исходным кодом
Определение - Что означает Open-Source Big Data Analytics?
Под анализом больших данных с открытым исходным кодом понимается использование программного обеспечения и инструментов с открытым исходным кодом для анализа огромных объемов данных с целью сбора актуальной и полезной информации, которую организация может использовать для достижения своих бизнес-целей. Крупнейшим игроком в области анализа больших данных с открытым исходным кодом является Apache Hadoop - это наиболее широко используемая программная библиотека для обработки огромных наборов данных на кластере компьютеров с использованием распределенного процесса для параллелизма.
Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.
Techopedia объясняет аналитику больших данных с открытым исходным кодом
Аналитика больших данных с открытым исходным кодом использует программное обеспечение и инструменты с открытым исходным кодом для выполнения аналитики больших данных с использованием либо всей программной платформы, либо различных инструментов с открытым исходным кодом для различных задач в процессе анализа данных. Apache Hadoop - самая известная система для анализа больших данных, но для создания реальной аналитической системы требуются другие компоненты.
Hadoop - это реализация алгоритма MapReduce с открытым исходным кодом, впервые внедренная Google и Yahoo, поэтому сегодня она является основой большинства аналитических систем. Многие инструменты для анализа больших данных используют открытый исходный код, включая надежные системы баз данных, такие как MongoDB с открытым исходным кодом, сложную и масштабируемую базу данных NoSQL, очень подходящую для приложений больших данных, а также для других.
Услуги по анализу больших данных с открытым исходным кодом включают в себя:
- Система сбора данных
- Центр управления для администрирования и мониторинга кластеров
- Библиотека машинного обучения и интеллектуального анализа данных
- Служба координации приложений
- Вычислить двигатель
- Рамки исполнения