Профилирование данных

Автор: Lewis Jackson
Дата создания: 10 Май 2021
Дата обновления: 25 Июнь 2024
Anonim
Учебный курс QPT. Тема 10: Профилирование
Видео: Учебный курс QPT. Тема 10: Профилирование

Содержание

Определение - что означает профилирование данных?

Профилирование данных - это метод, используемый для проверки данных для различных целей, таких как определение точности и полноты. Этот процесс проверяет источник данных, такой как база данных, чтобы выявить ошибочные области в организации данных. Развертывание этого метода улучшает качество данных.


Профилирование данных также называется обнаружением данных.

Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.

Техопедия объясняет профилирование данных

Профилирование данных - это метод изучения данных, доступных в источнике данных, и сбора статистики и информации об этих данных. Такая статистика помогает определить использование и качество данных метаданных. Этот метод широко используется в корпоративных хранилищах данных.

Профилирование данных проясняет структуру, отношения, содержание и правила получения данных, которые помогают в понимании аномалий в метаданных. Профилирование данных использует различные виды описательной статистики, включая среднее, минимальное, максимальное, процентиль, частоту и другие агрегаты, такие как количество и сумма. Дополнительная информация метаданных, полученная во время профилирования, - это тип данных, длина, дискретные значения, уникальность и распознавание абстрактных типов.