Как компании могут использовать модели случайных лесов для прогнозов?

Видео: Что такое Алгоритм случайного леса? Random Forest

Содержание

Q:

A:

Компании часто используют модели случайных лесов для прогнозирования процессов машинного обучения. Случайный лес использует несколько деревьев решений для более целостного анализа данного набора данных.

Единое дерево решений работает на основе разделения определенной переменной или переменных в соответствии с бинарным процессом. Например, при оценке наборов данных, связанных с набором автомобилей или транспортных средств, единое дерево решений может сортировать и классифицировать каждое отдельное транспортное средство по весу, разделяя их на тяжелые или легкие транспортные средства.

Случайный лес основан на модели дерева решений и делает ее более сложной. Эксперты говорят о случайных лесах как о представлении «стохастической дискриминации» или метода «стохастического гадания» для данных, применяемых к многомерным пространствам. Стохастическая дискриминация, как правило, позволяет улучшить анализ моделей данных за пределы возможностей единого дерева решений.

По сути, случайный лес создает множество отдельных деревьев решений, работающих с важными переменными с применением определенного набора данных. Одним из ключевых факторов является то, что в случайном лесу набор данных и анализ переменных каждого дерева решений обычно перекрываются. Это важно для модели, потому что модель случайного леса берет усредненные результаты для каждого дерева решений и учитывает их в взвешенном решении. По сути, анализ берет все голоса различных деревьев решений и строит консенсус, чтобы предложить продуктивные и логичные результаты.

Один пример продуктивного использования алгоритма случайного леса доступен на сайте R-blogger, где автор Теджа Кодали приводит пример определения качества вина с помощью таких факторов, как кислотность, сахар, уровень диоксида серы, значение pH и содержание алкоголя. Kodali объясняет, как алгоритм случайного леса использует небольшое случайное подмножество функций для каждого отдельного дерева, а затем использует полученные средние значения.

Имея это в виду, предприятия, желающие использовать алгоритмы случайного лесного машинного обучения для прогнозного моделирования, сначала изолируют прогнозные данные, которые необходимо свести в набор производств, а затем применят их к модели случайного леса с использованием определенного набора обучения. данные. Алгоритмы машинного обучения берут эти обучающие данные и работают с ними, чтобы выйти за пределы ограничений их первоначального программирования. В случае моделей случайных лесов технология учится формировать более сложные прогностические результаты, используя эти отдельные деревья решений для формирования консенсуса по случайным лесам.

Один из способов, которым это может быть применено к бизнесу, состоит в том, чтобы взять различные переменные свойства продукта и использовать случайный лес, чтобы указать потенциальный интерес клиента. Например, если существуют известные факторы заинтересованности клиентов, такие как цвет, размер, долговечность, портативность или что-либо еще, что клиенты проявили интерес, эти атрибуты могут быть введены в наборы данных и проанализированы на основе их собственного уникального влияния на многофакторность. анализ.