Байесовский фильтр

Автор: Robert Simon
Дата создания: 24 Июнь 2021
Дата обновления: 1 Июль 2024
Anonim
Ловушка Байеса [Veritasium]
Видео: Ловушка Байеса [Veritasium]

Содержание

Определение - что означает Байесовский фильтр?

Байесовский фильтр - это компьютерная программа, использующая байесовскую логику или байесовский анализ, которые являются синонимами. Он используется для оценки заголовка и содержания и определения того, является ли он нежелательным спамом или электронным эквивалентом обычной или нежелательной почты). Байесовский фильтр лучше всего использовать вместе с антивирусными программами.


Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.

Техопедия объясняет байесовский фильтр

Байесовский фильтр работает с вероятностями появления определенных слов в заголовке или содержимом. Определенные слова указывают на высокую вероятность того, что это спам, например виагра и рефинансирование. Фильтр не запускается, зная вероятность того, что слово указывает на высокую вероятность спама. Пользователи должны вручную идентифицировать как спам. Когда найдены достаточные вхождения слова и они идентифицированы как спам, байесовский фильтр «учится» идентифицировать слово с использованием функций правдоподобия. Это делает то же самое со многими другими словами и фразами. Со временем байесовский фильтр становится все более и более эффективным для выявления спама для конкретного пользователя. Когда вероятность достигает определенного порогового значения, такого как 95 процентов, она идентифицируется как спам и часто перемещается в папку нежелательной почты (а иногда даже удаляется автоматически). Пользователь может периодически просматривать его и решать, удалять его или нет. Кроме того, некоторые спам-программы перемещают его в карантин, где пользователи могут просматривать и анализировать решение программного обеспечения.


Первоначальная «тренировка» часто может быть улучшена, чтобы уменьшить количество ложных срабатываний или ложных отрицательных результатов при обнаружении неправильных суждений. Это позволяет программному байесовскому фильтру адаптироваться к постоянно меняющейся природе спама.

Некоторые спам-фильтры также используют эвристику наряду с байесовским фильтром. Предустановленные правила настраиваются пользователем для дальнейшего повышения точности идентификации как спама. Эти правила могут включать количество вхождений данного слова, исключать или игнорировать нейтральные слова, такие как «the», «a» или «some», или идентифицировать последовательности работ, таких как «Viagra is good for», в противоположность применению вероятности функция для всех четырех отдельных слов.

Спаммеры могут использовать технику, называемую байесовским отравлением, чтобы снизить эффективность фильтров спама с использованием байесовской фильтрации. Некоторые методы включают инъекцию законных из новостей или литературных источников, использование случайных безобидных слов, редко встречающихся в спаме, или даже замену картинками.


Многие клиенты отключают отображение изображений по соображениям безопасности. Таким образом, спам может достигать меньше получателей.

Байесовский фильтр, использующий байесовскую логику, можно использовать для классификации данных любого типа. Медицина, наука и инженерия нашли применение. Интересно, что научные исследователи предполагают, что даже человеческий мозг может использовать методологию Байеса для классификации стимулов и определения специфических поведенческих реакций.