Зачем запускать обучение ML на локальном компьютере, а затем регулярно выполнять на сервере?

Видео: Введение в машинное обучение | Григорий Сапунов, Intento

Содержание

Q:

Зачем запускать обучение машинному обучению (ML) на локальном компьютере, а затем регулярно выполнять на сервере?

A:

Вопрос о том, как структурировать проект машинного обучения и его этапы обучения и тестирования, во многом связан с тем, как мы продвигаемся по «жизненному циклу» ML и переносим программу из среды обучения в среду производства.

Одной из самых простых причин использования описанной выше модели переноса обучения ML на локальную машину и последующего переноса выполнения на серверную систему является преимущество существенного разделения обязанностей. В общем, вы хотите, чтобы тренировочный набор был изолированным, чтобы у вас была четкая картина того, где тренировка начинается и заканчивается, и где начинается тестирование. В этой статье KDNuggets рассказывается о принципе в грубой форме, а также рассматриваются некоторые другие причины для изоляции тренировочных наборов на локальной машине. Еще одно базовое ценностное предложение для этой модели заключается в том, что при наличии наборов обучения и тестирования на самых разных архитектурах вы никогда не будете смущены совместным распределением поездов / тестов!

Еще одно интересное преимущество связано с кибербезопасностью. Эксперты отмечают, что если у вас есть начальные процессы поезда на локальной машине, он не должен быть подключен к Интернету! Это фундаментально расширяет безопасность, «инкубируя» процесс до тех пор, пока он не достигнет производственного мира, где вам необходимо встроить адекватную защиту в модель сервера.

Кроме того, некоторые из этих «изолированных» моделей могут помочь с такими проблемами, как смещение концепции и скрытые минусы - принцип «нестационарности» предупреждает разработчиков, что данные «не остаются неизменными» с течением времени (в зависимости от того, что измеряется) и что для того, чтобы фаза тестирования соответствовала фазе поезда, может потребоваться много возможностей для адаптации. Или, в некоторых случаях, процессы обучения и тестирования смешиваются, создавая путаницу.

Развертывание фазы тестирования на сервере в первый раз может упростить различные модели «черного ящика», в которых вы решаете проблему адаптивности данных. В некоторых случаях это устраняет избыточный процесс размещения заказов на изменение на нескольких платформах.

Кроме того, серверная среда, очевидно, обслуживает в реальном времени или динамические процессы, в которых инженеры захотят получить доступ к моделям передачи данных и кода, которые лучше всего подходят для производства в ML. Например, AWS Lambda может быть привлекательным вариантом для обработки микрофункций производства (или комбинации хранилища объектов Lambda и S3) и без возможности подключения (без сервера), что становится невозможным.

Вот некоторые из вопросов, о которых могут подумать разработчики, когда они решают, как разделить фазы обучения ML от тестирования и производства.