Александр Борисов про феномен машинного обучения в облаке

Насколько безопасно использовать технологии машинного обучения, какие основные сложности могут возникнуть с машинным обучением в облаке, какие платформы лучше использовать для инструментов ML, а также как в России развивается эта технология - об этом своим мнением с журналом «БИТ. Бизнес & Информационные технологии» поделились эксперты совместно с Александром Борисовым, руководителем направления Data Science RAMAX Group.
«Машинное обучение – это создание «знаний» из данных с использованием алгоритмов определенных классов, способных к обобщению этих данных и извлечению их них прогнозов. «Знания» в этом подходе – это понимание структуры данных во всем имеющемся объеме, и их «свертка» в веса модели машинного обучения. Если на вход обученной модели, например, для распознавания котов на фото, подать аналогичные данные – фото с собакой, то модель выдаст прогноз: на этом фото котов нет.
Таким образом, возможности машинного обучения напрямую связаны с данными, на которых обучалась модель – для описанного примера нам нужна база фото с большим количеством отмеченных на них котов, обычно от нескольких сотен до нескольких тысяч для каждого класса будущего прогноза. Для получения такой базы вам потребуется провести «разметку» каждого фото с помощью специального ПО, и если на каких-то фото кот будет размечен неправильно (например, без хвоста), то это может привести к ошибочным прогнозам модели.
Другой фактор – для обучения модели требуются значительные вычислительные ресурсы, и если у вас их нет под рукой на постоянной основе, то вам на помощь придут облачные ИИ-сервисы, позволяющие временно получить практически любой объем таких ресурсов».
Читать подробнее
Понравилась статья?