Инфраструктура управления данными для систем с искусственным интеллектом
Системы, использующие искусственный интеллект, сегодня внедряют многие средние и крупные организации. Логично предположить, что для успешного обучения, применения, дообучения и развития систем на базе ИИ может потребоваться определенный фундамент. О том, какая инфраструктура данных требуется ИИ-системам, внедряемым в организациях, рассказал издательству «Открытые системы» Александр Борисов, руководитель направления Data Science RAMAX Group.
Поскольку точность прогнозов ИИ-систем напрямую связана с данными на «входе», критическое значение приобретают компоненты, обеспечивающие качество данных, мониторинг пайплайнов данных, а также контроль дрифта данных, уверен Александр Борисов, руководитель направления Data Science в RAMAX Group: «Качество данных наиболее важно для систем на основе классических алгоритмов машинного обучения, использующих табличные данные. Мониторинг пайплайнов данных востребован во всех перечисленных типах ИИ-систем, а контроль дрифта данных — для классического машинного обучения и видеоаналитики. Для больших языковых моделей и генеративного ИИ также будут полезны специальные модули безопасности, предотвращающие атаки через запрашиваемые данные (Prompt Injection)».
Насколько масштабные изменения потребуются в имеющейся архитектуре и инфраструктуре данных?
По мнению Александра Борисова, масштаб изменений зависит как от конкретнойых имплементации процессов процесса управления данными, так и от требований к данным со стороны внедряемого ИИ-решения: «Планирование изменений относится к числу проектных активностей и будет сугубо индивидуальным в каждом конкретном случае. Общим требованием для таких проектов является согласование процессов управления данными и управления жизненным циклом моделей машинного обучения. Другими словами, необходимо реализовать связку Data Governance и MLOps».
Источник: Издательство «Открытые системы»
Понравилась статья?
Время чтения: 1 мин.
Комментарии (0)
Направления
Читайте также