В России разработали сервис для безопасного использования ИИ

НИУ ВШЭ: создана система обезличивания данных для безопасного обучения ИИ

Summit Art Creations/Shutterstock/FOTODOM

Специалисты Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ разработали сервис обезличивания табличных данных, который позволяет использовать корпоративные данные для аналитики и искусственного интеллекта без раскрытия персональной информации. Об этом «Газете.Ru» сообщили в пресс-службе образовательного учреждения.

Одной из главных проблем внедрения ИИ в организациях остается необходимость работать с реальными данными. Они нужны для обучения, тестирования и контроля качества моделей, однако зачастую содержат персональные сведения о сотрудниках, клиентах, пациентах или пользователях. Использование таких данных связано с рисками нарушения конфиденциальности и требованиями законодательства.

Разработанный в НИУ ВШЭ сервис предназначен для автоматической обработки структурированных наборов данных, представленных в виде таблиц. Система выявляет персональные данные, применяет к ним заранее заданные правила обезличивания и формирует специальные отчеты и технические артефакты, необходимые для контроля качества обработки и последующего аудита.

Особенностью решения стала воспроизводимость результатов. Для одинаковых входных данных сервис всегда формирует одинаковый результат обезличивания. Это позволяет исследователям и разработчикам повторять эксперименты, сравнивать результаты работы моделей и проводить проверки без необходимости обращаться к исходным персональным данным.

По словам разработчиков, такой подход сохраняет структуру и аналитическую ценность данных, благодаря чему их можно использовать для обучения и тестирования ИИ-систем.

Архитектура сервиса предусматривает раздельное хранение исходной информации и результатов обработки, управление правилами замены данных, контроль доступа пользователей и проверку целостности данных. Также ведется специальный реестр замен, позволяющий отслеживать процесс обезличивания.

Разработчики отмечают, что технология может быть адаптирована для использования в организациях, работающих с чувствительными данными. В их числе образовательные учреждения, медицинские организации, промышленные предприятия, финансовые компании и государственные структуры.

«Для ИИ-проектов недостаточно просто иметь доступ к данным. Необходимо уметь безопасно готовить данные так, чтобы они сохраняли аналитическую ценность, но не раскрывали персональные сведения. Наш сервис решает именно эту инженерную задачу: он встраивает обезличивание в управляемый процесс подготовки данных для ИИ», — рассказал руководитель команды проекта, начальник отдела прикладных технологических решений Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Салех Хади.

Ранее ученые выявили главную слабость искусственного интеллекта.