Заказчик: ВТБ
Компания «Бизнес Азимут» приняла участие в проекте по разработке системы создания и распространения обезличенных баз данных, используемых в процессе тестирования технологических продуктов.
Система помогает защитить критически важную информацию пользователей и приложений, а также позволяет проводить автоматизированное обезличивание чувствительных данных с использованием методов машинного обучения и алгоритмов, сохраняя интеграционные связи, формат и смысл значений.
Обезличивание данных позволяет создавать аналитические и тестовые среды без раскрытия конфиденциальной информации клиентов. Банк может использовать их для тестирования новых продуктов и услуг, анализа клиентского поведения, обучения персонала, а также для усовершенствования систем безопасности и предотвращения мошенничества.
В рамках проекта была создана модель профилирования баз данных, которая позволила определить список атрибутов персональных данных, то есть какая именно информация в базе относится к конфиденциальной и должна быть обезличена. В основе платформы используются Open Source решения в части ETL, UI, ML Точность классификации данных составляет более 96%.
Важным критерием при использовании обезличенных данных при тестировании функциональности программного продукта является сохранение не только объема, но и формата данных. Для этого мы использовали алгоритм шифрования с сохранением формата FPE (Format preserving encryption). Например, номер телефона остается набором цифр идентичной размерности, а имя и фамилия переводятся в данные с идентичным форматом и смыслом. Кроме того, обеспечена прослеживаемость данных внутри и между системами. Например, один и тот же номер ИНН меняется на один и тот же обезличенный номер везде, где он фигурирует.
В настоящее время мы осуществляем следующий этап этого проекта — развитие и модернизацию системы, более точно затачивая ее под требования заказчика.
Срок проекта:
2 года