На площадке Ассоциации больших данных разработан предварительный проект национального стандарта синтеза данных, целью которого является повышение доступности, безопасности и качества данных для развития технологий искусственного интеллекта в России. Как сообщили в пресс-службе Сбера, стандарт основывается на методе дифференциальной приватности и призван обеспечить конфиденциальность на всех этапах процесса синтезирования.
Анна Серебряникова, президент Ассоциации больших данных, подчеркнула, что новый стандарт обеспечит прозрачность процесса, надежность архитектуры и определит критерии качества данных. Она отметила, что синтетические данные могут стать реальной альтернативой обезличенным данным, которые в настоящее время часто ограничены регуляторными требованиями. Серебряникова добавила, что соблюдение приватности позволит открывать новые возможности для обучения искусственного интеллекта.
В проекте стандарта приведены математические доказательства, подтверждающие, что выполнение его рекомендаций позволяет синтезировать данные без угрожающих конфиденциальности рисков. Утверждение стандарта в 2025 году в Техническом комитете по стандартизации «Искусственный интеллект» станет важным шагом к интеграции синтетических данных в широкий оборот в стране, считают эксперты. Это открывает перспективы для более безопасного и эффективного использования данных в области ИИ.