Защита моделей машинного обучения от извлечения обучающего набора данных
Авторы:
Аннотация:
Рассмотрена проблема защиты моделей машинного обучения от угрозы нарушения конфиденциальности данных, реализующей определение членства в обучающих наборах данных. Предложен метод защитного зашумления обучающего набора. Экспериментально показано, что гуассово зашумление обучающих данных с масштабом 0,2 является наиболее простым и эффективным способом защиты моделей машинного обучения от определения членства в обучающем наборе. В сравнении с альтернативами данный метод прост в реализации, универсален по отношению к видам моделей и позволяет снизить результативность определения членства до 26%-ных пунктов.