Анонимизация данных - это тип очистки информации, целью которого является защита конфиденциальности. Это процесс удаления личной информации из наборов данных, чтобы люди, которых описывают данные, оставались анонимными.
Анонимизация данных определяется как «процесс, посредством которого личные данные необратимо изменены таким образом, что субъект данных больше не может быть идентифицирован прямо или косвенно ни одним оператором данных, ни в сотрудничестве с любой другой стороной ». Анонимизация данных может позволить передачу информации через границу, например, между двумя отделами в рамках одного агентства или между двумя агентствами, при одновременном снижении риска непреднамеренного раскрытия информации и в определенных средах таким образом, чтобы обеспечить постанонимизацию оценки и аналитики.
В контексте анонимные данные относятся к данным, по которым пациент не может быть идентифицирован получателем информации. Имя, адрес и полный почтовый индекс должны быть удалены вместе с любой другой информацией, которая в сочетании с другими данными, хранящимися или раскрываемыми получателем, может идентифицировать пациента.
Всегда будет существовать риск что анонимные данные не могут оставаться анонимными с течением времени. Соединение анонимного набора данных с другими данными, умные методы и грубая мощь - вот некоторые из способов деанонимизации ранее анонимных наборов данных; Субъекты данных больше не анонимны.
Деанонимизация - это обратный процесс, в котором анонимные данные сопоставляются с другими источниками данных для повторной идентификации источника анонимных данных. Обобщение и возмущение - два популярных подхода к анонимизации реляционных данных. Процесс сокрытия данных с возможностью повторной идентификации позже также называется псевдонимизацией и является одним из способов хранения данных в соответствии с HIPAA.
Новый Общий регламент защиты данных (GDPR) Европейского Союза требует, чтобы хранимые данные о людях в ЕС проходили либо анонимизацию, либо процесс псевдонимизации. GDPR Recital (26) устанавливает очень высокую планку того, что представляют собой анонимные данные, тем самым освобождая данные от требований GDPR, а именно: «… информация, которая не относится к идентифицированному или идентифицируемому физическому лицу или к личным данным, которые становятся анонимными в таких таким образом, чтобы субъект данных не был или больше не идентифицируем ". Европейский надзорный орган по защите данных (EDPS) и испанское агентство Agencia Española de Protección de Datos (AEPD) выпустили совместное руководство, касающееся требований анонимности и освобождения от требований GDPR. Согласно EDPS и AEPD, никто, включая контролера данных, не должен иметь возможность повторно идентифицировать субъекты данных в должным образом анонимизированном наборе данных. Исследования данных ученых из Имперского колледжа в Лондоне и Католического университета Лувена в Бельгии, а также решение судьи Михала Агмон-Гонена из окружного суда Тель-Авива подчеркивают недостатки «анонимизации» в современном мире больших данных. Анонимизация отражает устаревший подход к защите данных, который был разработан, когда обработка данных ограничивалась изолированными (разрозненными) приложениями до того, как стала популярной обработка «больших данных», предполагающая широкое распространение и объединение данных.