봇치 더 수능 ! [834542] · MS 2018 · 쪽지

2023-07-27 13:29:30
조회수 4,394

개인적인 복습 지문 (k-익명성)

게시글 주소: https://orbi.kr/00063886285

(전략)


 데이터 집합에서 정보를 표현하는 최소 단위를 속성이라고


하고 다양한 속성들의 조합으로 표현된 하나의 정보를 레코드


라고 한다. 데이터 집합은 이 레코드들의 집합이다. 비식별화


기술은 속성을 식별자, 준식별자, 일반속성, 민감속성으로 구


분한다. (중략) 일반적으로 개인정보는 개인의 여러 속성과


결합하여 사용된다. 익명 데이터라도 여러 속성과 결합하면


유일한 속성값 조합이 새로 생기게 되며 이에 따라 특정 개


인이 재식별되는 불완전한 비식별 데이터 집합이 된다.


 k-익명성은 특정 개인을 추정할 가능성을 1/k 이하로 낮추


는 비식별화 기술로 원본 데이터 집합의 식별자나 준식별자


속성에 대해서만 마스킹, 범주화 등을 수행하여 유사한 준


식별자 속성값들을 동일하게 만드는 작업을 수행한다. 마스


킹은 '홍길동' 을 '홍**' 로 바꾸는 것이고 범주화는 '35세'


를 '30대' 로 바꾸는 식이다. 이렇게 만든 비식별 데이터 집


합에서 준식별자 속성값들이 모두 동일한 레코드들의 집합


을 동질집합이라고 하며 이때 레코드들의 수를 동질집합의


크기라고 한다. k-익명성은 비식별 처리로 만들어진 동질


합의 크기가 k 개 미만인 동질집합을 모두 삭제하여 동


집합의 크기가 k 개 이상 될 수 있도록 만든다. (중략)


 k-익명성은 한 동질집합에 속하는 모든 레코드에서 준식


별자 속성이 아닌 민감속성의 값이 모두 동일할 경우 해당


정보가 유출되는 단점이 있다. 민감속성은 병명, 수입 등


개인의 사생활과 관련된 속성을 의미한다. (후략)


출처: 2024학년도 LEET 언어이해 [4~6]


rare-이더리움 rare-비트코인 rare-을지문덕

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.