개인적인 복습 지문 (k-익명성)
게시글 주소: https://orbi.kr/00063886285
(전략)
데이터 집합에서 정보를 표현하는 최소 단위를 속성이라고
하고 다양한 속성들의 조합으로 표현된 하나의 정보를 레코드
라고 한다. 데이터 집합은 이 레코드들의 집합이다. 비식별화
기술은 속성을 식별자, 준식별자, 일반속성, 민감속성으로 구
분한다. (중략) 일반적으로 개인정보는 개인의 여러 속성과
결합하여 사용된다. 익명 데이터라도 여러 속성과 결합하면
유일한 속성값 조합이 새로 생기게 되며 이에 따라 특정 개
인이 재식별되는 불완전한 비식별 데이터 집합이 된다.
k-익명성은 특정 개인을 추정할 가능성을 1/k 이하로 낮추
는 비식별화 기술로 원본 데이터 집합의 식별자나 준식별자
속성에 대해서만 마스킹, 범주화 등을 수행하여 유사한 준
식별자 속성값들을 동일하게 만드는 작업을 수행한다. 마스
킹은 '홍길동' 을 '홍**' 로 바꾸는 것이고 범주화는 '35세'
를 '30대' 로 바꾸는 식이다. 이렇게 만든 비식별 데이터 집
합에서 준식별자 속성값들이 모두 동일한 레코드들의 집합
을 동질집합이라고 하며 이때 레코드들의 수를 동질집합의
크기라고 한다. k-익명성은 비식별 처리로 만들어진 동질
집합의 크기가 k 개 미만인 동질집합을 모두 삭제하여 동
질집합의 크기가 k 개 이상 될 수 있도록 만든다. (중략)
k-익명성은 한 동질집합에 속하는 모든 레코드에서 준식
별자 속성이 아닌 민감속성의 값이 모두 동일할 경우 해당
정보가 유출되는 단점이 있다. 민감속성은 병명, 수입 등
개인의 사생활과 관련된 속성을 의미한다. (후략)
출처: 2024학년도 LEET 언어이해 [4~6]
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
갑이 현실주의 을이 정의전쟁론 이었는데요 선지 ㄴ.을은 전쟁의 목적이 전쟁의 수단을...
그거보다 앞에 규범적 교의 지문이 이해가 안가던데..
그건 진짜 난해한 지문이 맞음ㅋㅋㅋ 첫지문이 그러니가 걍 멘탈 나가요
ㄹㅇ이; 풀세트 푸려다가 첫지문 읽고 덮음
그게 제일 어려운 지문이에요ㅋㅋㅋ
내일 재도전 해보도록 하겠습니다 감사합니다

봇찌 더 수능!!(안풀어본 지문이라 나중에 봐야겠네요