UPDATED. 2020-09-26 14:13 (토)
‘내가 될 수 없는 나의 정보’, 빅데이터 시대 필수 안전장치 자리매김
‘내가 될 수 없는 나의 정보’, 빅데이터 시대 필수 안전장치 자리매김
  • 차종환 기자
  • 승인 2020.09.15 14:50
  • 댓글 0
이 기사를 공유합니다

[IT길라잡이] 가명정보

개인정보 비식별조치 필수
가명∙총계처리 등 기법 다양
활용 과정∙목적 분명히 해야
코로나19 시대를 맞아 개인정보 유출 위험이 제기되면서 가명정보 활용에 대한 관심이 높아지고 있다.
코로나19 시대를 맞아 개인정보 유출 위험이 커지면서 가명정보 활용에 대한 관심이 높아지고 있다. [사진=클립아트코리아]

가명정보에 대한 관심이 뜨겁다.

최근 코로나19로 인한 사회적 거리두기가 강화되면서 식당 및 각종 편의시설은 방문자의 개인정보를 반드시 기록하도록 하고 있다. 하지만 이는 개인정보 유출이라는 또다른 위험성을 내포하고 있어 이를 가명정보화 할 필요성이 제기되고 있는 상황이다.

‘데이터3법’에 따르면, 가명정보란, 개인정보의 일부분을 삭제하거나 대체해 특정 개인을 식별할 수 없도록 만든 정보를 일컫는다.

즉, ‘홍길동, 남자, 25세, 02-597-8140, 서울시 용산구 한강대로308’이라는 개인정보가 있을 때, 이를 ‘홍XX, 남자, 20대, 02-XXX-XXXX, 서울시 용산구 XXXX’와 같이 전환한 것을 가명정보라고 볼 수 있다.

이처럼 개인정보가 가명정보가 되도록 전환하는 과정을 ‘비식별조치’라 한다. 비식별조치에는 다양한 방법이 사용된다.

가장 대표적인 것이 ‘가명처리(Pseudonymization)’ 기법이다. 개인 식별이 가능한 데이터를 직접적으로 식별할 수 없는 다른 값으로 대체하는 방식이다. 개인 이름을 ‘홍길동’, ‘임꺽정’ 등 몇몇 일반화된 이름으로 대체 표기하는 것이 그 예다.

데이터의 변형이나 변질 수준이 적다는 장점이 있지만, 대체값이 부여됐음에도 식별이 가능한 고유속성이 계속 유지돼 원본 데이터의 추론이 가능할 수 있다는 단점이 있다.

‘총계처리(Aggregation)’는 통계값을 적용해 특정 개인을 식별할 수 없도록 하는 기법이다.

개인과 직접 관련된 날짜정보(생일, 자격 취득일 등), 기타 고유 특징(신체정보, 진료기록 등)을 비식별조치하는 데 주로 이용된다. 예로, 한 집단의 전체 소득에 대한 평균값을 각 개인의 소득값으로 간주해 적용하는 경우를 들 수 있다.

민감한 수치 정보를 처리하는 데 유리하지만 정밀분석이 어렵고 집계 수량이 적을 경우 특정 개인의 추론이 가능하다는 위험이 있다.

‘데이터 삭제(Data Reduction)’ 기법은 말 그대로 개인 식별이 가능한 데이터를 삭제 처리하는 것이다.

삭제되지 않고 남아있는 정보는 그 자체로 가치를 유지하고 있어야 하며, 타 정보와 결합했을 때도 개인을 식별할 수 없어야 한다.

유출될 수 있는 개인정보가 아예 사라진다는 점에서 높은 보안성을 유지할 수 있지만 데이터로서의 유용성이 대폭 낮아질 수 있다는 점은 가명정보로서의 가치마저 잃어버릴 우려가 있다.

‘데이터 마스킹(Data Masking)’ 기법은 데이터의 전부 또는 일부분을 공백, 노이즈 등으로 변환해 개인 식별을 방지한다. 예로, 실제 생년월일에 6개월의 잡음을 추가, 1일부터 최대 6개월의 오차가 날 수 있도록 날짜를 변환해 개인 식별을 막을 수 있다.

데이터 구조의 변형을 최소화 하면서 개인 식별 요소를 제거할 있다는 장점이 있지만, 마스킹을 과도하게 적용할 경우 데이터를 활용하기 어렵고 마스킹 수준이 낮을 경우 특정값에 대한 추론이 가능하다는 단점이 있다.

한편, 가명정보는 빅데이터 시대를 견인할 최소한의 안전장치가 될 것이라는 평가다.

정부는 규제개혁의 일환으로 기업이 이름, 주민등록번호 등의 식별자를 제거한 가명정보를 더 편하게 활용하고, 빅데이터 기반의 산업 활성화를 지원하겠다고 밝힌 바 있다.

하지만 가명정보를 여러 개 결합할수록 개인 식별의 가능성은 커지기 마련이기 때문에 가명정보의 활용은 그 과정과 목적을 보다 분명히 할 필요가 있다는 게 전문가들의 의견이다.

즉, 가명처리의 목적이 정당했는지, 목적에 부합할 정도로 충분히 가명처리가 됐는지, 가명처리 과정에서 객관적이고 공정하게 개인정보 영향평가를 수행했는지 등을 종합적으로 고려할 필요가 있다는 지적이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.