UPDATED. 2024-04-18 17:30 (목)
케이사인, 악성코드 분야 AI 데이터셋 4억건 구축
케이사인, 악성코드 분야 AI 데이터셋 4억건 구축
  • 박광하 기자
  • 승인 2022.02.11 09:50
  • 댓글 0
이 기사를 공유합니다

데이터셋 규모 '페타바이트'
K-사이버 방역체계 발전·고도화 지원
진단명 기반, 속성 기반 데이터셋의 메타데이터 생성 도구 정확성 확인 자료. [자료=케이사인]
진단명 기반, 속성 기반 데이터셋의 메타데이터 생성 도구 정확성 확인 자료. [자료=케이사인]

[정보통신신문=박광하기자]

정보보안 전문업체 케이사인(대표 최승락)이 자회사인 위협 인텔리전스 전문기업 샌즈랩, 이스트소프트 계열사로 안티바이러스 전문기업인 이스트시큐리티와 4억건의 사이버보안 AI 학습용 데이터셋 구축을 완료했다고 11일 밝혔다.

코로나19로 보안위협 패러다임이 빠르게 변화하고 있으며, 기업과 조직의 업무 환경이 비대면 방식으로 이뤄지고 있다. 사이버 공격이 지능화되고, 급증하면서 보안의 중요성이 그 어느때보다 중요한 이슈로 떠오르고 있다.

한국인터넷진흥원(KISA)은 지난해에 과학기술정통부의 'K-사이버방역 추진전략'의 일환으로 '사이버보안 AI 데이터셋 구축사업'을 진행했다. 본 과제는 사이버 침해대응 분야 민관 전문가가 협력해 사이버보안 AI 데이터셋 구축의 선순환 환경을 조성하고, 국내 보안기술을 지능화해 급증하는 신.변종 보안 위협에 선제적으로 대응할 수 있는 기반을 마련하는 것을 목표로 한다.

케이사인 컨소시엄은 해당 사업에서 3억건 이상의 정상·악성파일 및 300종 이상의 악성코드 패밀리를 분류하고, 즉시 활용할 수 있는 '사이버보안 인공지능(AI) 데이터셋(악성코드 분야)'을 구축했다. 악성코드 AI 특징정보 추출에 대한 전문적 노하우와 클라우드 기반의 페타급 대용량 데이터셋 이관 방법론으로 최적의 데이터셋을 구축하고, 이관 및 검증 체계를 마련하며 업계의 주목을 받았다.

케이사인 컨소시엄은 샌즈랩에서 운영하는 멀웨어즈닷컴에서 분석한 20억건의 악성코드 분석 데이터 가운데 대표성을 띈 3억개의 악성코드를 추출하고, 악성코드 특징 정보를 바탕으로 300여종의 패밀리로 분류했다.

구축된 데이터셋은 총 150여종의 메타정보 및 원시데이터를 포함한다. 또한 공격그룹, 공격기법, 유포방법 등 악성코드 속성정보에 대한 고차원으로 연관관계 분석을 실시해 1억건의 악성코드 분석 데이터도 함께 마련했다. 정적·동적 분석만으로 도출할 수 없는 심층정보를 속성으로 생성해 유사도 분석을 수행하고, 클러스터링 한 결과를 기반으로 데이터셋을 구축하며 기술을 우수성을 인정받았다.

구축한 데이터셋은 다수의 기관으로부터 다양한 AI 모델을 통해 실증을 수행했다. 또한 악성코드 전문 인력과 품질 검증을 위해 각 분야 전문가 10인의 자문을 받아 데이터셋의 질적 향상을 도모했다.

신대균 케이사인 프로젝트 매니저. [사진=케이사인]
신대균 케이사인 프로젝트 매니저. [사진=케이사인]

이번 사업의 총괄을 맡은 신대균 케이사인 프로젝트 매니저는 "규모가 작은 중소기업의 경우, 노하우와 자원 부족으로 악성코드 관련 메타 데이터를 추출해내기 어렵다"며 "KISA와 케이사인 컨소시엄의 노력으로 국내 사이버 보안산업 전반에 활용할 수 있는 악성코드 관련 핵심 데이터셋을 성공적으로 구축하게 돼 뜻깊다"고 밝혔다.

케이사인 측은 사업 종료 이후에도 구축된 데이터셋을 인공지능 핵심기술 연구 개발에 사용하는 한편, 사이버 보안 위협 대응에 필요한 중요 거점 데이터셋으로 활용이 될 수 있도록 지원할 방침이다.

'사이버보안 AI 학습용 데이터셋'은 KISA 사이버보안빅데이터센터를 통해 민간에 개방될 예정이다. 비전문가 집단도 인공지능 모델을 만들어 시험할 수 있는 이미지와 그램데이터 등 악성코드에서 추출한 다양한 메타 데이터와 MITRE ATT&CK T-ID 매핑 등 글로벌 트렌드에 맞춘 최신 데이터셋이 포함돼 있다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행인 : 함정기
  • 편집인 : 이민규
  • 편집국장 : 박남수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2024-04-18
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2024 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
한국인터넷신문협회 인터넷신문위원회 abc협회 인증 ND소프트