UPDATED. 2022-08-16 22:24 (화)
인텔 AI 칩 하바나 가우디2, 엔비디아 A100 넘었다
인텔 AI 칩 하바나 가우디2, 엔비디아 A100 넘었다
  • 서유덕 기자
  • 승인 2022.07.01 17:26
  • 댓글 0
이 기사를 공유합니다

MLPerf 벤치마크 결과
머신러닝 성능 기록 향상
하바나 가우디2 메자닌 카드. [사진=인텔]
하바나 가우디2 메자닌 카드. [사진=인텔]

[정보통신신문=서유덕기자]

인텔 하바나 가우디2가 엔비디아 A100 대비 높은 AI 학습 성능을 달성했다.

인텔은 자사 2세대 하바나 가우디2 딥 러닝 프로세서와 엔비디아 A100의 AI 총 학습 시간 (TTT) 성능을 MLPerf 산업 벤치마크 상에서 측정한 결과, 하바나 가우디2 딥 러닝 프로세서의 성능이 높게 나타났다고 1일 밝혔다.

인텔은 지난 5월 인텔 비전에서 발표한 가우디2 프로세서가 비전(ResNet-50)과 언어(BERT) 부문에서 뛰어난 TTT를 기록했다고 설명했다.

인텔 데이터 센터 팀은 하바나 랩스(Habana Labs)의 가우디 플랫폼을 활용해 딥 러닝 프로세서 기술에 중점을 뒀으며, 데이터 과학자와 머신러닝 엔지니어가 학습을 가속화할 수 있도록 지원했다. 아울러 단 몇 줄의 코드로 새로운 모델을 구축하거나 기존 모델을 이전해 생산성을 높이고 운영 비용을 절감할 수 있도록 구현했다.

하바나 가우디2는 1세대 가우디 제품 대비 TTT 부문에 있어 획기적인 발전을 이뤘다. 하바나 랩스는 지난 2022년 5월 진행한 MLPerf 벤치마크를 통해 가우디2가 8개의 가속기를 사용하는 비전 및 언어 모델에서 엔비디아 A100-80G 대비 높은 성능을 기록했다고 밝혔다. ResNet-50 모델의 경우, 가우디2는 엔비디아 A100-80G 제품 대비 학습 시간이 36% 단축됐다. 델(Dell)이 8개의 가속기 서버에서 진행한 ResNet-50 모델과 BERT 모델 학습 테스트 결과 가우디2가 엔비디아 A100-40GB 대비 학습 시간을 45% 단축했다.

가우디2는 1세대 가우디 대비, ResNet-50과 BERT 모델에서 각각 3배와 4.7배 높은 학습 처리량을 기록했다. 인텔은 해당 프로세서를 기존 16나노 공정에서 7나노 공정으로 전환해 텐서 프로세서 코어 수가 3배 증가했고, GEMM 엔진 컴퓨팅 용량 증설, 패키지 내 고대역폭 메모리 용량 3배 확대, 대역폭과 SRAM 크기 2배 확장을 통해 이번 성과를 달성했다. 비전 모델의 경우 가우디2는 독립적으로 작동해 AI 학습에 필요한 데이터 증강을 포함, 압축 영상화를 위한 전반적인 전처리 파이프를 처리할 수 있는 통합 미디어 엔진 형태의 기능을 갖췄다.

가우디1과 가우디2 프로세서는 특별한 소프트웨어 조작 없이도 고객에게 최고의 성능을 제공한다.

하바나 랩스는 8개의 GPU 서버와 HLS-가우디2 레퍼런스 서버 상에서 가우디1 및 가우디2와 기존 상용 소프트웨어 간 성능을 비교했다. 학습 처리량은 NGC왼 하바나 공용 저장소의 텐서플로우 도커를 사용해 측정했으며, 제조사에서 권장하는 최고의 성능 매개 변수를 채택했다.

MLPerf을 통해 측정된 가우디2 제품의 성능 외에도, 가우디1은 고효율 시스템 스케일링을 지원하는 128-가속기와 256-가속기를 위한 ResNet 모델에서 강력한 성능과 선형 스케일을 제공했다.

에이탄 메디나(Eitan Medina) 하바나 랩스 최고운영책임자는 “최신 MLPerf 결과로도 입증됐듯, 가우디2는 선도적인 성능을 제공한다”며 “하바나 랩스는 비용 경쟁력이 높은 AI 학습 솔루션을 제공하기 위해 딥 러닝 교육 아키텍처와 소프트웨어를 지속적으로 혁신하고 있다”고 말했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행·편집인 : 문창수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2022-08-16
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2022 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
인터넷신문위원회 abc협회 인증 ND소프트