UPDATED. 2022-01-20 13:22 (목)
AWS, 머신러닝 서비스 '아마존 세이지메이커' 6가지 신규 기능 발표
AWS, 머신러닝 서비스 '아마존 세이지메이커' 6가지 신규 기능 발표
  • 박남수 기자
  • 승인 2021.12.02 20:35
  • 댓글 0
이 기사를 공유합니다

스와미 시바수브라마니안 AWS 머신러닝 담당 부사장이 아마존 세이지메이커 신규 기능을 발표하고 있다.
스와미 시바수브라마니안 AWS 머신러닝 담당 부사장이 아마존 세이지메이커 신규 기능을 발표하고 있다.

[정보통신신문=박남수기자]

아마존웹서비스(AWS)가 AWS 리인벤트(AWS re:Invent) 행사를 통해 업계 선도적인 머신러닝(ML) 서비스인 아마존 세이지메이커의 6가지 신규 기능을 발표했다

이를 기반으로 접근성이 우수하고 비용 효율적인 ML 서비스를 제공하겠다는 복안이다.

이번에 새롭게 발표된 세이지메이커의 주요 기능은 정확한 ML 예측을 생성하기 위한 노코드 환경, 고도로 숙련된 주석자를 활용하는 정확한 데이터 레이블링, 전문 영역간 협업을 강화하는 아마존 세이지메이커 스튜디오 범용 노트북 환경, 코드를 효율화하는 머신러닝 학습을 위한 컴파일러, ML 추론에 대한 자동 컴퓨팅 인스턴스 선택, ML 추론을 위한 서버리스 컴퓨팅을 포함한다. 이곳에서 아마존 세이지메이커를 지금 바로 사용할 수 있다. 

사실상 무한하게 가용할 수 있는 컴퓨팅 용량, 클라우드 환경에서의 방대한 데이터 확산, 개발자용 도구의 급속한 발전에 힘입어 ML은 다양한 산업 분야에서 주류로 자리매김했다.

지난 수년간 AWS는 보다 많은 기업 고객이 손쉽게 ML 서비스에 접근할 수 있도록 노력을 기울여 왔는데, 특히 아마존 세이지메이커는 현재 아스트라제네카, 오로라, 캐피털 원, 서너, 디스커버리, 현대그룹, 인튜이트, 톰슨 로이터, 타이슨, 뱅가드를 비롯한 전 세계 수만 기업 고객이 활용 중인, AWS 역사상 가장 빠른 속도로 성장하는 서비스 중 하나이다.

이들 기업 고객은 매달 수천억 개의 예측을 수행하는 수십억 개의 매개변수로 구성된 모델들을 포함하는 모든 규모의 ML 모델 학습을 위해 아마존 세이지메이커를 이용하고 있다.

기업 고객이 아마존 세이지메이커에서 ML 모델 학습 및 추론을 더욱 확장해 나감에 따라, AWS는 서비스 기능 확대를 위한 지속적인 투자를 단행해 지난해에만 60개 이상의 새로운 아마존 세이지메이커 기능을 공개했다.

앞선 진보에 이어, 아번에 발표된 아마존 세이지메이커의 신규 기능 또한 ML을 위한 데이터를 준비 및 수집하고, 모델 학습 속도를 가속화하며, 추론에 필요한 컴퓨팅 유형과 규모를 최적화함으로써, 보다 많은 사용자가 손쉽게 ML을 활용할 수 있도록 확장 지원하는데 방점을 두고 있다.  

세부 내용을 살펴보면 아마존 세이지메이커 캔버스는 비즈니스 분석가(재무, 마케팅, 운영 및 인사 팀을 지원하는 현업 직원)를 대상으로 ML 전문 지식 없이도, 코드를 작성하지 않고 정확한 ML 예측을 직접 생성할 수 있는 시각적 인터페이스를 제공함으로써 ML에 대한 접근성을 높인다. 점점 더 많은 기업이 ML을 활용해 비즈니스와 고객 경험을 새롭게 창출해 나감에 따라 조직 내 대다수의 사람들이 다양한 사업 영역에서 고도화된 ML 기술을 사용하는 것이 필요해지고 있다. 하지만, 일반적으로 ML은 수년간의 정규 교육 또는 난이도가 높고, 내용이 진화하는 커리큘럼 기반의 집중 교육에 따른 전문 기술을 요구해 왔다. 아마존 세이지메이커 캔버스는 비즈니스 분석가가 예측을 쉽게 생성할 수 있도록 지원하는 마우스 조작이 가능한 시각화된 사용자 인터페이스를 제공함으로써 이러한 문제를 해결한다. 기업 고객이 아마존 세이지메이커 캔버스를 아마존 레드시프트, 아마존 S3, 스노우플레이크, 온프레미스 데이터 저장소, 컴퓨터 내 파일 등의 데이터 저장소로 지정하면, 아마존 세이지메이커 캔버스는 사용자가 데이터를 직관적으로 준비 및 분석할 수 있도록 지원하는 시각적 도구를 제공한다. 다음으로 아마존 세이지메이커 캔버스는 자동화된 ML을 활용하여 코딩 없이 ML 모델을 구축하고 학습시킨다.  비즈니스 분석가는 실사용 사례에서의 정확성 및 효율성을 위해 아마존 세이지메이커 캔버스 콘솔에서 ML 모델을 검토 및 평가하게 된다. 또한 아마존 세이지메이커 캔버스를 통해 모델을 아마존 세이지메이커 스튜디오로 내보내는 것이 가능하기 때문에, 이를 데이터 과학자와 공유하여 모델을 검증하고 추가적으로 구체화할 수도 있다. 

아마존 세이지메이커 그라운드 트루스 플러스는 내장된 주석 워크플로우와 전문가 인력을 함께 활용해 보다 비용 합리적이고 신속한 노코드 ML 모델 학습을 위한 고품질 데이터를 제공하는 완전 관리형 데이터 레이블링 서비스이다. 기업 고객이 보다 정확하게 모델을 학습시키고, ML 구축을 확장하기 위해서는 올바르게 레이블링된 더욱더 많은 양의 데이터 세트가 필요하다. 그러나 대규모의 데이터 세트를 생성하기 위해서는 수 주에서 수 년간의 시간이 소요되며, 기업 내부에서 데이터 레이블링 프로세스를 관리하기 위해 추가 인력을 고용하고 워크플로우를 구축하는 것도 필요하다. 이에 따라 AWS는 2018년 아마존 세이지메이커 그라운드 트루스 플러스를 출시하고, 이를 기반으로 기업 고객이 아마존 메커니컬 턱, 서드파티 공급업체 또는 자체 인력을 통한 인간 주석자를 활용하여 레이블링된 데이터를 보다 간편하게 생성할 수 있도록 지원하고 있다. 아마존 세이지메이커 그라운드 트루스 플러스는 고도로 정확한 데이터 레이블링을 위해 특정 분야 및 업계 전문 지식 뿐만 아니라 고객의 데이터 보안, 개인 정보 보호 및 규정 준수 요구 사항을 충족할 수 있는 자격을 갖춘 전문 인력을 활용하여 해당 기능을 확대하고 있다. 

아마존 세이지메이커 그라운드 트루스 플러스는 ML 모델을 기반으로 하는 사전 레이블링, 오류 및 저품질 레이블을 감지하기 위한 인간 레이블링에 대한 기계 검증, 보조 레이블링 기능(예: 3D 직육면체 스냅, 2D 왜곡 제거, 다음 단계 비디오 레이블링 예측 및 자동 세그먼트 도구)을 포함하는 다단계 레이블링 워크플로우를 제공하여 데이터 세트 레이블링에 필요한 시간을 단축하고 고품질 주석 데이터를 마련하는 비용을 절감한다. 기업 고객은 간편하게 아마존 세이지메이커 그라운드 트루스 플러스를 아마존 S3의 데이터 소스에 지정함으로써 특정 레이블링에 대한 요구 사항(의료 전문가가 폐 방사선 영상에서 비정상 레이블을 지정하는 방법에 대한 지침)을 제공할 수 있다. 그 다음으로, 아마존 세이지메이커 그라운드 트루스 플러스는 데이터 레이블링 워크플로우를 생성하는 한편 데이터 주석 진행 상황을 추적하고, 완성된 레이블의 샘플 품질을 검사하고 고품질 데이터 생산을 위한 피드백을 제공하는 대시보드를 지원하여 기업 고객이 고도로 정확한 ML 모델을 보다 신속하게 구축, 학습 및 배포할 수 있도록 한다.

ML 최초의 완전한 개발환경(IDE)인 아마존 세이지메이커 스튜디오를 위한 범용 노트북은 데이터 엔지니어링, 분석 및 ML을 수행할 수 있는 단일 통합 환경을 제공한다. 서로 다른 데이터 전문 영역을 지닌 부서는 다양한 데이터 엔지니어링, 분석 및 ML 워크플로우를 통해 협력을 이어나가기를 기대하고 있다.  이들 영역의 실무자는 데이터 엔지니어링, 데이터 분석 및 데이터 과학과 같은 지식 분야를 넘나들며 데이터 탐색 도구를 전환하지 않고도 다양한 워크플로우에서 작업하기를 원한다는 피드백을 종종 전해왔다. 그러나 기업 내 분석 및 ML 환경에서 데이터를 통합하기 위해서는, 번거롭고 시간이 많이 소요될 뿐만 아니라 오류가 발생하기 쉬운, 다양한 도구와 노트북에 대한 조율 과정이 필요하다.

아마존 세이지메이커 스튜디오는 사용자가 범용 노트북 내에서 다양한 목적을 위한 광범위한 데이터를 유기적으로 액세스, 변환 및 분석할 수 있도록 지원한다. 아마존 EMR 클러스터에서 실행되는 스파크, 하이브 및 프레스토와 아마존 S3에서 실행되는 데이터레이크와의 내장된 통합을 통해 기업 고객은 아마존 세이지메이커 스튜디오를 활용해 서비스 전환 없이도 범용 노트북의 데이터를 액세스 및 조작할 수 있다. 또한 아마존 세이지메이커 스튜디오에서 ML 모델을 구축, 학습 및 배포하기 위해 텐서플로우, 파이토치 또는 엠엑스넷 등의 선호하는 프레임워크를 사용하여 ML 모델을 개발하고, 데이터 소스를 색인 및 쿼리하고, 메타데이터 및 스키마를 탐색하고, 분석 또는 ML 워크플로우를 위한 작업 처리를 시작하는 것도 가능하다. 이 모든 작업은 범용 아마존 세이지메이커 스튜디오 노트북 환경 내에서 이루어진다. 

아마존 세이지메이커 학습 컴파일러는 코드를 자동으로 최적화하여 컴퓨팅 리소스를 보다 효과적으로 사용하고 모델 학습에 소요되는 시간을 최대 50%까지 단축하는 새로운 기계 학습 모델 컴파일러이다. 규모가 방대하고 까다로운 최첨단 딥러닝 모델은 학습 가속화를 위해 특수 컴퓨팅 인스턴스를 필요로 하고, 단일 모델 학습에 있어 수천 시간의 그래픽 처리 장치(GPU) 컴퓨팅 시간이 소모된다. 학습 가속화를 위해 데이터 과학자는 일반적으로 데이터를 증량하거나 하이퍼파라미터(hyperparameter, 기계 학습 훈련 프로세스를 제어하는 변수)를 조정해 성능이 가장 좋고 리소스 소모가 덜한 모델을 찾으려 한다. 그러나 이러한 작업은 기술적으로 복잡할 뿐만 아니라, 데이터 과학자에게는 대다수의 경우 GPU 실행이 가능한 모델 학습에 필요한 프레임워크를 최적화할 충분한 시간이 주어지지 않는다. 

아마존 세이지메이커 학습 컴파일러는 클라우드에서 보다 효율적인 실행이 가능하도록 최적화된 아마존 세이지메이커의 텐서플로우 및 파이토치 버전과 통합된 신규 ML 모델 컴파일러로, 데이터 과학자는 선호하는 프레임워크를 활용해 보다 효율적인 GPU 사용을 통해 ML 모델을 훈련할 수 있다. 아마존 세이지메이커 학습 컴파일러는 클릭 한 번으로 간편하게 학습 완료된 모델을 자동으로 최적화하고 컴파일하여 모델 학습을 최대 50% 더 빠르게 실행한다.

아마존 세이지메이커 추론 추천기는 기업 고객이 ML모델 구동에 가장 적합한 컴퓨팅 인스턴스 및 구성(인스턴스 수, 컨테이너 파라미터, 모델 최적화 등)를 자동으로 선택할 수 있도록 돕는다. 자연어 처리(NLP) 또는 컴퓨터 비전에 일반적으로 활용되는 대규모 ML 모델의 경우 최고 수준의 가격 대비 성능을 갖춘 컴퓨팅 인스턴스를 선택하기까지 수 주 간의 실험이 요구되는 복잡하고 반복적인 과정이 수반된다.

아마존 세이지메이커 추론 추천기는 모델 실행 위치 결정에 요구되는 추측과 복잡성을 제거하고 이상적인 컴퓨팅 인스턴스 구성을 자동으로 추천함으로써 구축 시간을 수 주에서 수 시간으로 단축한다. 데이터 과학자는 아마존 세이지메이커 추론 추천기를 통해 권장 컴퓨팅 인스턴스 중 하나에 모델을 구축하거나, 서비스를 활용하여 선택한 컴퓨팅 인스턴스 범위 내에서 성능 벤치마크 시뮬레이션을 실행할 수 있다. 기업 고객이 아마존 세이지메이커 스튜디오 상에서 벤치마크 결과를 검토하고 지연 시간, 처리량, 비용, 컴퓨팅 및 메모리를 비롯한 다양한 구성 설정 간의 트레이드오프를 평가하는 것도 가능하다.

아마존 세이지메이커 서버리스 추론은 프로덕션에 구축된 ML 모델에 대한 가격 추론에 대해 사용한 만큼 지불할 수 있는 서비스를 제공한다. ML을 사용하는 기업 고객은 항상 비용 최적화를 추구하며, 이는 유휴 시간이 길고 간헐적인 트래픽 패턴이 있는 애플리케이션에서 특히 더 중요하게 작용한다. 예를 들어, 소비자 구매 패턴을 기반으로 한 개인화된 추천, 고객 전화를 처리하는 챗봇, 실시간 거래를 기반으로 한 수요 예측과 같은 애플리케이션은 기상 조건, 판촉 제안 또는 휴일과 같은 외부 요인에 따라 활동량이 증가한다. 그러나 ML 추론을 위한 가장 적절한 양의 컴퓨팅 제공은 균형을 잡기가 무척이나 까다로운 작업으로, 고객이 최대 활동량을 수용하기 위해 용량을 과도하게 프로비저닝할 경우 일관된 성능을 제공할 수는 있지만 트래픽이 없을 때에는 비용이 낭비된다. 혹은, 기업 고객은 조건 변경에 따른 추론을 수행할 수 있는 충분한 컴퓨팅 용량을 제공하는 과정에서 비용 제한을 위해 컴퓨팅을 과소 프로비저닝하기도 한다. 일부 기업 고객은 변화하는 조건에 대응하기 위해 컴퓨팅 리소스를 직접 조정하기를 시도하지만, 이는 무척이나 지난한 수동 작업을 수반한다. 

ML용 아마존 세이지메이커 서버리스 추론은 추론 요청 수에 따라 컴퓨팅 용량을 자동으로 프로비저닝, 확장 및 종료하기 때문에, 기업 고객이 ML 모델을 프로덕션에 구축하는 과정에서 아마존 세이지메이커에서 서버리스 배포 옵션을 선택하기만 하면, 아마존 세이지메이커 서버리스 추론이 컴퓨팅 리소스를 관리해 필요한 만큼의 컴퓨팅을 정확하게 제공한다. ML용 아마존 세이지메이커 서버리스 추론을 활용하는 기업 고객은 기본 인프라를 관리할 필요 없이 각 요청에 대해 사용하는 컴퓨팅 용량과 처리된 데이터 양에 대해서만 비용을 지불하면 된다.  

브라틴 사하 AWS 머신러닝 담당 부사장은 “산업과 규모를 막론하고 다양한 기업 고객이 ML 활용 확대를 통해 이를 기업 운영의 핵심적인 부분으로 지원하고, 전 세계를 위한 새로운 제품, 서비스 및 경험을 창출할 수 있도록 돕는 아마존 세이지메이커를 반기고 있다”라며 “AWS는 업계 최고 수준의 ML 서비스를 보다 광범위한 기업 고객 대상으로 확장하여 이들 기업이 비즈니스 혁신을 주도하고 까다로운 문제를 해결할 수 있도록 돕는다. 새롭게 공개된 아마존 세이지메이커 도구를 활용해 AWS는 서비스에 대한 완전히 새로운 이용자 그룹을 포섭하는 한편 기존 고객을 위한 추가 기능을 제공하고 있다. 이를 통해 기업 고객이 ML 여정 전반에 걸쳐 데이터를 보다 간편하게 가치 있는 통찰력으로 전환하고, 구축 시간을 단축하고, 성능을 개선하고, 비용을 절감할 수 있도록 지원해 나가겠다”라고 말했다. 

독일 뮌헨에 본사를 둔 BMW 그룹은 BMW, BMW 모토라드, MINI 및 롤스로이스 브랜드를 포괄하는 프리미엄 자동차 및 오토바이 글로벌 제조업체로, 최근에는 프리미엄 금융 및 이동 서비스를 제공하고 있다. 마크 노이만 BMW 그룹 AI 플랫폼 프로덕트 오너는 “그룹 전반의 디지털 전환 과정에서 BMW는 핵심 기술로서의 AI 활용을 매우 중대한 요소로 여기고 있다. BMW 그룹에서는 가치 사슬 전반에 걸쳐 AI를 활용함으로써 고객, 제품, 직원 및 프로세스에 대한 부가가치를 창출하는 것은 물론, 지난 수 년간 비즈니스 가치 임팩트가 측정된 BMW 그룹 내 다수의 최고 수준 사용 사례를 산업화할 수 있었다”라며 “아마존 세이지메이커 캔버스를 통해 향후에도 BMW 그룹 전체의 AI/ML 확대를 가속화하기를 기대한다. 해당 서비스 활용을 통해 비즈니스 사용자는 ML 모델을 간편하게 탐색 및 구축하여 코드 작성 없이도 정확한 예측을 수행하고, 본사 데이터 과학 팀이 비즈니스 사용자가 생성한 모델의 프로덕션 게시 이전에 협업 및 평가를 진행할 수 있게 되었다”고 말했다. 

에어비앤비는 지역 호스트가 운영하는 700만 개 이상의 숙박 시설과 4만개 이상의 액티비티를 제공하는, 개성 넘치고 진정성 있는 숙소와 다양한 즐길 거리를 갖춘 글로벌 최대 플랫폼 중 하나이다. 웨이 뤄(Wei Luo) 에어비엔비 차이나 데이터 과학자는 “에어비앤비에서는 비즈니스의 모든 측면에서 ML 통합을 가속화하고 있다. 특히 내가 속한 팀의 주요 과제는 ML 모델 학습 및 테스트를 위해 고품질 데이터를 지속적으로 생성하고 유지하는 것이다”라며 “에어비앤비에서는 만다린어로 된 십만 단락의 고객 서비스 로그에 대한 고품질 텍스트 분류 데이터 결과를 생성하여 고객에게 보다 나은 서비스를 제공하고 고객 서비스 팀에 대한 의존도를 줄이는 방법을 모색하고 있었다. 그러던 중, AWS 지원 인력이 아마존 세이지메이커 그라운드 트루스 플러스를 활용하여 99%의 분류 정확도를 달성할 수 있는 사용자 지정 ML 모델이 포함된 사용자 지정 데이터 레이블링 워크플로우를 자사에 성공적으로 구축했다”고 말했다. 

내셔널 풋볼 리그(NFL)은 세계 최대의 연례 스포츠 행사인 슈퍼볼의 우승컵을 차지하기 위해 매년 치열하게 경쟁하는 32개의 프랜차이즈 팀으로 구성된 미국의 인기 스포츠 리그이다. 제니퍼 랭턴 NFL 선수 건강 및 혁신 담당 수석 부사장은 “NFL에서는 팬, 중계자, 코치 및 스포츠 팀이 깊이 있는 통찰력을 확보할 수 있도록 ML을 활용하는 새로운 방법을 지속적으로 모색하고 있다”라며 “미식축구는 순식간에 플레이의 희비가 갈리는, 무척이나 빠른 속도로 움직이는 스포츠이다. 코치와 심판이 경기를 주시한다 하더라도, 경기장 안전을 위해 모든 선수를 면밀하게 모니터링하는 것은 현실적으로 어렵다. 컴퓨터 비전을 통해 플레이어의 안전 사고를 정확하게 감지하는 알고리즘을 개발하기 위해서는 전문적으로 레이블링된 데이터가 필요한데, 아마존 세이지메이커 그라운드 트루스 플러스를 통해 정교한 레이블링 작업을 위한 사용자 지정 워크플로우와 사용자 인터페이스를 마련함으로써 선수 안전을 크게 개선할 수 있었다”라고 설명했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행·편집인 : 문창수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2022-01-20
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2022 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
인터넷신문위원회 abc협회 인증 ND소프트