AWS 기술 블로그

Category: Amazon SageMaker

이미지 비디오 Multi-modal 추론 모델, LLaVA-NeXT-Video 모델을 Amazon SageMaker에 배포하기

LLaVA-NeXT-Video 모델 소개 LLaVA-NeXT-Video 모델은 LLaVA-NeXT의 후속 모델로, 비디오 이해 능력을 강화한 대형 멀티모달 모델 (Large Multimodal Model, LMM)입니다. 이 모델은 주로 텍스트-이미지 데이터로 학습된 LLaVA-NeXT를 기반으로 하여 비디오 데이터에 대한 성능을 향상시키기 위해 개발되었습니다. 주요 특징 제로샷(Zero-shot) 비디오 표현 능력: LLaVA-NeXT-Video는 AnyRes 기술을 활용하여 고해상도 이미지를 여러 이미지로 분할하고, 이를 사전 학습된 비전 트랜스포머 […]

프리킥 챌린지를 위한 생성형 AI 솔루션을 AWS 서비스로 구현하기

이 블로그에서 소개하는 AWS Seoul Summit 2024 “AWS 프리킥 챌린지”에서는 기존의 슈팅 속도 확인 서비스에 더해, 참가자들에게 특별한 경험을 선사하기 위해 생성형 AI 서비스를 도입했습니다. 챌린지 참가자들은 프리킥 슈팅 후 자신의 슬로우 킥 모션을 분석한 영상을 제공받으며, 자신이 유니폼을 착용한 모습으로 합성된 기념 사진을 받을 수 있습니다. 또한, 현장에 직접 참석하지 않더라도 실시간 라이브 중계를 […]

Amazon SageMaker와 Airflow를 이용한 SK브로드밴드의 MLOps 플랫폼 구축 사례

SK브로드밴드는 ASDL 상용화, Pre-IPTV 서비스 제공 등 통신 방송 시장을 선도하며, 동시에 미디어 비즈니스 모델 다변화를 통한 종합 미디어 플랫폼 기업으로 성장하고 있습니다. SK텔레콤과 One Body 체계로 T-B 시너지를 극대화하여 AI/DT 기반 미디어, B2B, 인프라 분야를 확장해나가고 있습니다. 이제는 ‘AI COMPANY’라는 전사 지향점을 중심으로 비즈니스 전 영역에 걸친 AI 전환을 추진하여 사업 경쟁력을 지속적으로 강화해 […]

AWS CDK를 활용한 OpenAI Whisper 모델 Amazon SageMaker Endpoint 배포 자동화

OpenAI Whisper 모델은 MIT 라이선스를 가진 자동 음성 인식(Automatic Speech Recognition, ASR) 및 음성 번역을 위한 사전 훈련 모델입니다. OpenAI Whisper 모델은 CNN과 Transformer 아키텍처를 결합한 모델로, 68만 시간의 라벨링된 데이터로 훈련되었으며, 작은 크기에도 불구하고 높은 정확도를 보입니다. 특히 파인튜닝(fine-tuning) 없이도 다양한 데이터셋과 도메인에 잘 일반화되는 것이 큰 장점입니다. 또한 전사(transcribe), 번역, 언어 식별, 발화자 […]

Amazon Bedrock의 파운데이션 모델을 활용한 효과적인 PDF 파싱을 위한 프롬프트 엔지니어링 기법

데이터는 현대 비즈니스의 핵심 자산이며, 기업은 이를 문서, 보고서, 계약서 등 다양한 형태의 정보로 변환하여 보유하고 있습니다. 그리고, 이러한 정보의 상당수는 PDF 와 같은 문서 형식으로 저장되어 있습니다. PDF는 문서 공유와 보전에는 편리하지만, 내부 데이터를 추출하고 가치 있는 인사이트를 도출하기에는 다양한 기술적 접근이 고려되어야 합니다. PDF 파일에서 데이터를 추출할 때, 추출 대상이 스캔 된 이미지인 […]

AWS ParallelCluster와 Amazon SageMaker를 이용한 바이옴에이츠의 미생물 복합 균주 개발 사례

바이옴에이츠(BIOMATZ)는 2022년 4월에 설립된 마이크로바이옴 복합 균주 설루션 개발사로, “Biome is our mates”라는 철학을 갖고 있으며, 마이크로바이옴 의약품 연구 개발 분야의 대표적인 스타트업 기업입니다. 수천 개의 균 사이의 상호작용을 분석하여 최적의 ‘메이트(Mates)’를 조합하는 AI 기술인 BASyMCo를 보유하고 있습니다. 당사는 장내미생물 빅데이터를 활용하여 마이크로바이옴 복합 균주 치료제 개발에 전념하고 있습니다. [영상] 바이옴에이츠 기업 소개 | Biome […]

생성형 AI로 만드는 나만의 이력서: 웅진 IT의 Amazon Bedrock과 SageMaker 활용 사례

웅진은 디지털 신기술을 활용하여 기업 고객의 디지털 전환을 선도하는 IT기업으로, SAP ERP, 렌탈 솔루션, 모빌리티 솔루션 및 클라우드 서비스를 포함하여 지난 20년 동안 대외 사업을 진행하고 있습니다. 현재 전체 매출의 85%를 대외 사업에서 창출하며, 1,300여개 고객사와 협력하고 있습니다. 고객사의 산업별, 규모별 특성을 고려하여 최적의 고객 맞춤형 IT 솔루션을 제공하고 있습니다. ‘AI 이력서’ 서비스는 웅진이 개발한 […]

Amazon OpenSearch Service의 AI/ML 커넥터로 Neural 검색 강화

OpenSearch 2.9에서 Amazon OpenSearch Service의 Neural 검색 기능이 출시되며, AI/ML 모델과 통합하여 시맨틱 검색 및 다양한 검색 기능을 손쉽게 강화할 수 있습니다. OpenSearch Service는 2020년에 k-NN(k-최근접 이웃) 기능을 도입한 이래 어휘 검색과 벡터 검색을 모두 지원해 왔지만, 시맨틱 검색을 구성하려면 머신 러닝(ML) 모델을 통합하여 색인 및 검색할 수 있는 프레임워크를 구축해야 했습니다. Neural 검색 기능은 […]

Amazon SageMaker와 통합된 Amazon DataZone으로 머신러닝 거버넌스를 간소화하기

Amazon SageMaker는 머신러닝(ML) 모델을 구축, 학습 및 배포하기 위한 다양한 도구와 기능을 제공하는 완전 관리형 ML 서비스입니다. Amazon DataZone은 고객이 AWS, 온프레미스 및 타사 소스에 저장된 데이터를 더 빠르고 쉽게 카탈로그화, 검색, 공유 및 관리할 수 있도록 지원하는 데이터 관리 서비스입니다. 저희는 오늘 보안 제어 기능을 갖춘 인프라를 설정하고, 머신러닝 (ML) 프로젝트에서 협업하고, 데이터 및 […]

AWS 인공 지능 (AI) 및 기계 학습 (ML) 서비스를 사용한 비디오 요약

이 글은 AWS M&E Blog에 게시된 Video summarization with AWS artificial intelligence (AI) and machine learning (ML) services를 한국어 번역 및 편집하였습니다. 동영상 제작사와 방송사는 짧은 쇼츠 비디오 클립이 젊은 시청자의 관심을 끄는 데 효과적이라는 것을 알고 있습니다. 젊은 시청자 중 다수는 틱톡과 같은 플랫폼에서 짧은 형식의 콘텐츠를 좋아합니다. 전통적인 M&E 업계의 기업들이 오리지널 콘텐츠에서 짧은 […]