Amazon SageMaker | AWS 기술 블로그

SageMaker AI로 해보는 GPT-OSS 추론 성능 테스트와 용량 산정

SageMaker AI 와 LLM 추론 개요 Amazon SageMaker AI는 데이터 과학자와 개발자를 위한 완전 관리형 ML 플랫폼 서비스입니다. 실험부터 배포까지 전체 ML 개발 과정을 단일 환경에서 처리할 수 있습니다. 필수 AI 라이브러리가 미리 설치된 주피터 노트북 포함하여 다양한 IDE를 지원하기 때문에 선호도에 맞는 개발 환경을 선택할 수 있습니다. 개발자들은 복잡한 인프라 관리에 대한 부담 없이 […]

카카오게임즈의 Amazon Bedrock 기반 실시간 채팅 번역 구축

카카오게임즈는 글로벌 게임 퍼블리셔이자 디벨로퍼로서, 언어와 지역, 환경의 경계를 넘어 전 세계 누구나 함께 즐길 수 있는 게임 경험을 만들어가고 있습니다. 모바일, PC 온라인, 콘솔 등 다양한 플랫폼을 아우르며, 전 세계 이용자들에게 고품질의 콘텐츠를 선보이고 있으며, 게임의 본질에 집중하여 지속 가능한 가치를 창출하는 동시에, 창의적이고 잠재력 높은 게임 IP를 발굴해 글로벌 시장에서 의미 있는 성과를 […]

무신사의 AI 기반 상품 추천 및 검색 시스템 구현 사례

무신사는 2001년 온라인 패션 커뮤니티로 시작하여 현재 약 1,500만 명의 회원을 보유한 국내 최대 패션 플랫폼으로 성장했습니다. 무신사 스토어에는 스트릿, 캐주얼, 디자이너, 하이엔드, 명품 등 다양한 브랜드가 입점해 있으며, 고객 맞춤형 쇼핑 경험을 제공합니다. 무신사는 패션 매거진, 오프라인 편집숍 등 다양한 사업을 전개하여 패션 생태계 전반을 아우르고 있으며, 최근에는 여성 패션, 라이프스타일, 뷰티 등으로 카테고리를 […]

Amazon OpenSearch Service 의 LTR 플러그인을 활용한 검색 품질 개선

개요 Amazon OpenSearch Service는 BM25(Best Match 25)라는 확률론적 순위 알고리즘을 사용하여 문서와 검색 키워드간 관련성 점수를 계산합니다. 문서에 고유 키워드가 더 자주 나타난다면 BM25 알고리즘은 해당 문서에 더 높은 점수를 부여합니다. 이는 검색 서비스에서 사용하는 인기 있는 알고리즘으로 사용자의 검색 의도에 맞게 키워드의 가중치를 조정하여 결과를 정렬합니다. 하지만, 이 알고리즘은 CTR(Click-through rate)과 같은 사용자의 행위는 […]

SK하이닉스의 RAG 플랫폼 구축 및 성능 평가/분석 연구 사례

이 블로그는 SK hynix 오세진 TL, 노정기 TL, 오태진 TL 이 함께 작성하였습니다. SK 하이닉스는 AI 시대라는 새로운 세상의 중심에 반도체가 있다는 사명감을 가지고 최고의 기술력을 향해 끊임없는 혁신을 이뤄 가고 있습니다. 세계 최고 성능의 HBM3를 최초 개발 및 출시한 데 이어 확장 버전인 HBM3E 역시 세계 최초 양산에 성공하며 메모리 반도체 시장을 선도하고 있고, 세계 […]

티머니의 MLOps 구현 사례 : Amazon SageMaker를 활용한 배차모델 자동화 및 배포

이 블로그는 티머니의 반용주 매니저, 구현서 매니저, 오지훈 매니저와 함께 작성되었습니다 티머니는 ‘이동을 편하게, 세상을 이롭게’를 경영철학으로, ‘더 편한 이동과 결제를 위한 플랫폼 기업’으로 성장하고 있습니다. 티머니는 세계적으로 기술력을 인정 받고 있는 ‘티머니 교통카드 시스템’을 기반으로 대중교통 정산 및 모바일티머니 서비스를 제공하며, 뉴질랜드, 말레이시아, 몽골 등 전 세계에 교통카드 시스템을 수출하고 있습니다. 티머니는 ‘고객’과 ‘공익성’을 […]

Amazon S3 데이터 레이크와 기계학습을 위한 Snowflake 통합 파이프라인 플랫폼 구축하기

인공지능과 기계학습 기술의 상용화로, 기업들은 대량의 데이터를 효과적으로 수집, 저장, 관리할 필요성을 점차 인식하고 있습니다. 데이터 레이크(Data Lake)는 이러한 필요성에 부응하여, 다양한 소스로부터 대규모의 데이터를 실시간으로 수집하고 저장함으로써 기업의 의사결정과 혁신을 지원합니다. 이제 데이터 레이크는 기업이 데이터 자산을 최대한 활용하고 비즈니스 가치를 창출하는 핵심 요소로 자리 잡고 있습니다. 정형, 반정형, 비정형 데이터 등 다양한 유형의 […]

자동차 산업을 위한 AWS re:Invent 2024 요약

이 글은 AWS for Industries 블로그에 게시된 글 (AWS re:Invent 2024 recap for the Automotive Industry)를 한국어로 번역 및 편집하였습니다. AWS의 대표적인 연례 컨퍼런스 AWS re:Invent 2024에서, 2024년 12월 2일부터 6일까지 한주 동안 AWS는 기조연설, 브레이크아웃 세션, 신제품 출시, 그리고 다양한 데모를 통하여 최신 혁신과 서비스를 공개하였습니다. 본 요약은 자동차 산업과 관련된 주요 발표 내용, […]

Cohere Rerank를 사용한 RAG 성능 향상

검색 증강 생성(RAG)은 기업이 실시간 데이터를 통합하고 독점 데이터를 사용하여 더욱 풍부하고 상호작용적인 대화를 가능하게 하는 Generative AI(생성형 AI) 애플리케이션을 개발할 수 있도록 돕는 강력한 기술입니다. RAG를 활용하면 이러한 AI 애플리케이션이 외부의 신뢰할 수 있는 도메인별 데이터를 효과적으로 사용하여 사용자 쿼리에 대한 언어 모델의 문맥을 강화할 수 있습니다. 하지만, 응답의 신뢰성과 정확도는 적절한 도메인 데이터를 […]

이미지 비디오 Multi-modal 추론 모델, LLaVA-NeXT-Video 모델을 Amazon SageMaker에 배포하기

LLaVA-NeXT-Video 모델 소개 LLaVA-NeXT-Video 모델은 LLaVA-NeXT의 후속 모델로, 비디오 이해 능력을 강화한 대형 멀티모달 모델 (Large Multimodal Model, LMM)입니다. 이 모델은 주로 텍스트-이미지 데이터로 학습된 LLaVA-NeXT를 기반으로 하여 비디오 데이터에 대한 성능을 향상시키기 위해 개발되었습니다. 주요 특징 제로샷(Zero-shot) 비디오 표현 능력: LLaVA-NeXT-Video는 AnyRes 기술을 활용하여 고해상도 이미지를 여러 이미지로 분할하고, 이를 사전 학습된 비전 트랜스포머 […]

AWS 기술 블로그

Category: Amazon SageMaker