AWS 기술 블로그

Category: Intermediate (200)

모델의 정확도와 품질 향상을 위해 Amazon Bedrock에서 Anthropic’s Claude 3 Haiku 모델 미세 조정하기

이 글은 AWS Machine Learning Blog에 게시된 ‘Fine-tune Anthropic’s Claude 3 Haiku in Amazon Bedrock to boost model accuracy and quality‘ by Yanyan Zhang를 한국어 번역 및 편집하였습니다. Amazon Bedrock에서 제공되는 Anthropic Claude와 같은 최첨단 대규모 언어 모델(LLM)은 방대한 양의 데이터를 학습하여 인간과 같은 텍스트를 이해하고 생성할 수 있습니다. Anthropic Claude 3 Haiku를 독점 데이터셋으로 […]

애플리케이션 개발자를 위한 PostgreSQL 아키텍처 고려사항: 파트 1

이 글은 AWS Database 블로그의 PostgreSQL architecture considerations for application developers: Part 1 by Peter Celentano and Tracy Jenkins의 한국어 번역입니다. 클라우드 아키텍처에서 애플리케이션 계층이 외부와 소통하는 핵심 역할을 함에도 불구하고, 우리는 종종 사용 중인 데이터베이스에 맞춰 애플리케이션을 최적화하는 방법을 간과하고는 합니다. 관계형 데이터베이스를 사용할 때는 단순히 스키마 설계에만 집중할 것이 아니라, 데이터베이스가 저장 시스템과 […]

생성형 AI 워크로드에 대한 보안 사고 대응 방법 소개

이 글은 AWS Security Blog에 게시된 Methodology for incident response on generative AI workloads by Anna McAbee, Jennifer Paz, AJ Evans, and Steve de Vera를 한국어로 번역 및 편집하였습니다. AWS 고객 사고 대응팀(CIRT)은 생성형 AI 기반 애플리케이션과 관련된 보안 사고를 조사하는데 사용할 수 있는 방법론을 개발했습니다. 생성형 AI 워크로드와 관련된 보안 이벤트라고 하더라도, 여전히 AWS […]

Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 3 – Amazon Elastic Kubernetes Service (EKS) 기반의 GPU 클러스터

서론 “Amazon EC2 가속 컴퓨팅 인스턴스 활용하기” 블로그 시리즈는 Amazon EC2의 가속 컴퓨팅 인스턴스와 AWS에서 제공되는 다양한 리소스를 이용하여, 멀티 노드 가속 컴퓨팅 환경을 쉽게 구축할 수 있는 방법에 대해서 알아 봅니다. 블로그는 아래와 같이 3개의 시리즈로 구성이 되어 있으며, 파트 1에서는 AWS Deep Learning AMI (DLAMI)를 사용한 쉽고 빠른 컴퓨팅 환경 구축에 대해서 알아 […]

Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 2 – AWS ParallelCluster

서론 “Amazon EC2 가속 컴퓨팅 인스턴스 활용하기” 블로그 시리즈는 Amazon EC2의 가속 컴퓨팅 인스턴스와 AWS에서 제공되는 다양한 리소스를 이용하여, 멀티 노드 가속 컴퓨팅 환경을 쉽게 구축할 수 있는 방법에 대해서 알아 봅니다. 블로그는 아래와 같이 3개의 시리즈로 구성이 되어 있으며, “Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 1 – AWS Deep Learning AMI (DLAMI)”에서 […]

Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 1 – AWS Deep Learning AMI (DLAMI)

서론 전통적인 고성능 컴퓨팅(HPC, High Performance Computing) 뿐만 아니라, 인공지능, 기계 학습, 그리고 생성형 AI의 활용도가 높아짐에 따라, 고성능 GPU가 장착된 가속 컴퓨팅을 위한 하드웨어의 수요와 사용률이 급격히 증가하고 있습니다. 이는 온프레미스 데이터센터 뿐만 아니라 클라우드에서도 동일한 현상이 나타나고 있습니다. AWS와 같은 클라우드 서비스 제공업체를 통한 빠른 컴퓨팅 리소스의 공급, 구축, 그리고 온디맨드 방식의 과금은 […]

리전 AWS STS 엔드포인트 사용하기

이 글은 AWS Big Data 블로그의 How to use Regional AWS STS endpoints by Darius Januskis의 한국어 번역입니다. 이 블로그 포스팅에서는 글로벌 (현재 레거시) AWS Security Token Service (AWS STS) 엔드포인트의 가용성이 예기치 않게 감소하는 경우 복원력을 개선하는 데 도움이 되는 권장 사항을 제공합니다. 글로벌 (레거시) AWS STS 엔드포인트 https://sts.amazonaws.com은 가용성이 높지만 단일 AWS 리전—미국 동부 […]

AWS 서비스 파트너와 함께 구축한 타이거컴퍼니의 Amazon Bedrock 기반 문서 질의 챗봇 사례

타이거컴퍼니는 쉽게 일하는 방법을 고민하고 업무에 필요한 모든 서비스를 하나의 플랫폼에서 제공하는 SaaS 협업 전문기업입니다. 기업은 물론 공공기관까지 폭넓은 서비스를 제공하고 있으며 SaaS, 구축형, 하이브리드 방식까지 고객이 원하는 어떠한 방식도 수용 가능한 기술과 전문가들을 보유하고 있습니다. 최근 AI 기술들이 협업 툴에도 많은 시도가 이뤄지고 있으며 타이거컴퍼니도 RAG(검색 증강 생성, Retrieval-Augmented Generation)와 생성형 AI를 활용하여 기업의 […]

새로운 작업 관측성 지표를 사용하여 AWS Glue 작업에 대한 모니터링 및 디버깅 강화, 3부: Amazon QuickSight를 사용한 시각화 및 추세 분석

이 글은 AWS Big Data Blog에 게시된 Enhance monitoring and debugging for AWS Glue jobs using new job observability metrics, Part 3: Visualization and trend analysis using Amazon QuickSight by Noritaka Sekiyama를 한국어 번역 및 편집하였습니다. 이 시리즈의 2부에서는 AWS Glue 작업 관측성 지표를 활성화하고 실시간 모니터링을 위해 Grafana와 통합하는 방법을 논의했습니다. Grafana는 파이프라인 상태를 볼 […]

새로운 작업 관측성 지표를 사용하여 AWS Glue 작업에 대한 모니터링 및 디버깅 강화, 2부: Grafana를 사용한 실시간 모니터링

이 글은 AWS Big Data Blog에 게시된 Enhance monitoring and debugging for AWS Glue jobs using new job observability metrics, Part 2: Real-time monitoring using Grafana by Noritaka Sekiyama를 한국어 번역 및 편집하였습니다. 문제를 조기에 파악하고 중단을 최소화하려면 데이터 파이프라인을 실시간으로 모니터링하는 것이 중요합니다. AWS Glue는 AWS Glue를 기반으로 구축된 데이터 통합 파이프라인에 대한 귀중한 통찰력을 […]