AWS 기술 블로그

Amazon EKS 워크로드의 지속적인 복원력 확인을 위한 카오스 엔지니어링 (Chaos Engineering)

카오스 엔지니어링은 실제 운영환경에서 발생하는 다양한 장애 상황을 견딜 수 있는 시스템을 구축하기 위해 시스템의 신뢰성을 실험하는 방법입니다. 대규모 분산 소프트웨어 시스템의 발전은 산업의 발전 방향을 바꾸고 있습니다. 엄청난 규모의 데이터를 기반으로 기계학습, 빅데이터 분석, 사물인터넷 등이 가능하게 되었습니다. 또한, 소프트웨어 엔지니링의 판도도 바꾸었습니다. 하나의 산업으로서, 우리는 개발의 유연성과 배포 속도를 높이는 모범 사례들을 빠르게 […]

Amazon CloudFront를 활용한 미디어 서비스 모니터링 방안, 1부 : 표준 로그 기반 분석

미디어 서비스 환경에서 최종사용자와 직접 통신하는 콘텐츠 전송 네트워크(CDN)의 성능 및 가용성을 모니터링하는 것은 매우 중요합니다. 모든 미디어 데이터는 CDN 인프라를 통해 최종사용자에게 전달되므로 콘텐츠 공급자는 CDN 캐시서버와 최종사용자 사이의 네트워크 통신에 대한 가시성을 확보할 필요가 있습니다. 만약 해당 구간의 실시간 트렌드 모니터링에 대한 가시성을 확보할 수 있다면, 지역별 트래픽 패턴이나 에러율 패턴 혹은 성능 […]

AWS IoT Core를 활용해 CloudWatch 알람을 음성으로 수신하기

AWS 사용자들은 CloudWatch를 사용해 AWS 리소스들을 모니터링하고 알람을 생성해 이상 상황을 확인 할 수 있습니다. 나아가 Amazon SNS와 연계하여 CloudWatch에서 생성한 알람들을 텍스트 기반의 이메일/SMS/슬랙과 같은 방법으로 수신 할 수 있습니다. 그러나 사용자의 서비스에 영향을 줄 수 있는 중요한 알람이 발생했지만, AWS 사용자들이 텍스트 알람을 즉시 확인하지 못하는 상황이라면 어떻게 될까요? 사용자가 알람을 확인하고 조치하기까지 […]

Amazon File Cache로 하이브리드 클라우드 워크로드를 가속화 및 단순화 하기

이 글은 클라우드의 컴퓨팅 자원에서 온-프레미스의 데이터셋에 접근하는 하이브리드 클라우드 워크로드를 대상으로, Amazon File Cache를 통해 애플리케이션을 가속화, 단순화 하는 방법을 소개합니다. 이 글을 통해, 독자들은 Amazon File Cache 사용의 장점과 구체적 활용 방법에 대해 이해할 수 있습니다. Amazon File Cache는 클라우드에서 고성능 연산을 수행하는 애플리케이션이 원거리 데이터에 높은 대역폭과 낮은 지연시간으로 접근할 수 있도록 […]

완전 관리형 AI 서비스를 활용하여 서버리스로 책 읽어주는 서비스 이용하기

카메라로 사진을 찍으면 번역해주거나 카메라로 찍은 이미지를 읽어주는 앱은 기계 학습(Machine Learning) 기술을 활용하고 있습니다. 이런 기계 학습 모델을 직접 개발하는 것은 상당한 기술적 노하우를 요구합니다. AWS에서는 Amazon SageMaker와 같이 기계 학습 모델을 개발하는 서비스 이외에도 다양한 완전 관리형(Managed) AI 서비스를 제공하고 있어서 기계 학습에 숙련된 인력이 없더라도 기계 학습 기반의 서비스를 쉽게 개발할 수 […]

Figure-3. Read-local-write-partitioned-pattern-for-multi-site-active-active-DR-strategy

AWS 기반 재해복구(DR) 아키텍처, 4부: 액티브/액티브 멀티 사이트

  이 글은  AWS Architecture Blog에 게시된 Disaster Recovery (DR) Architecture on AWS, Part IV: Multi-site Active/Active by Seth Eliot 을 한국어로 번역 및 편집하였습니다.  AWS 블로그의 재해복구 연재 글에서 네 가지 재해복구 전략을 소개하였습니다. 이 중 세가지 전략, 백업/복구,  파이럿 라이트와 웜 스탠바이 액티브/패시브 전략의 구성을 예제와 함께 알아보았습니다. 이번 블로그에서는 워크로드와 사용자 요청을 두 […]

LG전자의 Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보

LG전자는 전자, 가전 분야의 혁신적인 기술로 세계적인 일류기업 자리를 지키고 있으며,  가전제품과 서비스를 아우르는 LG ThinQ 플랫폼을 통해, 앱 하나로 언제 어디서나 가전 제품은 물론, 집안 곳곳을 컨트롤 할 수 있고, 일상을 보다 편리하게 누릴 수 있는 새로운 고객경험을 제공하고 있습니다. LG전자는 LG ThinQ 플랫폼의 글로벌 서비스를 안정적이고 확장성 있는 서비스로 구축하였으며, AWS IoT와 서버리스 […]

Amazon SageMaker로 컬리(Kurly) 상품 후기 분류 모델 개발하기

컬리는 신선식품으로 출발하여 화장품을 품어 뷰티컬리로 새로운 서비스를 출시하게 되었습니다. 새로운 서비스가 나오면서 더욱 중요하게 된 영역은 바로 고객의 상품 후기(feedback) 입니다. 사용자가 작성한 제품 리뷰는 다른 사용자에게 중요한 정보가되는데, 작성된 리뷰는 정형화 되어 있지 않기 때문에 모든 리뷰를 읽지 않는 이상 제품 정보를 파악하기 힘들고, 내용이 길기에 중간에 포기 할 수도 있습니다. 이에 리뷰에서 […]

AWS MediaLive, AWS MediaPackage기반 라이브 스트리밍 워크플로 Observability 확보하기

AWS에서 제공하는 다양한 미디어 서비스를 활용하면 비지니스에 필요한 라이브/온디맨드 비디오 워크플로를 손쉽게 구축하고 자연스럽게 운영 서비스의 높은 내구성과 이중화를 달성할 수 있습니다. 이로 인해 사용자는 서비스 성능 유지 및 상태에 집중할 수 있게 되는 데, 여기서 빼놓을 수 없는 부분이 바로 모니터링입니다. 특히 스포츠 중계와 같이 시청자 트래픽이 몰리는 시점에 화면의 끊김 현상과 같은 좋지 […]

Stable Diffusion을 Amazon SageMaker JumpStart로 편리하게 이용하기

Stable Diffusion 모델을 이용하면 텍스트를 이용하여 창조적인 이미지를 생성할 수 있습니다. AWS에서는 Amazon SageMaker JumpStart을 이용하여 기계 학습(ML)을 쉽게 사용할 수 있도록 사전 학습(pre-trained)된 모델을 제공하고 있는데, 2022년 10월 부터 Stable Diffusion 모델을 추가적으로 제공하고 있습니다. 이를 통해 Stable Diffusion 이미지를 쉽게 생성할 수 있으며, 즉시 Serving할 수 있도록 SageMaker Endpoint도 제공합니다. SageMaker Endpoint는 트래픽이 증가할 […]