Amazon Web Services 한국 블로그
Category: Analytics
Amazon Elasticsearch Service, 한국어 분석을 위한 ‘은전한닢’ 플러그인 지원
Amazon Elasticsearch Service에서 유명한 오픈 소스 한국어 텍스트 분석기인 은전한닢(Seunjeon) 플러그인을 지원합니다. 이를 통해Amazon ES를 사용하는 개발자가 한국어 문서에 대한 전체 텍스트 검색을 쉽게 구현할 수 있습니다. 본 플러그인은 내부적으로 한국어 사전을 사용하며 복합어를 인식하고 문맥에 따라 단어를 구분할 수 있습니다. 각 개발자는 플러그인을 사용하여 토큰화(문자열을 단어로 분리), 형태소 분석(텍스트를 루트 형식으로 변환), 중지 단어 […]
AWS Glue 기반 Amazon Aurora 데이터 추출 및 Quicksight 시각화 하기
AWS Glue는 서버리스 ETL 서비스로 데이터 분석을 위해 손쉽게 데이터를 준비하고 로딩할 수 있도록 지원하는 서비스 입니다. AWS Glue는 AWS에 저장된 데이터의 메타 데이터를 통해 데이터 카탈로그를 생성하고, 해당 카탈로그로 다양한 서비스에서 데이터에 접근하여 사용할 수 있습니다. 이 글에서는 실제 많은 고객들이 서비스 운영 데이터베이스로 사용하고 있는 Amazon Aurora의 DB 데이터를 AWS Glue를 통해 데이터 […]
Amazon Kinesis Video Streams – 시각 지원 앱을 위한 서버리스 비디오 수집 및 저장
휴대폰, 보안 카메라, 아기용 모니터, 드론, 웹캠, 대시보드 카메라, 심지어 위성까지 모든 것들이 고강도의 고품질 비디오 스트림을 생성할 수 있습니다. 이제 가정, 사무실, 공장, 도시, 거리 및 고속도로 곳곳에 수많은 카메라가 있습니다. 홍수와 기타 자연 재해의 속성을 측정하고, 공공 안전을 높이고, 여러분의 자녀가 안전한지 알려줄 수 있습니다. 개인별 재미 있는 영상 속에서 멋진 순간을 저장하거나 […]
Amazon Redshift Spectrum에 대한 10가지 모범 사례
지난 4월 Amazon Redshift Spectrum 출시 이후, 이번 주에는 서울 리전에도 출시하였습니다. 이 글에서는 한국 고객 분들이 Redshift Specturm을 더 잘 활용하기 위한 10가지 모범 사례를 전달해 드립니다. Amazon Redshift Spectrum 을 사용하면 Amazon S3에 저장된 데이터에 대해 Amazon Redshif SQL 쿼리를 실행할 수 있습니다. 즉, Amazon Redshift의 분석 기능을 데이터웨어 하우스(DW) 내 로컬 디스크에 […]
Amazon QuickSight 업데이트 – 공간 정보 시각화, 프라이빗 VPC 액세스 등
AWS에서는 특별히 기념일에 축하하는 경우가 많지 않습니다. 지금까지 AWS에서 제공하는 100여개의 서비스를 개발하면서 축하를 했다면, 아마 일주일에 몇 번이나 케이크와 샴페인을 마셨을 것입니다. 저희는 그보다 고객의 의견을 경청하고 혁신하는 데 더 시간을 쏟고 있습니다. 이에 따라 정식 출시된 지 일 년이 조금 넘은 Amazon QuickSight에 대한 새로운 기능 업데이트를 제공해 드리고자 합니다. QuickSight 실행 운송, […]
AWS PrivateLink 출시 – VPC내 AWS 서비스 엔드 포인트 서비스
이 글은 Amazon Virtual Private Cloud의 선임 엔지니어인 Colm MacCárthaigh가 작성한 것입니다. VPC 엔드포인트가 2015년에 출시된 이후, 인터넷 게이트웨이, NAT 게이트웨이 또는 방화벽 프록시 없이 Amazon Virtual Private Cloud(VPC)에서 S3 및 DynamoDB에 안전하게 액세스하는 방법으로 엔드포인트가 인기를 끌고 있습니다. VPC 엔드포인트를 사용하면 VPC와 AWS 서비스 사이의 라우팅이 AWS 네트워크에서 처리되고 IAM 정책을 사용하여 서비스 리소스에 […]
Amazon S3 및 AWS Glue를 이용한 데이터 레이크 구축하기
데이터 레이크(Data Lake)는 다양한 유형의 대량 데이터를 처리해야 하는 과제를 해결하는 데이터 저장 및 분석 방법으로서 점차 인기를 얻고 있습니다. 데이터 레이크를 사용하면 모든 데이터(정형 및 비정형)를 중앙 집중식 리포지토리 한 곳에 저장할 수 있습니다. 데이터를 있는 그대로 저장할 수 있으므로 데이터를 사전 정의된 스키마로 변환할 필요가 없습니다. 많은 기업들은 데이터 레이크에서 Amazon S3를 사용하는 […]
Amazon Redshift, 비용 최적 고밀도 컴퓨팅(DC2) 노드 활용하기
Amazon Redshift를 사용하면 엑사바이트 규모의 데이터를 빠르고 쉽고 비용 효율적으로 분석할 수 있습니다. 이 솔루션은 병렬 실행, 압축된 컬럼 방식 스토리지, 종단 간 암호화 등과 같은 고급 데이터 웨어하우징 기능을 종합 관리형 서비스로 제공합니다. 비용은 TB당 연간 $1,000 미만입니다. Amazon Redshift Spectrum을 사용하면 Amazon S3에서 엑사바이트 규모의 비정형 데이터에 대해 SQL 쿼리를 직접 실행할 수 있습니다. […]
Amazon Athena, 서울 리전 출시
오늘 Amazon Athena 서비스가 서울 리전에 출시되었습니다. Amazon Athena는 표준 SQL을 사용해 Amazon S3에 저장된 데이터를 간편하게 분석할 수 있는 대화식 쿼리 서비스로서, 서버리스 기반 서비스이므로 관리할 인프라가 없으며 실행한 쿼리에 대해서만 비용을 지불하는 데이터 분석 서비스입니다. Amazon Athena 서비스에 대한 자료 모음입니다. [블로그] Amazon Athena – 초단위 페타바이트급 동적 데이터 질의 서비스 [블로그] Amazon […]
Amazon Elasticsearch Service, VPC 지원 기능 출시
지난주 Amazon VPC 내부에서 NAT 인스턴스나 인터넷 게이트웨이 없이도 Amazon Elasticsearch Service 도메인에 접속할 수 있습니다. Amazon ES용 VPC 지원은 구성하기 쉽고 안정적이면서도 보안이 한층 강화되어 있습니다. VPC 지원을 통해 다른 서비스와 Amazon ES 간 트래픽이 퍼블릭 인터넷과 분리된 AWS 네트워크 내에 완전히 유지됩니다. 기존 VPC 보안 그룹을 사용하여 네트워크 액세스를 관리하고, AWS Identity and […]