게시된 날짜: Jun 5, 2018

이제 Amazon S3에서 Amazon Redshift로 Apache Parquet 및 Apache ORC 파일 형식을 COPY할 수 있습니다. Parquet과 Apache ORC는 사용자가 데이터를 효율적이고 경제적으로 저장할 수 있게 해 주는 컬럼 데이터 형식입니다. 이 업데이트를 통해 Redshift는이제 AVRO, CSV, JSON, Parquet, ORC 및 TXT의 6가지 파일 형식의 COPY를 지원하게 되었습니다.

Parquet 또는 ORC 복사를 위한 명명법은 기존 COPY 명령과 동일합니다. 예를 들어, Amazon S3 위치 "s3://mybucket/data/listings/parquet/"의 "parquet" 폴더 내에 있는 Parquet 파일을 로드하려면 다음 명령을 사용할 수 있습니다.

COPY listing
FROM 's3://mybucket/data/listings/parquet/'
IAM_ROLE 'arn:aws:iam::0123456789012:role/MyRedshiftRole'
FORMAT AS PARQUET;

이 새로운 기능은 S3 스탠다드, S3 스탠다드-Infrequent Access 및 S3 One Zone-Infrequent Access를 포함한 모든 범용 Amazon S3 스토리지 클래스를 지원합니다. 현재 버전의 COPY 함수는 FROM, IAM_ROLE, CREDENTIALS, STARTUPDATE 및 MANIFEST와 같은 일부 파라미터를 지원합니다. 후속 버전은 더 많은 COPY 파라미터를 포함할 예정입니다. Amazon Redshift 설명서에는 이 함수에 대한 현재 제한이 나열되어 있습니다.

Parquet 및 ORC의 COPY는 미국 동부(버지니아 북부, 오하이오), 미국 서부(오레곤, 캘리포니아 북부), 캐나다(중부), 남아메리카(상파울루), EU(프랑크푸르트, 아일랜드, 런던), 아시아 태평양(뭄바이, 서울 싱가포르, 시드니, 도쿄) AWS 리전에서 최신 릴리스 <1.0.2294>와 함께 제공됩니다.