데이터 스토어란 무엇인가요?
데이터 스토어는 컴퓨터 시스템에 정보를 저장하고 보호하는 디지털 리포지토리입니다. 데이터 스토어는 네트워크에 연결된 스토리지, 분산된 클라우드 스토리지, 물리적 하드 드라이브 또는 가상 스토리지일 수 있습니다. 정보 테이블과 같은 정형 데이터와 이메일, 이미지 및 비디오와 같은 비정형 데이터를 모두 저장할 수 있습니다. 조직은 데이터 스토어를 사용하여 비즈니스 단위 간에 정보를 보존, 공유 및 관리합니다.
데이터 스토어가 중요한 이유는 무엇일까요?
데이터 스토어를 사용하여 컴퓨터 시스템에 정보를 신뢰성 높게 저장하고 데이터 손실을 방지할 수 있습니다. 컴퓨터 시스템은 영구 스토리지 디바이스에 정보를 저장합니다. 영구 스토리지는 비휘발성이므로 디바이스의 전원이 꺼진 후에도 스토리지에서 데이터가 유지됩니다. 따라서 컴퓨터 시스템의 전원을 다시 켠 후에 동일한 데이터에 액세스할 수 있습니다.
기업들은 데이터 스토어를 사용하여 규정 준수에 있어서 중요한 운영, 분석, 보고 및 데이터 보존을 위해 데이터를 관리하고 분류하고 간소화합니다. 데이터 스토어의 사용 사례는 애플리케이션에서 생성하고 사용하는 데이터의 저장, 데이터 아카이빙, 데이터 분석, 재해 복구 등 다양합니다.
복잡한 데이터 요구 사항 때문에 기업에서는 다양한 유형의 데이터 스토리지 인프라를 사용하여 접근성, 이중화, 거버넌스, 투명성을 제공합니다. 예를 들어 조직들은 서버리스 파일 시스템에 Amazon Elastic File System(Amazon EFS)를 사용하고 객체 스토리지에 Amazon Simple Storage Service(S3)를 사용합니다.
데이터 스토어 관련 용어는 어떤 것들이 있나요?
데이터 스토리지와 관련해서, 혼용되는 용어들이 있지만 실제 의미는 조금씩 다릅니다. 다음은 몇 가지 예입니다.
데이터베이스
데이터베이스는 체계화된 스토리지 시스템입니다. 대부분의 데이터베이스는 관계형 데이터베이스 아키텍처를 기반으로 합니다. 관계형 데이터베이스 관리 시스템(RDBMS)을 사용하면 특정 데이터 포인트와 연결된 테이블에 데이터를 저장할 수 있습니다. 조직은 데이터베이스를 사용하여 회계, 판매 및 관리 로그와 같은 트랜잭션 데이터를 저장합니다.
데이터 스토어와 데이터베이스 비교
데이터 스토어에 대해 논하려면 정보를 저장하고 검색하는 다양한 방법을 이야기해야 합니다. 데이터베이스는 애플리케이션에서 데이터를 손쉽게 저장, 공유 및 검색할 수 있는 방법 중 하나입니다. 데이터베이스는 파일 시스템과 달리 데이터를 구성하고 포맷하고 데이터베이스에 저장하는 방법에 대한 특정 규칙을 준수합니다.
데이터 웨어하우스
데이터 웨어하우스는 다양한 소스로부터 획득한 비즈니스 관련 정보의 포괄적인 모음입니다. 기업은 데이터 웨어하우스를 사용하여 비즈니스 인텔리전스와 분석을 지원합니다. 비즈니스 분석가와 데이터 사이언티스트는 데이터 웨어하우스에서 유용한 인사이트를 도출합니다.
데이터 스토어와 데이터 웨어하우스 비교
데이터 스토어는 정보를 저장하고 검색하기 위한 다양한 하드웨어, 기술, 형식 및 아키텍처를 아우르는 포괄적인 용어입니다. 데이터 웨어하우스는 기업의 분석 데이터를 통합하는 데 사용되는 특정한 유형의 데이터 스토어입니다. 예를 들어 GE Renewable Energy는 AWS Redshift를 사용하여 수집된 데이터에서 새로운 인사이트를 도출합니다.
데이터 스토어는 어떻게 작동하나요?
물리적 데이터 스토리지 디바이스는 데이터 스토어의 기반 기술입니다. 파일, 테이블 또는 블록과 같은 특정 형식으로 디바이스에서 정보를 읽고 쓸 수 있습니다. 디바이스는 로컬, 원격 또는 클라우드에 있을 수 있습니다. 대규모 데이터 스토어는 일반적으로 서로 다른 지리적 위치에 있는 여러 물리적 디바이스에 분산됩니다. 소프트웨어 시스템과 서비스는 데이터 스토어의 기본 운영을 추상화합니다.
다음은 물리적 디바이스의 몇 가지 예입니다. 데이터 스토리지 디바이스 유형별로 보안 및 이중화 수준이 서로 다릅니다.
플래시 및 SSD 드라이브
Solid State Drive(SSD)는 플래시 메모리 칩에 데이터를 쓰고 읽도록 허용하는 반도체 기술입니다. 플래시 스토리지 기술은 하드 디스크 드라이브(HDD)의 대안으로 떠오르기 전, 펜 드라이브로 상용화되었습니다. 물리적 SSD는 구동 부품이 없으므로 HDD에 비해 성능이 더 빠르고 수명이 더 깁니다.
하이브리드 스토리지 어레이
하이브리드 스토리지 어레이는 SSD와 HDD로 구성된 물리적 스토리지 설정입니다. SSD는 짧은 지연 시간을 제공하지만, HDD보다 단위당 스토리지 비용이 훨씬 높습니다. 따라서 조직들은 하이브리드 스토리지 어레이를 사용하여 성능, 용량 및 비용의 균형을 맞춥니다.
RAID
RAID는 Redundant Array of Independent Disk의 약어로, 동일한 데이터를 SSD의 여러 위치에 보관하는 기술입니다.
데이터 스토어 형식은 어떤 것들이 있나요?
데이터 스토어는 다양한 형식의 데이터를 처리하고 구성하도록 설계되었습니다.
파일 스토리지
파일 스토리지는 저장된 정보를 파일 및 폴더의 하향식 계층 구조로 구성합니다. 컴퓨터는 파일 스토리지를 사용하여 사용자가 정보를 쉽게 저장하고 검색하고 가져올 수 있도록 합니다. 파일 스토리지 시스템을 사용하여 거의 모든 유형의 데이터를 저장하고 구성할 수 있습니다. 파일 스토리지는 사용하기 쉽지만, 긴밀하게 연결된 아키텍처로 인해 수평 확장이 어렵습니다.
블록 스토리지
블록 스토리지는 데이터를 블록이라는 균등한 크기의 여러 세그먼트로 나눕니다. 블록 스토리지 시스템은 여러 데이터 블록을 서로 다른 물리적 디바이스에 저장합니다. 사용자가 특정 데이터를 요청하면 해당 조각을 검색하여 다시 결합합니다. 이때 매핑 시스템을 사용하여 블록 메타데이터를 기반으로 요청된 데이터를 찾습니다. 메타데이터는 사용자 또는 애플리케이션이 스토리지에서 특정 정보를 찾는 데 도움이 되는 추가 정보입니다.
객체 스토리지
객체 스토리지는 비정형 데이터를 여러 서버에서 호스팅할 수 있는 확장 가능한 독립형 리포지토리에 저장합니다. 객체에 속하는 모든 데이터 블록은 해당 메타데이터에 설명되어 있습니다. 예를 들어 객체는 소셜 미디어 콘텐츠, 비디오, 이메일 및 오디오 파일을 저장할 수 있습니다. 애플리케이션은 비디오 해상도, 지속 시간 및 위치와 같은 특정 메타데이터 속성을 사용하여 객체 스토리지의 정보를 검색합니다.
데이터 스토어의 유형은 어떤 것들이 있나요?
데이터 스토어의 유형은 다양하며, 각 유형마다 고유한 설정과 특성을 가지고 있습니다.
직접 연결 스토리지
직접 연결 스토리지(DAS)는 컴퓨터에 물리적으로 연결되는 스토리지 디바이스로 구성됩니다. 예를 들어 DAS 설정은 하드 드라이브, 광 디스크 또는 플래시 드라이브를 컴퓨터에 연결합니다. DAS에서는 백업 복사본을 매우 간단하게 생성할 수 있지만 다른 컴퓨터와 데이터를 공유하기는 어렵습니다.
네트워크 연결 스토리지
네트워크 연결 스토리지(NAS)는 애플리케이션과 사용자가 네트워크를 통해 효과적으로 협업할 수 있도록 데이터를 지속적으로 사용할 수 있게 하는 파일 전용 스토리지 디바이스입니다. NAS 디바이스는 데이터 스토리지 및 파일 공유 요청만 처리하는 특수 서버로서, 프라이빗 네트워크에 빠르고 안전하며 안정적인 스토리지 서비스를 제공합니다.
스토리지 영역 네트워크
스토리지 영역 네트워크(SAN)는 다양한 유형의 스토리지 미디어와 프로토콜을 사용하는 고속 데이터 스토리지 인프라입니다. 기업들은 쉽고 경제적인 방식으로 블록 스토리지를 확장하는 데 SAN을 사용합니다. SAN은 스토리지 가상화 기술을 사용하여 여러 디바이스에서 인프라의 복잡성을 숨깁니다.
클라우드 스토리지
클라우드 스토리지는 클라우드 제공업체가 호스팅하고 관리하는 분산 스토리지 인프라로, 온프레미스 스토리지에 비해 확장성과 유연성이 뛰어나고 원격 액세스가 용이합니다. 예를 들어 사용자가 인터넷에 연결되어 있고 데이터에 액세스할 권한만 있으면 AWS 클라우드 스토리지 서비스에 연결할 수 있습니다. 또한 클라우드 스토리지는 사용자가 사용한 용량에 대해서만 비용을 지불하기 때문에 비용 효율적입니다.
하이브리드 클라우드 스토리지
하이브리드 클라우드 스토리지를 사용하면 기업이 온프레미스 및 클라우드 스토리지 서비스 간에 데이터를 분리할 수 있습니다. 하이브리드 클라우드 스토리지는 기업이 기존 아키텍처에서 보다 저렴하고 안전한 클라우드 환경으로 마이그레이션하는 데 도움이 됩니다.
AWS는 데이터 스토어 요구 사항을 어떻게 지원할 수 있나요?
AWS는 고객의 데이터 스토어 요구 사항을 충족할 수 있는 수십 가지 클라우드 스토리지 서비스를 제공합니다. 또한 Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스에서 원하는 것을 무엇이든 호스팅할 수도 있습니다. 요구 사항에 가장 적합한 AWS 클라우드 스토리지 서비스를 선택하려면 다음을 수행해야 합니다.
- 시스템을 워크로드로 세분화합니다.
- 전체 시스템에 사용되는 단일 데이터 스토어가 아니라 특정 워크로드에 가장 적합한 데이터 스토리지 메커니즘을 식별합니다.
- 비용과 성능을 더욱 최적화하여 고객에게 가장 적합한 데이터 스토어 서비스를 찾습니다.
예를 들어 Amazon Relational Database Service(RDS)는 관계형 데이터베이스를 설정하고 확장하려는 조직에서 널리 사용되는 서비스로, 애플리케이션에 영구 운영 데이터를 저장할 수 있는 고가용성 클라우드 데이터 스토어를 제공합니다. Amazon RDS는 자체 관리형 데이터베이스 프로비저닝 솔루션을 제공하여 개발자가 번거로운 스토리지 인프라 설정 작업에서 벗어날 수 있도록 합니다.
지금 AWS 계정에 가입하여 AWS에서 데이터 스토어를 시작하세요.