En quoi consiste un magasin de données ?

Un magasin de données est un dépôt numérique qui stocke et protège les informations des systèmes informatiques. Un magasin de données peut être un stockage connecté au réseau, un stockage dans le cloud distribué, un disque dur physique ou un stockage virtuel. Il peut stocker à la fois des données structurées, tels que des tableaux d'information, et des données non structurées, comme des e-mails, des images et des vidéos. Les organisations utilisent des magasins de données pour conserver, partager et gérer les informations entre les unités opérationnelles.

Pourquoi un magasin de données est-il important ?

Vous pouvez utiliser un magasin de données pour sauvegarder de manière fiable les informations dans les systèmes informatiques et prévenir la perte de données. Les systèmes informatiques stockent des informations sur des dispositifs de stockage persistants. Le stockage persistant est non volatile, ce qui signifie qu'il conserve les données même après la mise hors tension d'un dispositif. Cela garantit que le système informatique a accès aux mêmes données après sa remise sous tension.

Les entreprises utilisent des magasins de données pour gérer, catégoriser et rationaliser les données pour les opérations, l'analyse, la création de rapports et la conservation des données, ce qui est important pour la conformité réglementaire. Les magasins de données ont plusieurs cas d'utilisation, comme les données créées et consommées par les applications, l'archivage des données, l'analytique des données et la reprise après sinistre.

En raison de la complexité des exigences en matière de données, les entreprises utilisent différents types d'infrastructures de stockage de données pour assurer l'accessibilité, la redondance, la gouvernance et la transparence. Par exemple, les entreprises utilisent Amazon Elastic File System (Amazon EFS) pour un système de fichiers sans serveur et Amazon Simple Storage Service (Amazon S3) pour le stockage d'objets. 

Dans le contexte du stockage des données, plusieurs termes sont souvent utilisés de manière interchangeable, mais ont des significations légèrement différentes. Nous en donnons quelques exemples ci-dessous.

Base de données

Une base de données est un système de stockage organisé. La plupart des bases de données sont basées sur l'architecture de base de données relationnelle. Le système de gestion de base de données relationnelle (SGBDR) permet aux utilisateurs de stocker des données dans des tableaux associés à des points de données spécifiques. Les organisations utilisent des bases de données pour stocker des données transactionnelles, telles que les journaux comptables, de ventes et administratifs.

À propos des bases de données relationnelles »

Les magasins de données par rapport aux bases de données

Les réflexions sur les magasins de données portent sur différentes méthodes de stockage et de récupération des informations. Une base de données est une méthode qui permet aux applications de stocker, partager et récupérer facilement des données. Contrairement aux systèmes de fichiers, une base de données adhère à des règles spécifiques sur la façon dont les données sont organisées, formatées et stockées dans la base. 

Entrepôt de données

Un entrepôt de données est une vaste collection d'informations liées à l'entreprise, acquises à partir de diverses sources. Les entreprises utilisent des entrepôts de données pour soutenir l'informatique décisionnelle et l'analytique. Les analystes métier et les scientifiques des données tirent des informations exploitables d'un entrepôt de données.

À propos des entrepôts des données »

Les magasins de données par rapport aux entrepôts de données

Magasin de données est un terme générique qui englobe les différents matériels, technologies, formats et architectures permettant de stocker et de récupérer des informations. Un entrepôt de données est un type spécifique de stockage de données permettant de consolider les données analytiques des entreprises. Par exemple, GE Renewable Energy utilise AWS Redshift pour obtenir de nouvelles informations sur ses données collectées. 

Comment fonctionne un magasin de données ?

Un dispositif physique de stockage de données est la technologie sous-jacente à un magasin de données. Vous pouvez lire et écrire des informations sur le périphérique dans des formats spécifiques tels que des fichiers, des tables ou des blocs. Le dispositif peut être local, distant ou dans le cloud. Les grands magasins de données sont généralement répartis sur plusieurs dispositifs physiques dans différents lieux géographiques. Les systèmes et services logiciels abstraient les opérations sous-jacentes du magasin de données.

Nous donnons ci-dessous quelques exemples de dispositifs physiques. Les différents types de dispositifs de stockage de données offrent divers degrés de sécurité et de redondance.

Lecteurs Flash et SSD

Un lecteur à état solide (SSD) est une technologie de semi-conducteurs qui permet l'écriture et la lecture de données dans des puces de mémoire flash. La technologie de stockage Flash était disponible commercialement dans les clés USB avant de devenir une alternative aux disques durs (HDD). Par rapport à un disque dur, un SSD physique n'a pas de pièces mobiles, ce qui se traduit par des performances plus rapides et une durée de vie plus longue.

Baie de stockage hybride

Une baie de stockage hybride est une configuration de stockage physique qui se compose d'un SSD et d'un HDD. Si un SSD offre un fonctionnement à faible latence, il coûte beaucoup plus cher par unité de stockage qu'un disque dur. Par conséquent, les entreprises utilisent une baie de stockage hybride pour équilibrer les performances, la capacité et le coût.

RAID

RAID est l'abréviation de redundant array of independent disks (réseau redondant de disques indépendants). Il s'agit d'une technologie qui permet de conserver les mêmes données à plusieurs endroits sur un SSD.

Quels sont les différents formats de magasin de données ?

Les magasins de données sont conçus pour traiter et organiser des données dans différents formats.

Stockage de fichiers

Le stockage de fichiers organise les informations stockées dans une hiérarchie descendante de fichiers et de dossiers. Les ordinateurs utilisent le stockage de fichiers pour faciliter le stockage, la recherche et la récupération d'informations pour les utilisateurs. Vous pouvez utiliser le système de stockage de fichiers pour stocker et organiser presque tous les types de données. Si le stockage de fichiers est facile à utiliser, il est difficile de le faire évoluer horizontalement en raison de son architecture étroitement connectée.

À propos du stockage de fichiers »

Stockage par bloc

Le stockage par blocs divise les données en plusieurs morceaux de segments de taille égale appelés blocs. Le système de stockage de blocs stocke différents blocs de données sur différents dispositifs physiques. Il récupère et recompose les pièces lorsque les utilisateurs demandent des données spécifiques. Il utilise un système de cartographie pour localiser les données demandées sur la base des métadonnées des blocs. Les métadonnées sont des informations supplémentaires qui aident les utilisateurs ou les applications à trouver des informations spécifiques dans le stockage.

À propos stockage par bloc »

Stockage d'objets

Le stockage d'objets conserve les données non structurées dans un référentiel autonome et évolutif qui peut être hébergé sur différents serveurs. Chaque bloc de données qui appartient à un objet est décrit dans ses métadonnées. Par exemple, un objet peut stocker du contenu de réseaux sociaux, des vidéos, des e-mails et des fichiers audio. Les applications recherchent des informations dans le stockage d'objets en utilisant des attributs de métadonnées spécifiques tels que la résolution vidéo, la durée et l'emplacement.

À propos du stockage d'objets »

Quels sont les différents types de magasins de données ?

Il existe plusieurs types de magasins de données, chacun présentant une configuration et des caractéristiques uniques.

Stockage en attachement direct

Le stockage en attachement direct (Direct-Attached Storage, DAS) consiste en des dispositifs de stockage qui se connectent physiquement à un ordinateur. Par exemple, une installation DAS permet de connecter un disque dur, un disque optique ou un lecteur flash à un ordinateur. La création de copies de sauvegarde sur DAS est assez simple, mais le partage de données avec d'autres ordinateurs est plus compliqué.

Stockage en réseau

Le stockage en réseau (Network-attached storage, NAS) est un dispositif de stockage dédié aux fichiers qui rend les données disponibles en permanence pour que les applications et les utilisateurs puissent collaborer efficacement sur un réseau. Les périphériques NAS sont des serveurs spécialisés qui traitent uniquement les demandes de stockage de données et de partage de fichiers. Ils fournissent des services de stockage rapides, sûrs et fiables aux réseaux privés.

À propos des NAS »

Réseau de zone de stockage

Le réseau de zone de stockage (Storage Area Network, SAN) est une infrastructure de stockage de données à haut débit qui utilise différents types de supports de stockage et de protocoles. Les entreprises utilisent le SAN pour faire évoluer le stockage en bloc en toute simplicité et à moindre coût. Le SAN utilise la virtualisation du stockage pour masquer la complexité de l'infrastructure à partir de dispositifs multiples.

Stockage dans le cloud

Le stockage dans le cloud est une infrastructure de stockage distribuée, hébergée et gérée par des fournisseurs cloud. Il est plus évolutif, flexible et accessible à distance comparativement au stockage sur site. Par exemple, les utilisateurs peuvent se connecter aux services de stockage dans le cloud AWS dès lors qu'ils disposent d'une connexion Internet et sont autorisés à accéder aux données. Le stockage dans le cloud est également rentable, car les utilisateurs ne paient que pour la capacité utilisée.

Stockage cloud hybride

Le stockage cloud hybride permet aux entreprises de séparer les données entre les services de stockage sur site et dans le cloud. Le stockage cloud hybride aide les entreprises à migrer d'une architecture héritée vers un environnement cloud moins coûteux et plus sûr.

Quelle est l'utilité d'AWS en matière de magasin de données ?

AWS propose plusieurs dizaines de services de stockage dans le cloud pour répondre à vos besoins en matière de stockage de données. En outre, vous avez la possibilité d'héberger ce que vous voulez sur vos instances Amazon Elastic Compute Cloud (Amazon EC2). Pour choisir le meilleur service de stockage dans le cloud AWS en fonction de vos besoins, vous devez :

  • Segmenter votre système en charges de travail.
  • Identifier un mécanisme de stockage de données qui convient le mieux à une charge de travail particulière, et non un seul magasin de données pour l'ensemble du système.
  • Optimiser davantage en fonction du coût et des performances pour trouver le service de magasin de données qui vous convient le mieux.

Par exemple, Amazon Relational Database Service (Amazon RDS) est un choix prisé par les organisations qui souhaitent mettre en place et faire évoluer des bases de données relationnelles. Il fournit aux applications un magasin de données dans le cloud à haute disponibilité pour le stockage de données opérationnelles persistantes. Amazon RDS offre une solution de mise en service de base de données autogérée qui libère les développeurs de la configuration fastidieuse de l'infrastructure de stockage.

Démarrez avec les magasins de données sur AWS en créant un compte AWS dès aujourd'hui.

Prochaines étapes du magasin de données

Consulter d'autres ressources liées aux produits
Découvrir les offres de bases de données gratuites 
Créer un compte gratuit

Obtenez un accès instantané à l'offre gratuite AWS.

S'inscrire 
Commencez à créer sur la console

Démarrez la création dans la console de gestion AWS.

Se connecter