Qu'est-ce que XML ?

Extensible Markup Language (XML) vous permet de définir et de stocker des données de manière à pouvoir les partager. XML prend en charge l'échange d'informations entre des systèmes informatiques tels que les sites web, les bases de données et les applications tierces. Les règles prédéfinies facilitent la transmission des données sous forme de fichiers XML sur n'importe quel réseau, car le destinataire peut utiliser ces règles pour lire les données avec précision et efficacité.

Pourquoi XML est-il important ?

Extensible Markup Language (XML) est un langage de balisage qui fournit des règles pour définir toutes les données. Contrairement aux autres langages de programmation, XML ne peut pas effectuer d'opérations informatiques par lui-même. Au lieu de cela, tout langage de programmation ou logiciel peut être implémenté pour la gestion des données structurées.

Prenons l'exemple d'un document texte contenant des commentaires. Les commentaires peuvent donner des suggestions comme celles-ci :

  • Mettre le titre en gras
  • Cette phrase est un en-tête
  • Ce mot est l'auteur

Ces commentaires améliorent la convivialité du document sans affecter son contenu. De même, XML utilise des symboles de balisage pour fournir plus d'informations sur les données. D'autres logiciels, tels que les navigateurs et les applications de traitement de données, utilisent ces informations pour traiter les données structurées plus efficacement.

Balises XML

Vous utilisez des symboles de balisage, appelés balises dans XML, pour définir les données. Par exemple, pour représenter les données d'une librairie, vous pouvez créer des balises telles que <book><title> et<author>. Le contenu de votre document XML pour un seul livre serait le suivant :

<book>

<title> Learning Amazon Web Services </title>

<author> Mark Wilkins </author>

</book>

Les balises apportent un codage de données sophistiqué pour intégrer les flux d'informations entre différents systèmes.

Quels sont les avantages de l'utilisation de XML ?

Prise en charge des transactions interentreprises

Lorsqu'une entreprise vend un bien ou un service à une autre entreprise, les deux entreprises doivent échanger des informations telles que les coûts, les spécifications et les calendriers de livraison. Grâce au langage XML (Extensible Markup Language), elles peuvent partager toutes les informations nécessaires par voie électronique et conclure automatiquement des transactions complexes, sans la moindre intervention humaine. 

Maintien de l'intégrité des données

XML vous permet de transférer des données avec leur description, évitant ainsi toute perte d'intégrité des données. Vous pouvez utiliser ces informations descriptives pour effectuer les opérations suivantes :

  • Vérifier l'exactitude des données
  • Personnaliser automatiquement la présentation des données pour différents utilisateurs
  • Stocker les données de manière cohérente sur plusieurs plateformes 

Améliorer l'efficacité des recherches

Les programmes informatiques tels que les moteurs de recherche peuvent trier et catégoriser les fichiers XML de manière plus efficace et plus précise que les autres types de documents. Par exemple, la marque verbale peut être un nom ou un verbe. Sur la base des balises XML, les moteurs de recherche peuvent catégoriser avec précision les marques pour des résultats de recherche pertinents. Ainsi, XML aide les ordinateurs à interpréter le langage naturel plus efficacement.

Concevoir des applications flexibles

Avec XML, vous pouvez facilement mettre à niveau ou modifier la conception de votre application. De nombreuses technologies, en particulier les plus récentes, sont dotées d'une prise en charge XML intégrée. Elles peuvent lire et traiter automatiquement les fichiers de données XML afin que vous puissiez apporter des modifications sans avoir à reformater l'ensemble de votre base de données.

 

Quelles sont les applications du XML ?

Le langage XML (Extensible Markup Language) est la technologie sous-jacente à des milliers d'applications, allant des outils de productivité courants tels que le traitement de texte aux logiciels d'édition de livres, et même aux systèmes de configuration d'applications complexes.

Transfert de données

Vous pouvez utiliser le langage XML pour transférer des données entre deux systèmes qui stockent les mêmes données dans des formats différents. Par exemple, votre site web stocke les dates au format MM/JJ/AAAA, tandis que votre système de comptabilité stocke les dates au format JJ/MM/AAAA. Vous pouvez transférer les données du site web vers le système de comptabilité en utilisant XML. Vos développeurs peuvent écrire du code qui convertit automatiquement les éléments suivants :

  • Données du site web au format XML
  • Données XML en données du système comptable
  • Données du système comptable au format XML
  • Données XML en données du site web

Applications Web

XML structure les données que vous voyez sur les pages web. D'autres technologies de sites web, comme HTML, fonctionnent avec XML pour présenter des données cohérentes et pertinentes aux visiteurs du site web. Prenons l'exemple d'un site de commerce électronique qui vend des vêtements. Au lieu de montrer tous les vêtements à tous les visiteurs, le site web utilise XML pour créer des pages web personnalisées en fonction des préférences de l'utilisateur. Il affiche les produits de marques spécifiques en filtrant la balise <brand>.

Documentation

Vous pouvez utiliser le langage XML pour spécifier les informations structurelles de n'importe quel document technique. D'autres programmes traitent ensuite la structure du document pour la présenter de manière flexible. Par exemple, il existe des balises XML pour un paragraphe, un élément d'une liste numérotée et un titre. À l'aide de ces balises, d'autres types de logiciel préparent automatiquement le document pour des utilisations telles que l'impression et la publication de pages web.

Type de données

De nombreux langages de programmation prennent en charge le langage XML comme type de données. Grâce à cette prise en charge, vous pouvez facilement écrire des programmes dans d'autres langues qui fonctionnent directement avec des fichiers XML.

Quels sont les composants d'un fichier XML ?

Un fichier XML (Extensible Markup Language) est un document texte que vous pouvez enregistrer avec l'extension .xml. Vous pouvez écrire du XML de la même manière que d'autres fichiers texte. Pour créer ou modifier un fichier XML, vous pouvez utiliser l'une des méthodes suivantes : 

  • Des éditeurs de texte comme Notepad ou Notepad++
  • Des éditeurs XML en ligne
  • Des navigateurs web

Tout fichier XML inclut les composants suivants.

Document XML

Les balises <xml></xml> sont utilisées pour marquer le début et la fin d'un fichier XML. Le contenu de ces balises est également appelé document XML. Il s'agit de la première balise recherchée par tout logiciel pour traiter le code XML.

Déclaration XML

Un document XML commence par des informations sur le XML lui-même. Par exemple, il peut mentionner la version XML qu'il suit. Cette ouverture s'appelle une déclaration XML. Voici un exemple.

<?xml version="1.0" encoding="UTF-8"?>

Éléments XML

Toutes les autres balises que vous créez dans un document XML sont appelées éléments XML. Les éléments XML peuvent contenir les fonctionnalités suivantes :

  • Texte
  • Attributs
  • Autres éléments

Tous les documents XML commencent par une balise primaire, appelée élément racine.

Prenons par exemple le fichier XML ci-dessous.

<InvitationList>

<family>

       <aunt>

       <name>Christine</name>

        <name>Stephanie</name>

       </aunt>

</family>

</InvitationList>

<InvitationList>est l'élément racine , tandis que family et aunt sont d'autres noms d'éléments.

Attributs XML

Les éléments XML peuvent avoir d'autres descripteurs appelés attributs. Vous pouvez définir vos propres noms d'attributs et écrire les valeurs d'attribut entre guillemets, comme indiqué ci-dessous.

<person age=“22”>

Contenu XML

Les données des fichiers XML sont également appelées contenu XML. Par exemple, dans le fichier XML, vous pouvez voir des données de ce type. 

<friend>

       <name>Charlie</name>

       <name>Steve</name>

</friend>

Les valeurs de données Charlie et Steve sont le contenu.

Qu'est-ce qu'un schéma XML ?

Un schéma XML (Extensible Markup Language) est un document qui décrit certaines règles ou limites imposées à la structure d'un fichier XML. Vous pouvez décrire ces contraintes de différentes manières, comme celles-ci :

  • Règles grammaticales pour déterminer l'ordre des éléments
  • Conditions de type Oui ou Non auxquelles le contenu doit répondre
  • Types de données pour le contenu des fichiers XML
  • Contraintes pour l'intégrité des données

Par exemple, un schéma XML pour les librairies peut imposer des contraintes comme celles-ci :

  1. Un élément de livre aura les attributs title et author.
  2. L'élément de livre sera imbriqué sous un élément de catégorie avec un nom d'attribut.
  3. Le prix d'un livre sera un élément distinct imbriqué sous book

Pour répondre à ces contraintes, nous écrirons le fichier XML comme indiqué ci-dessous. 

<category name=“Technology”>

<book title=“Learning Amazon Web Services”, author=“Mark Wilkins”>

<price>20 USD</price>

</book>

</category>

Les schémas XML garantissent la cohérence dans la manière dont les différentes applications logicielles créent et utilisent les fichiers XML. Certains secteurs mettent en œuvre des schémas XML propres à leurs opérations afin de réduire la complexité de l'écriture de code XML pour le transfert de données entre les entreprises. Par exemple, Scalable Vector Graphics (SVG) est une spécification XML permettant de décrire des données liées aux graphiques informatiques. Les développeurs de logiciels écrivent des fichiers XML afin qu'ils répondent aux spécifications du secteur.

Qu'est-ce qu'un analyseur XML ?

Un analyseur XML (Extensible Markup Language) est un logiciel capable de traiter ou de lire des documents XML pour en extraire les données. Les analyseurs XML vérifient également la syntaxe ou les règles du fichier XML et peuvent les valider par rapport à un schéma XML particulier. Comme XML est un langage de balisage strict, les analyseurs ne traiteront pas le fichier en cas d'erreur de validation ou de syntaxe. Par exemple, l'analyseur XML génère des erreurs si l'une des conditions suivantes est vraie :

  • Il manque une balise de fermeture ou une balise de fin.
  • Les valeurs d'attribut ne comportent pas de guillemets.
  • Une condition de schéma n'a pas été remplie.

Les applications logicielles utilisent des analyseurs XML pour transformer les fichiers XML en types de données natifs. Ils peuvent ainsi se concentrer sur la logique de l'application sans devoir accéder aux détails du XML lui-même.

 

En quoi le XML est-il différent du HTML ?

Le langage HTML (HyperText Markup Language) est celui qui est utilisé dans la plupart des pages web. Un navigateur web traite les documents HTML et les affiche sous forme de page multimédia. Le World Wide Web Consortium (W3C) est la communauté internationale qui élabore des protocoles et des directives pour assurer la croissance à long terme du web. Le W3C a établi les normes HTML et XML (Extensible Markup Language) que les développeurs de sites web mettent en œuvre pour assurer la cohérence et la qualité.

Comparaison entre XML et HTML

Bien que les fichiers HTML et XML soient très similaires, il existe quelques différences majeures.

Objectif

L'objectif du HTML est de présenter et d'afficher des données. Toutefois, le XML stocke et transporte les données.

Balises

Le HTML possède des balises prédéfinies, mais les utilisateurs peuvent créer et définir leurs propres balises en XML.

Règles de syntaxe

Il existe quelques différences mineures, mais importantes, entre la syntaxe HTML et la syntaxe XML. Par exemple, le XML est sensible à la casse, mais pas l'HTML. Les analyseurs XML génèrent des erreurs si vous écrivez une balise <Book> au lieu de <book>.

Comment les services AWS prennent-ils en charge le langage XML ?

Tous les services d'intégration de données AWS peuvent traiter des fichiers XML (Extensible Markup Language). Nous en donnons quelques exemples ci-dessous.

AWS Glue est un service d'intégration des données sans serveur que vous pouvez utiliser pour la découverte, la préparation et la combinaison des données pour l'analytique, le machine learning et le développement des applications. AWS Glue DataBrew est un outil visuel de préparation des données que vous pouvez utiliser afin de préparer facilement celles-ci grâce à une interface visuelle interactive de type pointer-cliquer sans écrire de code. DataBrew peut entrer tous types de formats de fichiers, y compris XML.

Amazon Simple Queue Service (SQS) est un service de mise en file d'attente de messages entièrement géré que vous pouvez utiliser pour envoyer, stocker et recevoir des messages entre les composants logiciels, quel que soit le volume. Les messages Amazon SQS peuvent contenir jusqu'à 256 Ko de données sous forme de texte, y compris XML, JSON et du texte non formaté.

Amazon Kinesis facilite la collecte, le traitement et l'analyse de données diffusées en streaming en temps réel, afin d'obtenir rapidement des informations stratégiques et de réagir rapidement. Grâce aux fonctionnalités clés de Kinesis, vous pouvez traiter les données en streaming de manière rentable, quelle que soit l'échelle. Vous bénéficiez également de la flexibilité nécessaire pour choisir des outils adaptés aux exigences de votre application. Diffusez, transformez et analysez des données XML en temps réel avec Kinesis.

Commencez à utiliser l'intégration des données en créant un compte AWS dès aujourd'hui.

Prochaines étapes avec AWS

Consulter d'autres ressources liées aux produits
En savoir plus sur les services d'analyse 
Créer un compte gratuit

Obtenez un accès instantané à l'offre gratuite AWS. 

S'inscrire 
Commencer à créer sur la console

Commencez à créer avec AWS dans la Console de gestion AWS.

Se connecter