O que é XML?
A Extensible Markup Language (XML) permite definir e armazenar dados de maneira compartilhável. A XML oferece suporte ao intercâmbio de informações entre sistemas de computador, como sites, bancos de dados e aplicações de terceiros. Regras predefinidas facilitam a transmissão de dados como arquivos XML em qualquer rede, pois o destinatário pode usar essas regras para ler os dados com precisão e eficiência.
Por que a XML é importante?
A Extensible Markup Language (XML) é uma linguagem de marcação que fornece regras para definir quaisquer dados. Ao contrário de outras linguagens de programação, a XML não pode realizar operações de computação por contra própria. Em vez disso, qualquer linguagem de programação ou software pode ser implementado para o gerenciamento de dados estruturados.
Por exemplo, considere um documento de texto contendo comentários. Esses comentários podem oferecer sugestões como estas:
- Deixar o título em negrito
- Esta frase é um cabeçalho
- Esta palavra é o autor
Esses comentários melhoram a praticidade do documento sem afetar seu conteúdo. Da mesma forma, o XML usa símbolos de marcação para fornecer mais informações sobre quaisquer dados. Outros softwares, como navegadores e aplicações de processamento de dados, usam essas informações para processar dados estruturados com mais eficiência.
Marcas XML
Você usa símbolos de marcação, chamados de etiquetas em XML, para definir dados. Por exemplo, para representar dados de uma livraria, você pode criar etiquetas como <book>, <title> e <author>. Seu documento XML para um único livro teria um conteúdo como este:
<book>
<title> Learning Amazon Web Services </title>
<author> Mark Wilkins </author>
</book>
Etiquetas trazem codificação de dados sofisticada para integrar fluxos de informações em diferentes sistemas.
Quais são os benefícios de usar a XML?
Suporte para transações intercomerciais
Quando uma empresa vende uma mercadoria ou um serviço para outra empresa, as duas precisam trocar informações, como custo, especificações e cronogramas de entrega. Com a Extensible Markup Language (XML), elas podem compartilhar todas as informações necessárias eletronicamente e fechar negócios complexos automaticamente, sem qualquer intervenção humana.
Manter a integridade dos dados
A XML permite transferir dados junto com a descrição deles, evitando a perda da integridade dos dados. Você pode usar essas informações descritivas para fazer o seguinte:
- Verificar a precisão dos dados
- Personalizar automaticamente a apresentação de dados para diferentes usuários
- Armazenar dados de maneira consistente em várias plataformas
Melhorar a eficiência de pesquisas
Programas de computador, como mecanismos de pesquisa, podem classificar e categorizar arquivos XML com mais eficiência e precisão do que outros tipos de documentos. Por exemplo, a palavra marca pode ser um substantivo ou um verbo. Com base em etiquetas XML, os mecanismos de pesquisa podem categorizar marca com precisão para resultados de pesquisa relevantes. Assim, a XML ajuda os computadores a interpretar a linguagem natural com mais eficiência.
Projetar aplicações flexíveis
Com a XML, você pode fazer upgrade ou modificar convenientemente o design da sua aplicação. Muitas tecnologias, especialmente as mais recentes, vêm com suporte XML integrado. Elas podem ler e processar automaticamente arquivos de dados XML, para que você possa fazer alterações sem precisar reformatar todo o banco de dados.
Quais são as aplicações da XML?
A Extensible Markup Language (XML) é a tecnologia subjacente em milhares de aplicações, variando de ferramentas comuns de produtividade, como processamento de texto, software de publicação de livros e até mesmo sistemas complexos de configuração de aplicações.
Transferência de dados
Você pode usar a XML para transferir dados entre dois sistemas que armazenam os mesmos dados em formatos diferentes. Por exemplo, seu site armazena datas no formato MM/DD/AAAA, mas seu sistema de contabilidade armazena datas no formato DD/MM/AAAA. Você pode transferir os dados do site para o sistema de contabilidade usando a XML. Seus desenvolvedores podem escrever código que converte automaticamente o seguinte:
- Dados do site no formato XML
- Dados XML em dados do sistema de contabilidade
- Dados do sistema de contabilidade de volta ao formato XML
- Dados XML de volta aos dados do site
Aplicações web
A XML dá estrutura aos dados que você vê nas páginas da Web. Outras tecnologias de sites, como a HTML, funcionam com a XML para apresentar dados consistentes e relevantes aos visitantes de sites. Por exemplo, considere um site de comércio eletrônico que vende roupas. Em vez de mostrar todas as roupas para todos os visitantes, o site usa XML para criar páginas da web personalizadas com base nas preferências do usuário. Ele mostra produtos de marcas específicas filtrando a etiqueta <brand>.
Documentação
Você pode usar a XML para especificar as informações estruturais de qualquer documento técnico. Em seguida, outros programas processam a estrutura do documento para apresentá-la de maneira flexível. Por exemplo, existem etiquetas XML para um parágrafo, um item em uma lista numerada e um título. Usando essas etiquetas, outros tipos de software preparam automaticamente o documento para usos como impressão e publicação de páginas da Web.
Tipo de dados
Muitas linguagens de programação oferecem suporte à XML como um tipo de dados. Com esse suporte, você pode facilmente escrever programas em outras linguagens que funcionam diretamente com arquivos XML.
Quais são os componentes de um arquivo XML?
Um arquivo XML é um documento baseado em texto que você pode salvar com a extensão .xml. Você pode escrever XML de forma semelhante a outros arquivos de texto. Para criar ou editar um arquivo XML, é possível usar qualquer uma das seguintes opções:
- Editores de texto como o Bloco de notas ou o Notepad++
- Editores XML online
- Navegadores da Web
Qualquer arquivo XML inclui os seguintes componentes.
Documento XML
As etiquetas <xml></xml> são usadas para marcar o início e o fim de um arquivo XML. O conteúdo dessas marcas também é chamado de documento XML. É a primeira etiqueta que qualquer software procurará para processar o código XML.
Declaração XML
Um documento XML começa com algumas informações sobre a própria XML. Por exemplo, ele pode mencionar a versão XML a seguir. Essa abertura é chamada de declaração XML. Veja abaixo um exemplo.
<?xml version="1.0" encoding="UTF-8"?>
Elementos XML
Todas as outras etiquetas criadas em um documento XML são chamadas de elementos XML. Elementos XML podem conter os seguintes recursos:
- Texto
- Atributos.
- Outros elementos
Todos os documentos XML começam com uma etiqueta primária, que é chamada de elemento raiz.
Por exemplo, considere o arquivo XML abaixo.
<InvitationList>
<family>
<aunt>
<name>Christine</name>
<name>Stephanie</name>
</aunt>
</family>
</InvitationList>
<InvitationList> é o elemento raiz; family e aunt são outros nomes de elementos.
Atributos XML
Os elementos XML podem ter outros descritores, chamados de atributos. Você pode definir seus próprios nomes de atributos e escrever os valores desses atributos entre aspas, conforme mostrado abaixo.
<person age=“22”>
Conteúdo XML
Os dados em arquivos XML também são chamados de conteúdo XML. Por exemplo, no arquivo XML, você pode ver dados como estes.
<friend>
<name>Charlie</name>
<name>Steve</name>
</friend>
Os valores dos dados Charlie e Steve são o conteúdo.
O que é um esquema XML?
Um esquema XML é um documento que descreve algumas regras ou limites na estrutura de um arquivo XML. Você pode descrever essas restrições de várias maneiras diferentes, como estas:
- Regras gramaticais para determinar a ordem dos elementos
- Condições Sim ou Não que o conteúdo deve satisfazer
- Tipos de dados para o conteúdo em arquivos XML
- Restrições para integridade dos dados
Por exemplo, um esquema XML para livrarias pode impor restrições como estas:
- Um elemento book terá os atributos title e author.
- O elemento book será aninhado sob um elemento category com um nome de atributo.
- O preço de um livro será um elemento separado aninhado sob book.
Para atender a essas restrições, escreveremos o arquivo XML conforme mostrado abaixo.
<category name=“Technology”>
<book title=“Learning Amazon Web Services”, author=“Mark Wilkins”>
<price>USD 20</price>
</book>
</category>
Os esquemas XML reforçam a consistência em termos de como diferentes aplicações de software criam e usam arquivos XML. Alguns setores implementam esquemas XML específicos de suas operações para reduzir a complexidade na escrita de código XML para transferência de dados entre negócios. Por exemplo, a Scalable Vector Graphics (SVG) é uma especificação XML para descrever dados relacionados a gráficos de computador. Os desenvolvedores de software escrevem arquivos XML para que estes atendam a essas especificações do setor.
O que é um analisador XML?
Um analisador XML é um software que pode processar ou ler documentos XML para extrair os dados dentro deles. Os analisadores XML também verificam a sintaxe ou as regras do arquivo XML e podem validá-lo em relação a um esquema XML específico. Como a XML é uma linguagem de marcação estrita, os analisadores não processarão o arquivo se houver algum erro de validação ou sintaxe. Por exemplo, o analisador XML apresentará erros se alguma destas condições for verdadeira:
- Falta uma etiqueta de fechamento, ou etiqueta final
- Valores de atributo não têm aspas
- Uma condição de esquema não foi atendida
As aplicações de software usam analisadores XML para transformar arquivos XML em tipos de dados nativos. Assim, elas podem se concentrar na lógica da aplicação sem precisar entrar nos detalhes do próprio XML.
Como a XML é diferente da HTML?
A HyperText Markup Language (HTML) é a linguagem usada na maioria das páginas da Web. Um navegador da Web processa os documentos HTML e os exibe como uma página multimídia. O World Wide Web Consortium (W3C) é a comunidade internacional que desenvolve protocolos e diretrizes para garantir o crescimento da Web a longo prazo. O W3C estabeleceu os padrões HTML e XML que os desenvolvedores de sites implementam para consistência e qualidade.
Comparação entre XML e HTML
Embora os arquivos HTML e XML sejam muito semelhantes, existem algumas diferenças importantes.
Finalidade
O objetivo da HTML é apresentar e exibir dados. Por sua vez, a XML armazena e transporta dados.
Etiquetas
A HTML tem etiquetas predefinidas, mas os usuários podem criar e definir suas próprias etiquetas em XML.
Regras de sintaxe
Existem algumas diferenças secundárias, porém importantes, entre as sintaxes HTML e XML. Por exemplo, a XML diferencia maiúsculas de minúsculas, mas a HTML não. Os analisadores XML apresentarão erros se você escrever uma etiqueta como <Book> em vez de <book>.
Como os serviços da AWS oferecem suporte à XML?
Todos os serviços de integração de dados da AWS podem processar arquivos XML. Listamos alguns exemplos abaixo.
O AWS Glue é um serviço de integração de dados sem servidor que você pode usar para descobrir, preparar e combinar dados para análise, machine learning e desenvolvimento de aplicações. O AWS Glue DataBrew é uma ferramenta de preparação de dados visuais que você pode usar para preparar dados com uma interface visual interativa ao estilo de apontar e clicar sem escrever código. O DataBrew pode inserir todos os tipos de formatos de arquivo, incluindo XML.
O Amazon Simple Queue Service (SQS) é um serviço de enfileiramento de mensagens totalmente gerenciado que você pode usar para enviar, armazenar e receber mensagens entre componentes de software em qualquer volume. As mensagens do Amazon SQS podem conter até 256 KB de dados de texto, incluindo XML, JSON e texto não formatado.
O Amazon Kinesis facilita a coleta, o processamento e a análise de dados de streaming em tempo real, permitindo que você obtenha insights oportunos e reaja rapidamente às novas informações. Com os principais recursos do Kinesis, você pode processar dados de streaming de maneira econômica em qualquer escala. Você também ganha a flexibilidade de escolher ferramentas que atendam aos requisitos da sua aplicação. Transmita, transforme e analise dados XML em tempo real com o Kinesis.
Comece com a integração de dados criando uma conta da AWS hoje mesmo.
Próximas etapas com a AWS
Obtenha acesso instantâneo ao nível gratuito da AWS.