Esta guía muestra cómo obtener información en torno a opiniones, entidades, ubicaciones y temas a partir de publicaciones en redes sociales, reseñas de clientes u otro contenido abreviado. Con el código de muestra adjunto, se proporciona una base de código que sirve como sistema de extracción de información. Este sistema extrae información de varias plataformas de redes sociales, incluidas X, Facebook e Instagram, mediante un modelo de lenguaje de gran tamaño (LLM), lo que proporciona información útil sobre sus productos y servicios.
Diagrama de la arquitectura
Paso 1
Una tarea de Amazon Elastic Container Service (Amazon ECS) se ejecuta en una infraestructura sin servidor administrada por AWS Fargate y mantiene una conexión abierta a las redes sociales.
Paso 2
Los token de acceso a las redes sociales se almacenan de forma segura en el Almacén de parámetros de AWS Systems Manager y la imagen del contenedor se aloja en Amazon Elastic Container Registry (Amazon ECR).
Paso 3
Cuando aparece una nueva publicación en una red social, se coloca en una cola de Amazon Simple Queue Service (Amazon SQS).
Paso 4
La lógica de esta guía reside en los microservicios de las funciones de AWS Lambda, coordinados por AWS Step Functions.
Paso 5
La publicación se procesa en tiempo real mediante uno de los modelos de lenguaje de gran tamaño (LLM) compatibles con Amazon Bedrock.
Paso 6
Amazon Location Service transforma el nombre de una ubicación en coordenadas.
Paso 7
La publicación y los metadatos (información) se envían a Amazon Simple Storage Service (Amazon S3).
Paso 8
Amazon Athena consulta los tuits procesados mediante SQL estándar.
Paso 9
Amazon Lookout for Metrics busca anomalías en el volumen de menciones por categoría. Amazon Simple Notification Service (Amazon SNS) envía una alerta a los usuarios cuando se detecta una anomalía.
Paso 10
Recomendamos configurar un panel de Amazon QuickSight para que los usuarios puedan visualizar la información fácilmente.
Comenzar
Pilares de AWS Well-Architected Framework
AWS Well-Architected Framework le permite comprender las ventajas y desventajas de las decisiones que tome durante la creación de sistemas en la nube. Los seis pilares de este marco permiten aprender las prácticas recomendadas arquitectónicas para diseñar y explotar sistemas confiables, seguros, eficientes, rentables y sostenibles. Con la Herramienta de AWS Well-Architected, que se encuentra disponible gratuitamente en la Consola de administración de AWS, puede revisar sus cargas de trabajo con respecto a estas prácticas recomendadas al responder a un conjunto de preguntas para cada pilar.
El diagrama de arquitectura mencionado es un ejemplo de una solución que se creó teniendo en cuenta las prácticas recomendadas de una buena arquitectura. Para tener completamente una buena arquitectura, debe seguir todas las prácticas recomendadas de buena arquitectura posibles.
-
Excelencia operativa
Amazon CloudWatch mantiene registros de las operaciones realizadas en el flujo de trabajo de procesamiento de textos, lo que permite supervisar de manera eficiente el estado de las aplicaciones. Amazon CloudFormation permite la reproducibilidad del despliegue y también puede revertirse a un estado estable en caso de que el despliegue falle. Además, Amazon Bedrock es un servicio administrado para usar los LLM a través de una interfaz sencilla. Esta combinación de supervisión, despliegues reproducibles y el uso de LLM administrados por AWS ofrece potentes capacidades de procesamiento del lenguaje natural sin tener que administrar la infraestructura subyacente.
-
Seguridad
Los datos almacenados en Amazon S3 se cifran en reposo con las claves de AWS Key Management Service (AWS KMS) y AWS Identity and Access Management (IAM) se utiliza para controlar el acceso a los datos. En concreto, AWS KMS ayuda a crear y administrar las claves de cifrado que se utilizan para cifrar de forma segura los datos almacenados en Amazon S3. Mientras que IAM ofrece la capacidad de configurar permisos granulares en función de los roles para el control de acceso con privilegios mínimos a esos datos.
-
Fiabilidad
Los datos se almacenan en Amazon S3, un servicio de almacenamiento de objetos que ofrece una durabilidad del 99.999999999 % (11 nueves). Los LLM se invocan mediante Amazon Bedrock a través de una interfaz de API sencilla y eficaz que se puede escalar y reducir verticalmente. Athena, QuickSight y AWS Glue se utilizan para consultar y visualizar los datos a escala sin necesidad de aprovisionar infraestructura.
-
Eficiencia en el rendimiento
Mediante el uso de varios servicios de AWS administrados y sin servidor, esta guía está diseñada para que sus cargas de trabajo logren una alta eficiencia en el rendimiento, escalen los recursos de forma automática para satisfacer las demandas de la carga de trabajo y proporcionen una experiencia fluida para que pueda acceder a la información de sus plataformas de redes sociales. Por ejemplo, Lambda, un servicio de procesamiento sin servidor, se escala y se reduce verticalmente de forma automática según la demanda, lo que garantiza que la capacidad de procesamiento esté optimizada para la carga de trabajo. Con Amazon Bedrock, puede invocar los LLM desde un catálogo extenso sin necesidad de aprovisionar y administrar los servidores subyacentes.
-
Optimización de costos
Lambda se utiliza en esta arquitectura para procesar eventos e iniciar el análisis de transformación por lotes, lo que elimina la necesidad de un servidor en ejecución continua. Además, las tareas de AWS Glue se utilizan para extraer, transformar y cargar (ETL) en lotes de datos de usuario, en lugar de en registros individuales. Debido al agregado y procesamiento de datos en fragmentos más grandes, se reducen los requisitos generales de computación y almacenamiento, lo que se traduce en costos más bajos en comparación con el manejo de cada registro de forma individual. Por último, Amazon Bedrock permite el uso del LLM que mejor se adapte a sus necesidades presupuestarias para no incurrir en gastos innecesarios asociados a modelos más potentes, pero potencialmente sobreaprovisionados.
-
Sostenibilidad
Lambda, AWS Glue, Athena y QuickSight son todos servicios sin servidor que funcionan bajo demanda y ajustan su uso de recursos para adaptarse a la carga de trabajo actual. Esto ayuda a garantizar que el rendimiento y el uso de los recursos se maximicen, ya que los servicios se escalan y se reducen verticalmente de forma automática para adaptarse a la demanda requerida. Mediante el uso de estas ofertas sin servidor, esta arquitectura puede utilizar de manera eficiente los recursos necesarios y así evitar el sobreaprovisionamiento o la infrautilización de los componentes de computación, almacenamiento y otros componentes de la infraestructura.
Contenido relacionado
Build a news-based real-time alert system with Twitter, Amazon SageMaker, and Hugging Face
Descargo de responsabilidad
El código de muestra; las bibliotecas de software; las herramientas de línea de comandos; las pruebas de concepto; las plantillas; o cualquier otra tecnología relacionada (incluida cualquiera de las anteriores que proporcione nuestro personal) se brinda como contenido de AWS bajo el Contrato de cliente de AWS, o el contrato escrito pertinente entre usted y AWS (lo que sea aplicable). No debe utilizar este contenido de AWS en sus cuentas de producción, ni en producción ni en otros datos críticos. Es responsable de probar, proteger y optimizar el contenido de AWS, como el código de muestra, según corresponda para el uso de grado de producción en función de sus prácticas y estándares de control de calidad específicos. La implementación de contenido de AWS puede incurrir en cargos de AWS por crear o utilizar recursos con cargo de AWS, como poner en marcha instancias de Amazon EC2 o utilizar el almacenamiento de Amazon S3.