Wall Street Journal empodera a los lectores con una herramienta de búsqueda mediante Amazon Kendra
2021
A medida que se acercaba la elección presidencial de 2020 en EE. UU., The Wall Street Journal (WSJ) quería empoderar a sus lectores para que pudieran acceder fácilmente y entender lo que los candidatos decían, al igual que las posturas de los candidatos en temas importantes para los lectores. Un estudio realizado por Pew Research Center el 5 de junio de 2019 arrojó que casi el 80 % de los estadounidenses afirma haber comprobado los hechos en noticias para encontrar la fuente original de información.
El equipo de Producto y Tecnología de WSJ acudió a Amazon Web Services (AWS) para crear una nueva experiencia para el cliente. A través de la colaboración con un equipo global de expertos del programa AWS Digital Innovation y AWS Professional Services, un equipo global de expertos que ayuda a los negocios a lograr los resultados esperados en AWS, el equipo de WSJ logró acelerar el desarrollo de Talk2020, una herramienta de búsqueda inteligente que ayuda a los lectores a buscar rápidamente y analizar 30 años de declaraciones públicas de los candidatos presidenciales. Permite una investigación más profunda de las problemáticas a lo largo del tiempo, mediante la exploración de patrones de discurso y el análisis de textos. La clave del éxito de WSJ fue el uso deAmazon Kendra, un servicio de búsqueda inteligente de gran precisión basado en machine learning.
AWS nos ayudó a crear una solución adecuada a nuestro cronograma. Tener ese acceso directo a expertos nos permitió asignarle a Amazon Kendra los servicios adecuados y entregar el nivel de calidad que queríamos”.
Dion Bailey
Director de Tecnología y Arquitectura de WSJ
Empoderar a los lectores con información precisa
The Wall Street Journal es una organización de noticias global que brinda noticias, información, comentarios y análisis a sus lectores mediante edición impresa y en plataformas digitales, móviles, sociales y de audio y video. Siguiendo su legado como fuente de negocios globales y noticias financieras, WSJ incluye la cobertura de noticias de EE. UU. y el mundo, política, arte, cultura, estilo de vida, deportes y salud. Es ganador de 38 premios Pulitzer por su destacada labor periodística. Para lograr ese fin, vio la oportunidad para entregar funcionalidad y llegar a nuevos miembros del público al permitirles a los lectores explorar una base de datos de transcripciones. “Queríamos construir algo que los lectores pudieran usar para ver lo que Joe Biden, Donald Trump y sus compañeros de fórmula dijeron palabra por palabra y sacar sus propias conclusiones”, expresó Dion Bailey, vicepresidente, director de Tecnología y Arquitectura de WSJ.
Los periodistas de investigación deWSJ ya usan Factiva, la base de datos de noticias globales de Dow Jones, para la investigación y verificación de hechos. Factiva agrupa contenido de más de 32 000 fuentes y permite a los usuarios buscar por texto libre, región, tema, autor y metadatos. El equipo de Investigación y Desarrollo de WSJ había trabajado con periodistas en Washington D.C., para crear una herramienta de búsqueda eficaz para estas transcripciones. Con Talk2020, WSJ quiso que esta herramienta fuera más simple de usar y estuviera disponible para un público más amplio para que pudiesen informarse en la toma de decisiones durante la elección presidencial de 2020. La publicación quería que los lectores pudieran presentar preguntas de lenguaje natural, tales como “¿Qué dijo Trump sobre el sistema de salud?”, y recibir resultados que las respondieran directamente. Una solución bien estructurada también tendría el potencial de aumentar el número de visitas y atraer nuevos suscriptores.
El equipo de WSJ, que ya usaba AWS, con regularidad empleaba AWS Professional Services en reuniones breves diarias, reuniones semanales y análisis profundos sobre arquitectura. “AWS nos ayudó a crear una solución adecuada a nuestro cronograma”, dijo Bailey. “Tener ese acceso directo a expertos nos permitió asignarle a Amazon Kendra los servicios adecuados y entregar el nivel de calidad que queríamos”.
Cómo emparejar la estrategia de contenido con la estrategia del producto
Usando AWS, el equipo de AWS creó rápidamente Talk2020 y cumplió con su objetivo de lanzarlo en septiembre de 2020, antes del primer debate presidencial. La solución empleó Amazon Kendra para brindar capacidades de búsqueda de empresa fiables. “El hecho de que Amazon Kendra pudiera procesar el lenguaje natural en tiempo real fue un gran atractivo para nosotros”, dijo Bailey. La interfaz de la solución de búsqueda consistía en una puerta de enlace de API y Amazon CloudFront, una red de entrega de contenido programable, rápida y altamente segura. Cuando los usuarios realizan una búsqueda, Amazon Kendra arroja un tema identificado y citas relacionadas, las cuales aumentan al hacer una referencia cruzada a la identificación con las transcripciones limpias de Factiva almacenadas en Amazon DynamoDB, un servicio de base de datos NoSQL compatible con estructuras de datos de documentos y valores clave.
El encargado de gestionar los flujos de datos entre los servicios de AWS es AWS Lambda, un servicio de computación sin servidor que permite a los usuarios ejecutar código sin aprovisionar ni administrar servidores. “Teníamos que crear una capa de procesamiento entre Factiva y la capa de datos”, indicó Bailey. Las funciones de AWS Lambda desencadenan respuestas para limpiar y formatear las transcripciones (identifican citas, el orador y el tema) antes de enviarlas a Amazon Kendra y Amazon DynamoDB. “Delegar esas tareas a las funciones de Lambda significa que podemos evitar el proceso cuando no las estamos usando, así que es eficiente en relación a los costos”, agrega Bailey.
Los datos de la herramienta Talk2020 mostraron picos de uso durante y después de los debates presidenciales, el debate de vicepresidentes y los eventos con ciudadanos. Muchas personas incluso usaron la herramienta de búsqueda como segunda pantalla durante los debates para buscar las declaraciones que los candidatos hicieron en el pasado. La interacción con Talk2020 fue fuerte. Hubo usuarios que hicieron muchas preguntas y buscaron diferentes temas durante la misma visita. “Eso nos muestra que hemos creado una herramienta que satisface las necesidades de nuestros lectores, y tenemos una oportunidad para seguir experimentando con nuevas formas de interactuar con nuestros usuarios”, explica Bailey.
Futuros casos de uso de búsqueda inteligente
Involucrar al equipo de AWS y usar servicios innovadores como Amazon Kendra ayudó a que WSJ lanzara Talk2020 en solo cinco meses y aumentara la cantidad de visitas, alentara las interacciones y atrajera nuevos suscriptores. “El equipo de AWS estuvo disponible cada vez que lo necesitamos”, comenta Bailey, “y nos ayudó a solucionar cada problema que surgió”.
Acerca de The Wall Street Journal
Fundado en 1889 y propiedad de Dow Jones & Company, The Wall Street Journal es una organización de noticias global con base en Nueva York, enfocada en negocios, finanzas, economía y potencias mundiales. Llega a los lectores a través de su edición impresa y en plataformas digitales, móviles, sociales y de audio y video. Ganador de más de treinta premios Pulitzer, The Wall Street Journal llega a millones de usuarios.
Beneficios de AWS
- Lanzamiento de la herramienta de búsqueda Talk2020 en cinco meses
- Creación de una herramienta de búsqueda con procesamiento de lenguaje natural
- Aumento de las interacciones
Servicios de AWS utilizados
Amazon Kendra
Amazon Kendra es un servicio de búsqueda inteligente basado en machine learning. Kendra reinventa la búsqueda empresarial para los sitios web y aplicaciones de manera que los empleados y clientes puedan encontrar fácilmente el contenido que buscan, aun cuando se encuentre esparcido por distintos lugares y repositorios de contenido dentro de la organización.
Amazon CloudFront
Amazon CloudFront es un servicio rápido de red de entrega de contenido (CDN) que distribuye a clientes globalmente datos, vídeos, aplicaciones y API de forma segura, con baja latencia, altas velocidades de transferencia y dentro de un entorno fácil para desarrolladores.
Amazon DynamoDB
Amazon DynamoDB es una base de datos de clave-valor y documentos que ofrece rendimiento en milisegundos de un solo dígito a cualquier escala. Se trata de una base de datos completamente administrada, de varias regiones, multiactiva y duradera, con seguridad integrada, copia de seguridad y restauración, así como almacenamiento en caché en memoria para aplicaciones a escala de Internet.
AWS Lambda
AWS Lambda es un servicio de computación sin servidor que le permite ejecutar código sin aprovisionar ni administrar servidores, crear una lógica de escalado de clústeres basada en la carga de trabajo, mantener integraciones de eventos o administrar tiempos de ejecución. Con Lambda, puede ejecutar código para casi cualquier tipo de aplicación o servicio backend sin tener que realizar tareas de administración.
Introducción
Cada día crece el número de empresas de todos los tamaños y sectores que consiguen transformar sus negocios gracias a AWS. Contacte con nuestros expertos e inicie hoy mismo su proceso de traspaso a la nube de AWS.