Publicado en: Apr 30, 2024
Amazon Titan Text Embeddings V2, un nuevo modelo de incrustaciones de la familia de modelos Amazon Titan, ya está disponible de manera general en Amazon Bedrock. Con Titan Text Embeddings V2, los clientes pueden realizar diversas tareas de procesamiento del lenguaje natural (NLP) representando los datos de texto como vectores numéricos, conocidos como incrustaciones. Estas incrustaciones capturan las relaciones semánticas y contextuales entre palabras, frases o documentos en un espacio vectorial de alta dimensión. Este modelo está optimizado para casos de uso de generaciones aumentadas de recuperación (RAG) y también es adecuado para una variedad de otras tareas, como la recuperación de información, los chatbots de preguntas y respuestas, la clasificación y las recomendaciones personalizadas.
Amazon Text Embeddings V2 es un modelo ligero y eficiente, ideal para tareas de recuperación de alta precisión en diferentes dimensiones. El modelo admite tamaños de incrustaciones flexibles (256, 512, 1024) y prioriza el mantenimiento de la precisión en tamaños de dimensiones más pequeñas, lo que ayuda a reducir los costos de almacenamiento sin comprometer la precisión. Al reducir de 1.024 a 512 dimensiones, Titan Text Embeddings V2 conserva aproximadamente el 99% de precisión de recuperación, y al reducir de 1.024 a 256 dimensiones, el modelo mantiene una precisión del 97%. Además, Titan Text Embeddings V2 incluye soporte multilingüe para más de 100 idiomas durante el entrenamiento previo, así como la normalización de vectores unitarios para mejorar la precisión de la medición de la similitud vectorial.
Amazon Titan Text Embeddings V2 está disponible en las regiones de AWS Este de EE.UU. (Norte de Virginia) y Oeste de EE.UU. (Oregón). Para obtener más información, lea el blog de lanzamiento de AWS News, la página del producto Amazon Titan y la documentación. Para empezar a utilizar Titan Text Embeddings V2 en Amazon Bedrock, visite la consola de Amazon Bedrock.