Publicado en: Apr 21, 2020
Amazon Elasticsearch Service permite ahora agregar archivos de diccionario personalizado a sus dominios. A partir de ahora, puede especificar sinónimos, palabras reservadas y archivos de segmentación para mejorar la indexación, la concordancia y la relevancia de búsqueda. Antes, solo podía incluir este tipo de elementos de personalización a través de su asignación, lo que hacía que la administración fuera engorrosa y complicada.
Los sinónimos le brindan maneras de aumentar la concordancia entre conceptos similares. Por ejemplo, puede especificar el sinónimo “uno-> 1” para emparejar cualquier consulta que contenga estos conceptos relacionados. Las palabras reservadas son términos comunes, de bajo valor, como “un”, “una”, “y” o “el”, que no contribuyen de forma positiva a la concordancia o a la relevancia. Estas palabras se eliminan de indexaciones y consultas. El uso de un diccionario de segmentación personalizado es de una importancia vital para garantizar el mejor indexado de texto libre en alemán y en idiomas asiáticos. Estos idiomas cuentan con caracteres o términos compuestos que pueden significar cosas diferentes según el contexto o cómo estén divididos. Utilizar un diccionario de segmentación aplica un control estricto a esta descomposición.
Gracias a la compatibilidad con diccionarios personalizados, Amazon Elasticsearch Service puede importar ahora sus archivos de diccionario desde Amazon S3 y hacer que estén disponibles para asociarse con el/los dominio/s de Amazon Elasticsearch Service según sea necesario. La compatibilidad con diccionarios personalizados está disponible en todas las versiones de Elasticsearch en Amazon Elasticsearch Service. Para obtener más información, consulte la documentación.
La compatibilidad con el diccionario personalizado ya se encuentra disponible para los dominios de Amazon Elasticsearch Service en 21 regiones de todo el mundo: EE. UU. Este (Norte de Virginia, Ohio), EE. UU. Oeste (Oregón, Norte de California), AWS GovCloud (EE. UU. Gov Este, EE. UU. Gov Oeste), Canadá (Central), América del Sur (São Paulo), UE (Irlanda, Londres, Fráncfort, París, Estocolmo), Asia Pacífico (Singapur, Sídney, Tokio, Seúl, Mumbai, Hong Kong) y China (Pekín, a cargo de Sinnet y Ningxia, a cargo de NWCD). Consulte la Tabla de regiones de AWS para obtener más información acerca de la disponibilidad de Amazon Elasticsearch Service.