Aprende Elasticsearch

73 0 0 0

Introducción

El servicio Elasticsearch admite recuperación de múltiples condiciones, estadísticas y generación de informes para texto estructurado y no estructurado. Cuenta con un sistema de monitoreo integral con una serie de indicadores clave sobre sistemas, clusters y rendimiento de consultas. Elasticsearch ayuda a los usuarios a centrarse en la implementación de la lógica de servicio. Este servicio se aplica a escenarios como búsqueda y análisis de registros, recuperación de tiempo y espacio, recuperación de secuencias de tiempo y generación de informes, y búsqueda inteligente.

Elasticsearch tiene las siguientes características:

- Potente búsqueda de texto completo y pantalla de resaltado

- Almacenamiento de archivos en tiempo real distribuido, análisis en tiempo real y búsqueda diversificada

- Escalabilidad a cientos de servidores para procesar datos estructurados o no estructurados de nivel PB

- Los documentos se almacenan en índices, que se pueden agregar, eliminar, modificar y consultar. Proporciona capacidades de procesamiento de documentos diversificados.

- Búsqueda de información geográfica rica y agregación de ubicación geográfica

Estructura

La solución de clúster Elasticsearch está formada por los procesos EsMaster y EsNode1, EsNode2, EsNode3, EsNode4, EsNode5, EsNode6, EsNode7, EsNode8 y EsNode9, como se muestra en la Figura 1-1. La tabla 1-1 describe los módulos.

Figura 1-1 Estructura

20180504140402875001.png

 

Tabla 1-1 Descripción del módulo

Modulo

Descripción

Cliente

Se comunica con los procesos de instancia de EsMaster y EsNode en el clúster Elasticsearch a través de HTTP o HTTPS para realizar una búsqueda y recopilación distribuidas.

EsMaster

Almacena metadatos y datos de índice de Elasticsearch.

EsNode1-9

Almacena los datos del índice del Elasticsearch.

ZooKeeper cluster

Proporciona mecanismo de heartbeat para procesos en clusters de Elasticsearch.

Conceptos básicos

- Índice: un índice es un espacio de nombres lógicos en Elasticsearch, que consta de uno o varios fragmentos. Apache Lucene se utiliza para leer y escribir datos en el índice. Es similar a la base de datos de la base de datos relacional (RDB). Una instancia de Elasticsearch puede contener múltiples índices.

- Tipo: Si los documentos de varias estructuras se almacenan en un índice, puede encontrar la información de asignación de parámetros según el tipo de documento, lo que facilita el almacenamiento de documentos. El tipo es similar a la tabla en la base de datos. Un índice corresponde a un tipo de documento.

- Documento: Un documento es una unidad básica de información que se puede indexar. Este documento hace referencia a los datos JSON en la estructura de nivel superior u obtenidos mediante la serialización del objeto raíz. El documento es similar a la fila en la base de datos. Un tipo contiene varios documentos.

- Mapeo: un mapeo se usa para restringir el tipo de un campo y se puede crear automáticamente en función de los datos. El mapeo es similar al shema en la base de datos.

- Campo: El campo es la unidad mínima de un documento. El campo es similar a la columna en la base de datos. Cada documento contiene múltiples campos.

EsNodo: Nodo de Elasticsearch. Un nodo es una instancia de Elasticsearch.

- EsMaster: el nodo maestro que administra temporalmente algunos cambios a nivel de clúster, como crear o eliminar índices, y agregar o eliminar nodos. El nodo maestro no participa en el cambio de nivel de documento ni en la búsqueda. Cuando el tráfico aumenta, el nodo maestro no se convierte en el cuello de botella del clúster.

- Fragmento: el fragmento es la unidad de trabajo más pequeña en Elasticsearch. El documento está almacenado y referenciado en el fragmento.

- Fragmento primario: cada documento en el índice pertenece a un fragmento primario. El número de fragmentos primarios determina el máximo de datos que se pueden almacenar en el índice.

- Fragmento de réplica: un fragmento de réplica es una copia del fragmento primario. Previene la pérdida de datos causada por fallas de hardware y proporciona solicitudes de lectura, como buscar o recuperar documentos de otros fragmentos.

- Recuperación: Indica restauración de datos o redistribución de datos. Cuando se agrega o elimina un nodo, ElasticSearch redistribuye los fragmentos de índice según la carga del servidor físico correspondiente. Cuando se reinicia un nodo defectuoso, también se realiza la restauración de datos.

- Gateway: indica el modo de almacenamiento de una instantánea de índice de ElasticSearch. Por defecto, ElasticSearch almacena un índice en la memoria. Cuando la memoria está llena, ElasticSearch guarda persistentemente el índice en el disco duro local. Una puerta de enlace almacena las instantáneas de índice. Cuando el clúster de ElasticSearch correspondiente se detiene y luego se reinicia, los datos de respaldo del índice se leen desde la puerta de enlace. ElasticSearch admite varios tipos de puertas de enlace, incluidos los sistemas de archivos locales (predeterminados), los sistemas de archivos distribuidos, Hadoop HDFS y el almacenamiento en la nube de Amazon S3.

- Transporte: indica el modo de interacción entre los nodos o clústeres internos de ElasticSearch y el cliente ElasticSearch. Por defecto, TCP se usa para la interacción. Además, se admiten los protocolos de transmisión HTTP (formato JSON), Thrift, Servlet, Memcached y ZeroMQ (integrados a través de complementos).

- ZooKeeper: es obligatorio en Elasticsearch y proporciona funciones como el almacenamiento de información de autenticación de seguridad.

  • x
  • convención:

Responder

Responder
Debe iniciar sesión para responder la publicación Inicio de sesión | Registrarse

Aviso Aviso: Para garantizar sus legítimos derechos e intereses, la comunidad y los terceros no publicarán contenido que pueda generar riesgos legales a las partes, por ejemplo, pornografía, contenido político, contenido sobre juego, consumo y tráfico de drogas, así como contenido que viole los derechos de propiedad intelectual de terceros, por ejemplo, secretos comerciales, marcas, derechos de autor, patentes y privacidad personal. No comparta su cuenta ni su contraseña con terceros. Todas las operaciones realizadas usando su cuenta se considerarán como sus acciones y todas las consecuencias que estas acciones generen serán responsabilidad suya. Para obtener información detallada, consulte la “ Política de privacidad.”
Si el botón para adjuntar no está disponible, actualice Adobe Flash Player con la versión más reciente
¡Ingresa y disfruta de todos los beneficios para los miembros!

¡Ingresa y disfruta de todos los beneficios para los miembros!

Aterrizaje