Motores de búsqueda: composición, funciones, principios de funcionamiento. Motor de búsqueda ¿Qué es un motor de búsqueda?

Qué es esto

DuckDuckGo es un motor de búsqueda de código abierto bastante conocido. Los servidores están ubicados en los EE. UU. Además de su propio robot, el motor de búsqueda utiliza resultados de otras fuentes: Yahoo, Bing, Wikipedia.

El mejor

DuckDuckGo se posiciona como un motor de búsqueda que brinda la máxima privacidad y confidencialidad. El sistema no recopila ningún dato sobre el usuario, no almacena registros (ni historial de búsqueda) y el uso de cookies es lo más limitado posible.

DuckDuckGo no recopila ni comparte información personal de los usuarios. Esta es nuestra política de privacidad.

Gabriel Weinberg, fundador de DuckDuckGo

Por qué necesitas esto

Todos los principales motores de búsqueda intentan personalizar los resultados de la búsqueda basándose en datos sobre la persona que está frente al monitor. Este fenómeno se llama “burbuja de filtro”: el usuario ve sólo aquellos resultados que son consistentes con sus preferencias o que el sistema considera como tales.

Forma una imagen objetiva que no depende de su comportamiento anterior en Internet y elimina la publicidad temática de Google y Yandex en función de sus consultas. Con DuckDuckGo es fácil buscar información en idiomas extranjeros, mientras que Google y Yandex dan preferencia por defecto a los sitios en ruso, incluso si la consulta se realiza en otro idioma.


Qué es esto

not Evil es un sistema que busca en la red Tor anónima. Para usarlo, debe acceder a esta red, por ejemplo iniciando un archivo .

not Evil no es el único motor de búsqueda de este tipo. Existe LOOK (la búsqueda predeterminada en el navegador Tor, accesible desde Internet normal) o TORCH (uno de los motores de búsqueda más antiguos de la red Tor) y otros. Nos decidimos por no Evil debido a la clara sugerencia de Google (basta con mirar la página de inicio).

El mejor

Busca donde Google, Yandex y otros motores de búsqueda generalmente están cerrados.

Por qué necesitas esto

La red Tor contiene muchos recursos que no se pueden encontrar en una Internet respetuosa de la ley. Y su número aumentará a medida que se endurezca el control gubernamental sobre el contenido de Internet. Tor es una especie de red dentro de Internet con sus propias redes sociales, rastreadores de torrents, medios, plataformas comerciales, blogs, bibliotecas, etc.

3. YaCy

Qué es esto

YaCy es un motor de búsqueda descentralizado que funciona según el principio de las redes P2P. Cada computadora en la que está instalado el módulo de software principal escanea Internet de forma independiente, es decir, es similar a un robot de búsqueda. Los resultados obtenidos se recopilan en una base de datos común que utilizan todos los participantes de YaCy.

El mejor

Es difícil decir si esto es mejor o peor, ya que YaCy es un enfoque completamente diferente para organizar la búsqueda. La ausencia de un único servidor y empresa propietaria hace que los resultados sean completamente independientes de las preferencias de cualquier persona. La autonomía de cada nodo elimina la censura. YaCy es capaz de buscar en la deep web y en redes públicas no indexadas.

Por qué necesitas esto

Si usted es partidario del software de código abierto y de una Internet libre, no sujeta a la influencia de agencias gubernamentales y grandes corporaciones, entonces YaCy es su elección. También se puede utilizar para organizar una búsqueda dentro de una red corporativa u otra red autónoma. Y aunque YaCy no es muy útil en la vida cotidiana, es una alternativa digna a Google en términos del proceso de búsqueda.

4. Pipl

Qué es esto

Pipl es un sistema diseñado para buscar información sobre una persona específica.

El mejor

Los autores de Pipl afirman que sus algoritmos especializados realizan búsquedas de manera más eficiente que los motores de búsqueda "normales". En particular, se da prioridad a los perfiles de redes sociales, comentarios, listas de miembros y diversas bases de datos que publican información sobre personas, como bases de datos de decisiones judiciales. El liderazgo de Pipl en este ámbito lo confirman las valoraciones de Lifehacker.com, TechCrunch y otras publicaciones.

Por qué necesitas esto

Si necesita encontrar información sobre una persona que vive en los EE. UU., Pipl será mucho más eficaz que Google. Las bases de datos de los tribunales rusos aparentemente son inaccesibles para el motor de búsqueda. Por lo tanto, no se lleva tan bien con los ciudadanos rusos.

Qué es esto

FindSounds es otro motor de búsqueda especializado. Busca varios sonidos en fuentes abiertas: casa, naturaleza, coches, personas, etc. El servicio no admite consultas en ruso, pero existe una lista impresionante de etiquetas en ruso que puede utilizar para realizar búsquedas.

El mejor

La salida contiene sólo sonidos y nada extra. En la configuración puede configurar el formato deseado y la calidad del sonido. Todos los sonidos encontrados están disponibles para descargar. Hay una búsqueda por patrón.

Por qué necesitas esto

Si necesitas encontrar rápidamente el sonido de un disparo de mosquete, los golpes de un pájaro carpintero lactante o el grito de Homero Simpson, entonces este servicio es para ti. Y elegimos esto solo entre las consultas disponibles en ruso. En inglés el espectro es aún más amplio.

En serio, un servicio especializado requiere una audiencia especializada. Pero ¿y si a ti también te resulta útil?

Qué es esto

Wolfram|Alpha es un motor de búsqueda computacional. En lugar de enlaces a artículos que contienen palabras clave, proporciona una respuesta preparada a la solicitud del usuario. Por ejemplo, si ingresa "comparar las poblaciones de Nueva York y San Francisco" en el formulario de búsqueda en inglés, Wolfram|Alpha mostrará inmediatamente tablas y gráficos con la comparación.

El mejor

Este servicio es mejor que otros para encontrar hechos y calcular datos. Wolfram|Alpha recopila y organiza conocimientos disponibles en la Web de una variedad de campos, incluidos la ciencia, la cultura y el entretenimiento. Si esta base de datos contiene una respuesta preparada a una consulta de búsqueda, el sistema la muestra; si no, calcula y muestra el resultado. En este caso, el usuario no ve nada superfluo.

Por qué necesitas esto

Si es estudiante, analista, periodista o investigador, por ejemplo, puede utilizar Wolfram|Alpha para buscar y calcular datos relacionados con su trabajo. El servicio no comprende todas las solicitudes, pero se desarrolla constantemente y se vuelve más inteligente.

Qué es esto

El metabuscador Dogpile muestra una lista combinada de resultados de búsqueda de Google, Yahoo y otros sistemas populares.

El mejor

Primero, Dogpile muestra menos anuncios. En segundo lugar, el servicio utiliza un algoritmo especial para buscar y mostrar los mejores resultados de diferentes motores de búsqueda. Según los desarrolladores de Dogpile, sus sistemas generan los resultados de búsqueda más completos de todo Internet.

Por qué necesitas esto

Si no puede encontrar información en Google u otro motor de búsqueda estándar, búsquela en varios motores de búsqueda a la vez usando Dogpile.

Qué es esto

BoardReader es un sistema de búsqueda de texto en foros, servicios de preguntas y respuestas y otras comunidades.

El mejor

El servicio le permite limitar su campo de búsqueda a plataformas sociales. Gracias a filtros especiales, puede encontrar rápidamente publicaciones y comentarios que coincidan con sus criterios: idioma, fecha de publicación y nombre del sitio.

Por qué necesitas esto

BoardReader puede resultar útil para los especialistas en relaciones públicas y otros especialistas de los medios que estén interesados ​​en la opinión de las masas sobre determinados temas.

Finalmente

La vida de los motores de búsqueda alternativos suele ser fugaz. Lifehacker preguntó al ex director general de la filial ucraniana de Yandex, Sergei Petrenko, sobre las perspectivas a largo plazo de este tipo de proyectos.


Serguéi Petrenko

Ex director general de Yandex.Ucrania.

En cuanto al destino de los motores de búsqueda alternativos, es simple: ser proyectos muy especializados con una audiencia reducida y, por tanto, sin perspectivas comerciales claras o, por el contrario, con total claridad de su ausencia.

Si observa los ejemplos del artículo, puede ver que dichos motores de búsqueda se especializan en un nicho limitado pero popular, que quizás aún no ha crecido lo suficiente como para ser visible en los radares de Google o Yandex, o están probando una hipótesis original en el ranking, que aún no es aplicable en la búsqueda habitual.

Por ejemplo, si una búsqueda en Tor de repente tiene demanda, es decir, al menos un porcentaje de la audiencia de Google necesita los resultados de allí, entonces, por supuesto, los motores de búsqueda comunes comenzarán a resolver el problema de cómo encontrarlos y mostrárselos al usuario. Si el comportamiento de la audiencia muestra que para una proporción significativa de usuarios en un número significativo de consultas, los resultados dados sin tener en cuenta factores que dependen del usuario parecen más relevantes, entonces Yandex o Google comenzarán a producir tales resultados.

"Ser mejor" en el contexto de este artículo no significa "ser mejor en todo". Sí, en muchos aspectos nuestros héroes están lejos de Yandex (incluso lejos de Bing). Pero cada uno de estos servicios ofrece al usuario algo que los gigantes de la industria de las búsquedas no pueden ofrecer. Seguro que tú también conoces proyectos similares. Comparta con nosotros, hablemos.

Internet es necesario para muchos usuarios para recibir respuestas a las consultas (preguntas) que realizan.

Si no existieran los motores de búsqueda, los usuarios tendrían que buscar de forma independiente los sitios que necesitan, recordarlos y anotarlos. En muchos casos, encontrar algo adecuado “manualmente” sería muy difícil y, a menudo, simplemente imposible.

Hacemos todo este trabajo rutinario de buscar, almacenar y clasificar información en sitios web.

Empecemos por los famosos motores de búsqueda Runet.

Motores de búsqueda de Internet en ruso.

1) Empecemos por el motor de búsqueda nacional. Yandex opera no sólo en Rusia, sino también en Bielorrusia, Kazajstán, Ucrania y Turquía. También hay Yandex en inglés.

2) El motor de búsqueda de Google nos llegó desde Estados Unidos y tiene localización en ruso:

3) Motor de búsqueda nacional Mail ru, que representa simultáneamente la red social VKontakte, Odnoklassniki, también My World, el famoso Answers Mail.ru y otros proyectos.

4) Motor de búsqueda inteligente

Nigma (Nigma) http://www.nigma.ru/

Desde el 19 de septiembre de 2017, el nigma “intelectual” no funciona. Dejó de ser de interés económico para sus creadores y cambiaron a otro motor de búsqueda llamado CocCoc.

5) La conocida empresa Rostelecom ha creado el motor de búsqueda Sputnik.

Hay un motor de búsqueda llamado Sputnik, diseñado específicamente para niños, sobre el que escribí.

6) Rambler fue uno de los primeros motores de búsqueda nacionales:

Existen otros motores de búsqueda famosos en el mundo:

  • Bing,
  • yahoo!,
  • Baidu,
  • Ecosia,

Intentemos descubrir cómo funciona un motor de búsqueda, es decir, cómo se indexan los sitios, se analizan los resultados de la indexación y se generan los resultados de búsqueda. Los principios de funcionamiento de los motores de búsqueda son aproximadamente los mismos: buscar información en Internet, almacenarla y clasificarla para su entrega en respuesta a las solicitudes de los usuarios. Pero los algoritmos que utilizan los motores de búsqueda pueden diferir mucho. Estos algoritmos se mantienen en secreto y está prohibida su divulgación.

Al ingresar la misma consulta en las cadenas de búsqueda de diferentes motores de búsqueda, puede obtener diferentes respuestas. La razón es que todos los motores de búsqueda utilizan sus propios algoritmos.

El propósito de los motores de búsqueda.

En primer lugar, debes saber que los motores de búsqueda son organizaciones comerciales. Su objetivo es obtener ganancias. Puede obtener beneficios de la publicidad contextual, de otros tipos de publicidad y de la promoción de los sitios necesarios hasta los primeros puestos de los resultados de búsqueda. En general, hay muchas formas.

Depende del tamaño de la audiencia, es decir, cuántas personas utilizan este motor de búsqueda. Cuanto mayor sea la audiencia, a más personas se mostrará el anuncio. En consecuencia, esta publicidad costará más. Los motores de búsqueda pueden aumentar su audiencia a través de su propia publicidad, así como atrayendo usuarios mejorando la calidad de sus servicios, el algoritmo y la comodidad de búsqueda.

Lo más importante y difícil aquí es el desarrollo de un algoritmo de búsqueda completamente funcional que proporcione resultados relevantes para la mayoría de las consultas de los usuarios.

El trabajo de un buscador y las acciones de los webmasters.

Cada motor de búsqueda tiene su propio algoritmo, que debe tener en cuenta una gran cantidad de factores diferentes al analizar la información y compilar los resultados en respuesta a la solicitud del usuario:

  • la edad de un sitio en particular,
  • características del dominio del sitio web,
  • calidad del contenido del sitio y sus tipos,
  • características de navegación y estructura del sitio,
  • usabilidad (comodidad para los usuarios),
  • factores de comportamiento (el motor de búsqueda puede determinar si el usuario encontró lo que estaba buscando en el sitio o si el usuario regresó al motor de búsqueda nuevamente y allí nuevamente busca una respuesta a la misma consulta)
  • etc.

Todo esto es necesario precisamente para que los resultados a petición del usuario sean lo más relevantes posible, satisfaciendo las necesidades del usuario. Al mismo tiempo, los algoritmos de los motores de búsqueda cambian y se perfeccionan constantemente. Como dicen, no hay límite para la perfección.

Por otro lado, los webmasters y optimizadores inventan constantemente nuevas formas de promocionar sus sitios, que no siempre son honestas. La tarea de los desarrolladores del algoritmo del motor de búsqueda es realizar cambios que no permitan que los sitios "malos" de optimizadores deshonestos aparezcan en el TOP.

¿Cómo funciona un motor de búsqueda?

Ahora hablemos de cómo funciona realmente el motor de búsqueda. Consta de al menos tres etapas:

  • exploración,
  • indexación,
  • rango.

La cantidad de sitios en Internet es simplemente astronómica. Y cada sitio es información, contenido informativo creado para lectores (personas vivas).

Exploración

Se trata de un motor de búsqueda que recorre Internet para recopilar nueva información, analizar enlaces y buscar nuevos contenidos que puedan utilizarse para devolver al usuario respuesta a sus solicitudes. Para escanear, los motores de búsqueda tienen robots especiales llamados robots de búsqueda o arañas.

Los robots de búsqueda son programas que visitan automáticamente sitios web y recopilan información sobre ellos. El rastreo puede ser primario (el robot visita un sitio nuevo por primera vez). Después de recopilar inicialmente información del sitio e ingresarla en la base de datos del motor de búsqueda, el robot comienza a visitar sus páginas con cierta regularidad. Si se ha producido algún cambio (se ha agregado contenido nuevo, se ha eliminado contenido antiguo), el motor de búsqueda registrará todos estos cambios.

La tarea principal de una araña de búsqueda es encontrar nueva información y enviarla al motor de búsqueda para la siguiente etapa de procesamiento, es decir, para la indexación.

Indexación

Un motor de búsqueda puede buscar información sólo entre aquellos sitios que ya están incluidos en su base de datos (indexados por ella). Si el rastreo es el proceso de buscar y recopilar información disponible en un sitio en particular, entonces la indexación es el proceso de ingresar esta información en la base de datos del motor de búsqueda. En esta etapa, el motor de búsqueda decide automáticamente si ingresar tal o cual información en su base de datos y dónde ingresarla, en qué sección de la base de datos. Por ejemplo, Google indexa casi toda la información encontrada por sus robots en Internet, mientras que Yandex es más exigente y no indexa todo.

Para los sitios nuevos, la etapa de indexación puede ser larga, por lo que los visitantes de los motores de búsqueda pueden esperar mucho tiempo para acceder a los sitios nuevos. Y la nueva información que aparece en sitios antiguos y bien promocionados se puede indexar casi instantáneamente y casi de inmediato terminar en el "índice", es decir, en la base de datos del motor de búsqueda.

que van

El ranking es la disposición de la información que previamente fue indexada e ingresada en la base de datos de un motor de búsqueda en particular, según el ranking, es decir, qué información el motor de búsqueda mostrará a sus usuarios en primer lugar y qué información se colocará”. rango” más bajo. La clasificación se puede atribuir a la etapa en la que el motor de búsqueda presta el servicio a su cliente: el usuario.

En los servidores de los motores de búsqueda se procesa la información recibida y se generan los resultados para una amplia variedad de consultas de todo tipo. Aquí es donde entran en juego los algoritmos de los motores de búsqueda. Todos los sitios incluidos en la base de datos están clasificados por temas y los temas se dividen en grupos de consultas. Para cada grupo de solicitudes se podrá elaborar una cuestión preliminar, que posteriormente será ajustada.

1 MOTOR DE BÚSQUEDA. 3

1.1. Cómo funciona un motor de búsqueda 3-5

1.2. 6 tipos de motores de búsqueda

2 BUSCADOR Google. 7

2.1. Historia del sistema 7-8

2.2 Principio de funcionamiento y capacidades del portal 9-11.

SISTEMA DE BÚSQUEDA

Un motor de búsqueda es un sistema informático diseñado para buscar información. Una de las aplicaciones más conocidas de los motores de búsqueda son los servicios web para buscar texto o información gráfica en la World Wide Web. También existen sistemas que pueden buscar archivos en servidores FTP, productos en tiendas en línea e información en grupos de noticias de Usenet.

Para buscar información utilizando un motor de búsqueda, el usuario formula una consulta de búsqueda. El trabajo de un motor de búsqueda es responder a la solicitud de un usuario buscando documentos que contengan las palabras clave especificadas o palabras que de alguna manera estén relacionadas con las palabras clave. En este caso, el motor de búsqueda genera una página de resultados de búsqueda. Dichos resultados de búsqueda pueden contener diferentes tipos de resultados, por ejemplo: páginas web, imágenes, archivos de audio. Algunos motores de búsqueda también recuperan información de bases de datos relevantes y directorios de recursos en Internet.

El motor de búsqueda es mejor cuantos más documentos devuelva que sean relevantes para la consulta del usuario. Los resultados de la búsqueda pueden volverse menos relevantes debido a las características de los algoritmos (consulte “Burbuja de filtro” [⇨]) o debido a un error humano [⇨]. En 2015, el motor de búsqueda más popular del mundo es Google, pero hay países donde los usuarios prefieren otros motores de búsqueda. Por ejemplo, en Rusia, Yandex aventaja a Google en más de un 10%[⇨].

Según los métodos de búsqueda y servicio, existen cuatro tipos de sistemas de búsqueda: sistemas que utilizan robots de búsqueda, sistemas controlados por humanos, sistemas híbridos y metasistemas[⇨]. La arquitectura del motor de búsqueda normalmente incluye:

Un robot de búsqueda que recopila información de sitios de Internet u otros documentos,

Un indexador que proporciona búsqueda rápida a través de información acumulada, y

El motor de búsqueda es una interfaz gráfica para el usuario[⇨].

¿Cómo funciona un motor de búsqueda?

Los principales componentes de un sistema de búsqueda: robot de búsqueda, indexador, motor de búsqueda.

Normalmente, los sistemas funcionan por etapas. Primero, el rastreador recupera el contenido, luego el indexador genera un índice de búsqueda y, finalmente, el motor de búsqueda proporciona la funcionalidad para buscar los datos que se están indexando. Para actualizar el motor de búsqueda, se repite este ciclo de indexación.

Los motores de búsqueda funcionan almacenando información sobre muchas páginas web, que recuperan de páginas HTML. Un robot de búsqueda o “rastreador” es un programa que sigue automáticamente todos los enlaces encontrados en una página y los resalta. El rastreador, basándose en enlaces o en una lista predefinida de direcciones, busca nuevos documentos que el motor de búsqueda aún no conoce. El propietario del sitio puede excluir determinadas páginas utilizando robots.txt, que puede utilizarse para evitar la indexación de archivos, páginas o directorios en el sitio.

El motor de búsqueda analiza el contenido de cada página para su posterior indexación. Las palabras se pueden extraer de títulos, texto de página o campos especiales: metaetiquetas. Un indexador es un módulo que analiza una página, habiéndola previamente dividido en partes, utilizando sus propios algoritmos léxicos y morfológicos. Todos los elementos de una página web se aíslan y analizan por separado. Los datos de la página web se almacenan en una base de datos de índice para su uso en consultas posteriores. El índice le permite encontrar rápidamente información según la solicitud del usuario. Varios motores de búsqueda, como Google, almacenan la página original completa o parte de ella, lo que se denomina caché, así como información diversa sobre la página web. Otros sistemas, como el de AltaVista, almacenan cada palabra de cada página encontrada. El uso de un caché ayuda a acelerar la recuperación de información de páginas ya visitadas. Las páginas almacenadas en caché siempre contienen el texto que el usuario especificó en la consulta de búsqueda. Esto puede resultar útil en el caso de que la página web se haya actualizado, es decir, ya no contiene el texto de la solicitud del usuario y la página en el caché aún es antigua. Esta situación se debe a linkrot y al enfoque fácil de usar (usabilidad) de Google. Esto implica devolver fragmentos de texto cortos del caché que contienen el texto de la solicitud. Se aplica el principio de mínima sorpresa; el usuario normalmente espera ver las palabras buscadas en los textos de las páginas recibidas (expectativas del usuario). Además del hecho de que el uso de páginas en caché acelera las búsquedas, las páginas en caché pueden contener información que ya no está disponible en ningún otro lugar.

El motor de búsqueda trabaja con los archivos de salida recibidos del indexador. El motor de búsqueda acepta consultas de los usuarios, las procesa mediante un índice y devuelve los resultados de la búsqueda.

Cuando un usuario introduce una consulta en un motor de búsqueda (normalmente utilizando palabras clave), el sistema comprueba su índice y devuelve una lista de las páginas web más relevantes (ordenadas según algún criterio), normalmente con un breve resumen que contiene el título del documento y a veces partes del texto. El índice de búsqueda se construye mediante una técnica especial basada en información extraída de páginas web. Desde 2007, el buscador de Google permite realizar búsquedas en función del tiempo, creando los documentos que se buscan (llamando al menú “Herramientas de búsqueda” y especificando el rango temporal). La mayoría de los motores de búsqueda admiten el uso de operadores booleanos Y, O, NO en consultas, lo que permite aclarar o ampliar la lista de palabras clave buscadas. En este caso, el sistema buscará palabras o frases exactamente como las ingresó. Algunos motores de búsqueda tienen la capacidad de hacer zoom, en cuyo caso los usuarios amplían el área de búsqueda especificando la distancia a las palabras clave. También existe una búsqueda conceptual, que utiliza el análisis estadístico del uso de las palabras y frases buscadas en los textos de las páginas web. Estos sistemas permiten escribir consultas en lenguaje natural. Un ejemplo de un motor de búsqueda de este tipo es el sitio Ask com.

La utilidad de un motor de búsqueda depende de la relevancia de las páginas que encuentra. Si bien millones de páginas web pueden incluir una palabra o frase determinada, algunas pueden ser más relevantes, populares o autorizadas que otras. La mayoría de los motores de búsqueda utilizan métodos de clasificación para colocar los "mejores" resultados en la parte superior de la lista. Los motores de búsqueda deciden qué páginas son más relevantes y en qué orden deben mostrarse los resultados de diferentes formas. Los métodos de búsqueda, como el propio Internet, cambian con el tiempo. Así surgieron dos tipos principales de motores de búsqueda: los sistemas de palabras clave predefinidas y ordenadas jerárquicamente y los sistemas en los que se genera un índice invertido a partir del análisis de texto.

La mayoría de los motores de búsqueda son empresas comerciales que obtienen ganancias a través de la publicidad; en algunos motores de búsqueda se pueden comprar los primeros lugares en los resultados de búsqueda para determinadas palabras clave pagando una tarifa. Los motores de búsqueda que no cobran por el orden de aparición de los resultados ganan dinero con la publicidad contextual, mientras que los mensajes publicitarios corresponden a la solicitud del usuario. Este tipo de publicidad se muestra en una página con una lista de resultados de búsqueda y los motores de búsqueda ganan dinero cada vez que un usuario hace clic en los mensajes publicitarios.

Entonces, ¿cómo prepara un motor de búsqueda sus materiales para su publicación y cómo busca información el propio motor de búsqueda? La recopilación de información en la red es facilitada por un robot o bot único para cada motor de búsqueda, que también tiene otros sinónimos, como rastreador o araña, y el trabajo del propio sistema de búsqueda se puede dividir en tres etapas:

La primera etapa del funcionamiento de un motor de búsqueda incluye escanear sitios en la red global y recopilar copias de páginas web en sus propios servidores. Esto crea una gran cantidad de información que aún no ha sido procesada y no es adecuada para los resultados de búsqueda.

La segunda etapa del trabajo del motor de búsqueda se reduce a ordenar la información recibida anteriormente, en la primera etapa, de los sitios. La clasificación se realiza de tal manera que en el menor tiempo posible se obtenga la búsqueda de muy alta calidad que los usuarios realmente esperan de un motor de búsqueda. La etapa se llama indexación, lo que significa que las páginas ya están preparadas para su publicación y la base de datos actual se considerará un índice.

Es precisamente la tercera etapa la que determina los resultados de la búsqueda, después de recibir una solicitud de su cliente, en función de las palabras clave o palabras clave cercanas especificadas en la solicitud. Esto facilita la selección de la información más relevante para la solicitud y su posterior entrega. Como hay mucha, mucha información, el motor de búsqueda realiza una clasificación de acuerdo con sus algoritmos.

Se considera que el mejor buscador es aquel que puede proporcionar el material que responde más correctamente a la solicitud del usuario. Pero aquí también puede haber resultados influenciados por personas interesadas en promocionar su sitio; aunque no siempre, estos sitios aparecen a menudo en los resultados de búsqueda, pero no por mucho tiempo.

Cualquier sistema de búsqueda contiene una parte de software en la que se basa todo el mecanismo de búsqueda: se llama motor de búsqueda; es un paquete de software que brinda la capacidad de buscar información. Después de contactar a un motor de búsqueda, una persona genera una consulta de búsqueda y la ingresa en la barra de búsqueda, el motor de búsqueda genera una página con una lista de resultados de búsqueda, los más relevantes, en opinión del motor de búsqueda, se encuentran más arriba.

Relevancia de búsqueda: buscar los materiales que mejor satisfagan la solicitud del usuario y colocar hipervínculos sobre ellos en la página de resultados de búsqueda con resultados más precisos que otros. La distribución de los resultados en sí se denomina clasificación del sitio.

Aunque ya se han identificado líderes mundiales en muchas regiones, los motores de búsqueda continúan desarrollando sus búsquedas de alta calidad. Cuanto mejor sea la búsqueda que puedan ofrecer, más personas la utilizarán.

Tipos de motores de búsqueda

Hay cuatro tipos de motores de búsqueda: robóticos, impulsados ​​por humanos, híbridos y meta.

Son uno de los principales y más importantes servicios de Internet.

Con la ayuda de los motores de búsqueda, miles de millones de usuarios de Internet encuentran la información que necesitan.

¿Qué es un motor de búsqueda?

Un motor de búsqueda es un complejo de software y hardware que utiliza algoritmos especiales para procesar una gran cantidad de información sobre una amplia variedad de sitios, su contenido, hasta cada página.

Un motor de búsqueda, desde el punto de vista de los visitantes comunes, es un sitio tan inteligente que contiene mucha información y proporciona respuestas a las consultas de los usuarios.

Los usuarios de Internet utilizan diferentes motores de búsqueda en diferentes países. En el segmento de Internet de habla inglesa, el motor de búsqueda más popular es Google.

Motores de búsqueda en RuNet

En Rusia, más de la mitad de los usuarios prefieren el motor de búsqueda Yandex y Google representa alrededor del 35% de las consultas. Otros usuarios utilizan Rambler, Mail.ru, Nigma y otros servicios.

En Ucrania, alrededor del 60% de los usuarios utilizan Google, Yandex representa algo más del 25% de las solicitudes procesadas.

Por lo tanto, al promocionar sitios en Runet, los especialistas intentan promocionar el sitio, centrándose en los motores de búsqueda Yandex y Google.

Tareas del motor de búsqueda

Para responder a las preguntas de los visitantes con la mayor precisión posible, los motores de búsqueda deben realizar las siguientes tareas:

  1. Recopile información de forma rápida y eficiente sobre varias páginas de diferentes sitios.
  2. Procesar información sobre estas páginas y determinar a qué consulta o consultas corresponden.
  3. Generar y proporcionar resultados de búsqueda en respuesta a las solicitudes de los usuarios.

Componentes de los motores de búsqueda.

Los motores de búsqueda son un complejo de software complejo que consta de los siguientes bloques principales:

  1. Recopilación de datos.
  2. Indexación.
  3. Cálculo.
  4. Alcance.

Esta división es condicional, ya que el trabajo de los diferentes motores de búsqueda es algo diferente entre sí.

1. Recopilación de datos

En esta etapa, la tarea es encontrar nuevos documentos, elaborar un plan para visitarlos y escanearlos.

Los webmasters deben informar a los motores de búsqueda sobre la aparición de nuevos materiales colocando la dirección de la página en la página complementaria o transmitiendo el anuncio de la página en las redes sociales.

Personalmente, utilizo el último método y creo que es suficiente.

Un comentario. Me desviaré un poco y hablaré sobre la efectividad de publicar anuncios en las redes sociales sobre la velocidad de indexación de nuevas páginas del sitio web.

Utilizo el servicio text.ru para controlar y registrar la singularidad del texto en las páginas de mi sitio web.

Comprueba cualitativamente la unicidad, la registra y permite colocar un banner de unicidad en las páginas de su sitio web.

Pero a veces hay una larga cola para procesar este servicio. He tenido varios casos en los que no esperé la verificación de unicidad, publiqué un artículo en el sitio y lo hice circular en las redes sociales.

Si la verificación de unicidad se retrasó aproximadamente una hora o más, el porcentaje de unicidad siempre fue del 0%. Esto significa que en menos de una hora después de la publicación, la página ya estaba indexada e ingresada en la base de datos del motor de búsqueda.

2. Indexación

Los motores de búsqueda, después de recopilar datos sobre nuevas páginas web, las colocan en su base de datos. En este caso, se forma un índice, es decir, una clave para acceder rápidamente a los datos sobre esta página, si surge tal necesidad.

3. Cálculo

Después de ingresar a la base de datos, las páginas de nuestros sitios pasan por la etapa de cálculo de diversos parámetros e indicadores.

Nadie, excepto los propios desarrolladores de algoritmos de los motores de búsqueda, puede decir exactamente cuántos de estos indicadores son y cómo se calculan.

4. Clasificación

Luego, en función de los parámetros e indicadores calculados, se determina la relevancia de la página para determinadas consultas y se clasifica la página.

Esto será importante para la generación rápida y de alta calidad de páginas de resultados de búsqueda para estas consultas.

Los motores de búsqueda generan respuestas a las consultas de los usuarios y generan resultados para ellas en forma de una página de resultados de búsqueda.

Cabe señalar que los algoritmos para procesar datos de páginas, generar indicadores y métodos de clasificación se mejoran constantemente. Las prioridades según las cuales se produce la clasificación cambian.
Los motores de búsqueda se esfuerzan por responder a las solicitudes de los usuarios con la mayor precisión posible, tratando de tener en cuenta la naturaleza de la solicitud, los intereses de un usuario en particular, su lugar de residencia, edad, sexo, hábitos e inclinaciones.

¡Hola queridos lectores! Ekaterina Kalmykova está contigo. El artículo de hoy estará dedicado al concepto de motor de búsqueda, qué es y para qué sirve. También consideraremos en detalle los tipos de motores de búsqueda en Internet.

Si tiene una pregunta: "¿Por qué necesito saber acerca de estos motores de búsqueda?", Le responderé de esta manera. Cuando comes una deliciosa sopa en un restaurante, ¿te gustaría saber con qué ingredientes está hecha para poder recrearla tú mismo en casa? Después de todo, si está satisfecho con el resultado final, es decir, el sabor de la sopa, probablemente le interesaría saber qué llevó a este resultado.

Lo mismo puede decirse de trabajar con un motor de búsqueda (SE). Si crea su propio blog en el futuro y, sabiendo cómo funciona el PS, no tendrá que recurrir a especialistas en busca de ayuda. Podrás gestionar tu proyecto de forma independiente de tal forma que el motor de búsqueda pueda verlo y mostrarlo a otros usuarios. Después de todo, el tráfico a su recurso dependerá de esto y, en consecuencia, sus ganancias.

Entonces empecemos.

¿Qué es un motor de búsqueda?

Un motor de búsqueda es un recurso especial en Internet que proporciona información al usuario de acuerdo con su solicitud. Es decir, este recurso recopila todos los datos de la red global, todos los proyectos web, y cuando recibe una solicitud específica de un usuario, proporciona la información necesaria buscada dirigiéndolo, por ejemplo, a un blog o sitio web temático.

Así, después de crear tu proyecto, tu tarea será ingresar a los resultados de búsqueda, es decir, a la “lista” o base de datos del motor de búsqueda. Dado que la promoción de un sitio web en Internet simplemente no es posible sin utilizar algún tipo de motor de búsqueda, deberá cuidar la calidad de su recurso, su optimización interna y externa. Discutiremos cómo hacer esto en los siguientes artículos. Así que no te lo pierdas.

Mientras tanto, si decides crear tu propio blog, te recomiendo leer estos artículos:

Dado que casi todos los días aparecen nuevos recursos web, la base de datos del motor de búsqueda debe actualizarse constantemente. Cada sitio recién creado debe ser indexado por un robot. En palabras simples, los asistentes de los motores de búsqueda (robots) deben familiarizarse con el nuevo recurso y transferir estos datos al propio motor de búsqueda.

Bueno, aquí probablemente habrás adivinado que cuando un robot visita tu blog, todo le debería gustar. Tu destino futuro dependerá de este invitado.

Te contaré cómo hacer que el robot esté completamente encantado con tu proyecto en uno de los siguientes artículos. No te lo pierdas, habrá información interesante y muy interesante que compartiré contigo.

Los motores de búsqueda funcionan.

Todo el trabajo relacionado con el PS comienza ingresando la consulta deseada en la barra de búsqueda. ¿Qué pueden buscar los usuarios? Sí, cualquier cosa, desde una receta de empanadas con repollo hasta la eterna pregunta “cómo ganar más dinero sin hacer nada”.

Para que su recurso sea la respuesta a la pregunta, debe estar por delante de sus competidores. Para hacer esto, debe prestar especial atención a la promoción de su proyecto, que incluye actividades como escribir contenido optimizado de alta calidad, es decir, responder a las solicitudes del artículo, mejorar el factor de comportamiento, es decir, para que su lector está interesado en estar en el recurso, esto mejora la usabilidad, es decir, la comodidad del visitante y muchos otros factores. Todos aprenderemos a hacer esto contigo.

Componentes del motor de búsqueda

¿Y qué ayuda a los motores de búsqueda, por ejemplo, Google, a indexar su recurso?

  1. Los agentes son trabajadores que hacen la mayor parte del trabajo: indexar y analizar sitios.
  2. Las arañas son un programa que puede descargar páginas de un recurso web y recopilar información general sobre él.
  3. Rastreadores (rastreador): un programa que busca todos los enlaces de las páginas y luego busca nuevos datos que no sean familiares para los motores de búsqueda.
  4. Indexador: analiza texto, títulos, estilo, etc.
  5. Robots: indexe sus páginas de contenido y también estudie varios enlaces.

Para que la indexación se realice de la manera que necesita, debe crear un documento especial "robots.txt". Permite que el sistema revise solo aquellas páginas que necesita y elimine las que no debería ver.

Tipos de motores de búsqueda

Hay varias opciones para los sistemas de recuperación de información:

  • Catálogos. Una comparación de búsqueda simple es una estantería en una biblioteca. Todo se almacena allí en subcategorías y categorías de temas específicos. Si se encuentra en un motor de búsqueda de este tipo, créame, la información que encuentre allí será más que útil y comprensible para su percepción. ¿Puedes adivinar de qué sitio común estamos hablando? Por supuesto, sobre Wikipedia, que ha recopilado todo un directorio de información útil.
  • Índices de búsqueda. La búsqueda de datos se realiza mediante frases clave. Esto es conveniente e inconveniente al mismo tiempo. Creo que me entenderán aquellas personas que buscan, por ejemplo, “Una chica muestra su clase”, y encuentran como una chica muestra el pulgar hacia arriba, pero en la búsqueda sale algo no muy decente. 🙂 Este tipo de búsqueda caracteriza a la mayoría de los buscadores.
  • Sistemas de calificación. Determinan su popularidad en función del número de visitas. Por supuesto, este no es el mejor criterio, ya que no siempre se tiene en cuenta la utilidad y calidad del recurso en sí. Un ejemplo de un sistema de este tipo es el recurso de Internet alexa.com.

Los servidores de búsqueda también se dividen en generales y especializados. Los motores de búsqueda generales clasifican los datos de información sin realizar ninguna selección en todos los recursos web que conocen. Estos incluyen Yandex, Rambler, Google. Especializado: ordenar por idioma utilizado.

Los motores de búsqueda también se pueden dividir en distribución regional y global.

Hoy en día, todos los motores de búsqueda mejoran constantemente sus algoritmos para seleccionar recursos relevantes y de alta calidad.

Una pequeña historia

PD apareció en RuNet en 1996: estos son Aport y Rambler. Un año después, en 1997, se formó Yandex y un año después, en 1998, apareció otro competidor: Google. Actualmente los más populares son Yandex y Google.

¿Qué motores de búsqueda son los más populares ahora?

Aquí están las estadísticas:

Como puede ver, Yandex es ahora el más popular en Rusia, junto con Google y Mail.

De esta manera, podrás ver las búsquedas principales en las que debes centrarte al crear y promocionar tu proyecto.

Motor de búsqueda Yandex

El principio de funcionamiento es el siguiente: ingrese la consulta deseada en la barra de búsqueda, haga clic en "Buscar" y observe los resultados. Yandex ha seleccionado 13 millones de respuestas a su solicitud. También puedes buscar en imágenes, vídeos y en el mercado (ver la columna de la izquierda).

Además, puede configurar la región de búsqueda. Para hacer esto, haga clic en el ícono al lado de la cruz en la barra de búsqueda y seleccione la región deseada en la ventana de filtro.

motor de búsqueda de google

Google funciona de manera similar a Yandex. Puedes buscar información en diferentes secciones: imágenes, vídeos, noticias, mapas, etc.

Si haces clic en “Herramientas de búsqueda”, se abrirá un panel con configuraciones, donde podrás seleccionar la región, el idioma y a qué hora buscar información.

Ahora sabe qué motores de búsqueda existen en Internet, también ha visto los más populares y ahora, armado con información, puede establecer sus conexiones e interacción con los motores de búsqueda.

Eso es todo por hoy. ¿Te gusta el artículo?

Chau a todos.

Te aconsejo que actualices tu blog para no perderte las últimas novedades.

Ekaterina Kalmykova