¿Qué es un motor de búsqueda? Qué se entiende por motor de búsqueda: definición, historia y datos interesantes

motor de búsqueda- un complejo de software y hardware con una interfaz web que brinda la posibilidad de buscar información en Internet.

Todos los motores de búsqueda están unidos por el hecho de que están ubicados en potentes servidores especialmente dedicados y están vinculados a canales de comunicación eficaces. Los motores de búsqueda también se denominan sistemas de recuperación de información (IRS). El número de visitantes atendidos simultáneamente de los sistemas más populares alcanza varios miles. Los más famosos atienden a millones de clientes al día. En los casos en que un motor de búsqueda se basa en un directorio, se le llama directorio. Se basa en el trabajo de los moderadores. La base del IRS con búsqueda de texto completo es la recopilación automática de información. Se lleva a cabo mediante programas especiales. Estos programas examinan periódicamente el contenido de todos los recursos de Internet. Para ello, se mueven, o como dicen, se arrastran, a través de diferentes recursos. En consecuencia, estos programas se denominan robots. Hay otros nombres: dado que WWW es una abreviatura de la expresión World Wide Web, es natural llamar a dicho programa araña en inglés. - araña. Recientemente se han utilizado otros nombres: índices o directorios automáticos. Todos estos programas exploran y "descargan" información de diferentes URL. Los programas de este tipo visitan cada recurso después de un tiempo determinado. Ningún motor de búsqueda puede indexar todo Internet. Por tanto, las bases de datos que contienen las direcciones de los recursos indexados son diferentes para los distintos motores de búsqueda. Sin embargo, muchos de ellos se esfuerzan, si es posible, por cubrir en su trabajo todo el espacio de la World Wide Web.

Para buscar información utilizando un motor de búsqueda, el usuario formula una consulta de búsqueda. Según la solicitud del usuario, el motor de búsqueda genera una página de resultados de búsqueda. Estos resultados de búsqueda pueden combinar diferentes tipos de archivos, por ejemplo: páginas web, imágenes, archivos de vídeo. Algunos motores de búsqueda también recuperan datos de bases de datos y directorios de recursos en Internet.

Según los métodos de búsqueda y servicio, existen cuatro tipos de motores de búsqueda:

1.sistemas que utilizan robots de búsqueda.

2. sistemas controlados por humanos

3.sistemas híbridos

Cuatro.metasistemas.

La arquitectura del sistema de búsqueda incluye: un robot de búsqueda que escanea sitios de Internet, un indexador que proporciona una búsqueda rápida y un motor de búsqueda, una interfaz gráfica para el usuario.

El propósito de un motor de búsqueda es encontrar documentos que contengan palabras clave o palabras que de alguna manera estén relacionadas con palabras clave. El motor de búsqueda es mejor cuantos más documentos devuelva que sean relevantes para la consulta del usuario.

Ejemplos de motores de búsqueda

Google- uno de los IPS extranjeros más completos y populares. Una característica distintiva del IRS de Google es la tecnología para determinar el grado de relevancia de un documento mediante el análisis de enlaces de otras fuentes a un recurso determinado. Cuantos más enlaces a una página haya en otras páginas, mayor será su clasificación en el IRS de Google. Google utiliza un algoritmo para calcular la autoridad del PageRank. PageRank es uno de los factores auxiliares a la hora de clasificar sitios en los resultados de búsqueda. PageRank no es la única forma, pero sí muy importante, de determinar la posición de un sitio en los resultados de búsqueda de Google. Google utiliza el indicador PageRank de páginas encontradas mediante consulta para determinar el orden en que estas páginas se presentan al visitante en los resultados de búsqueda. En 2010, la empresa lanzó la búsqueda por voz en Rusia. Para buscar, debe presionar el botón al lado de la línea de búsqueda en su teléfono y decir su consulta, el teléfono enviará su voz al servidor y el navegador mostrará una línea con su consulta reconocida y los resultados de la búsqueda.

yandex Actualmente es el motor de búsqueda nacional más popular. Comenzó a trabajar en 1997. Mantiene su propio catálogo de recursos de Internet. También el mejor buscador para identificar ilustraciones. La versión en inglés incluye un directorio de recursos de Internet. Dispone de un amplio sistema de generación de solicitudes. En particular, se permite ingresar instrucciones de búsqueda en lenguaje natural; en este caso, todas las extensiones necesarias se crean automáticamente.

Además de las páginas web en formato HTML, Yandex indexa documentos en PDF (Adobe Acrobat), formato de texto enriquecido (RTF), Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (blogs y foros) .

Motor de búsqueda mail.ru Comenzó a trabajar en 2007. El volumen del archivo índice en la primavera de 2009 ascendía a más de 1.500 millones de páginas ubicadas en servidores en ruso. Además de buscar textos, el sistema busca ilustraciones y videoclips publicados en servidores rusos especializados "autocompletados": [email protected], Flamber.Ru, 35Photo.ru, PhotoForum.ru, [email protected], RuTube, Loadup, Rambler Vision y similares. Gogo.ru le permite limitar su búsqueda a sitios comerciales, sitios de información, así como foros y blogs. El formulario de Búsqueda avanzada también le permite limitar las búsquedas a tipos de archivos específicos (PDF, DOC, XLS, PPT), la ubicación de las palabras de búsqueda en un documento o un dominio específico. En noviembre de 2013, apareció en Google Play una nueva versión de la aplicación de búsqueda Mail.Ru, que permite pasar de la pantalla principal a cualquier red social y contiene acceso rápido para buscar imágenes, vídeos y noticias. La aplicación de Android se ha convertido en un mini navegador diseñado para buscar eficazmente la información necesaria. La utilidad también aprendió a reconocer consultas de búsqueda especificadas no por texto, sino por voz. Los desarrolladores también señalan que han creado un widget especial que se puede colocar en la pantalla de inicio de un teléfono inteligente o tableta con sistema Android de Google. Se entiende que esto reducirá aún más el tiempo dedicado a la búsqueda.

AltaVista– uno de los motores de búsqueda más antiguos ocupa uno de los primeros lugares en términos de volumen de documentos: más de 350 millones. AltaVista permite búsquedas simples y avanzadas. La "Ayuda" permite incluso a los usuarios no capacitados redactar correctamente consultas simples y complejas.

Excursionista– uno de los primeros sistemas rusos de recuperación de información, inaugurado en 1996. A finales de 2002 se llevó a cabo una modernización radical, tras lo cual Rambler volvió a entrar en el grupo de líderes en búsqueda de redes. Actualmente, el volumen del índice es de unos 150 millones de documentos. Para redactar consultas complejas, se recomienda utilizar el modo "Consulta detallada", que brinda amplias oportunidades para redactar instrucciones de búsqueda utilizando elementos del menú.

APORTE. Hoy, su base de datos contiene más de 20 millones de documentos. El sistema tiene una amplia gama de capacidades de búsqueda. APORT tiene una función de traducción incorporada, que brinda al usuario la oportunidad de formular consultas tanto en ruso como en inglés. Además, APORT tiene modos especiales para buscar ilustraciones y archivos de audio.

La última generación de motores de búsqueda indexa todas las palabras de una página web o de un artículo de una conferencia, mientras que anteriormente el alcance de la indexación se limitaba normalmente al título, los encabezados, las primeras líneas y la dirección del documento. Esto limitó significativamente la capacidad de identificar materiales sobre un tema específico, ya que los resultados de la búsqueda no siempre reflejaban datos reales. Al eliminar esta deficiencia, los motores de búsqueda modernos se han vuelto mucho más fiables que sus predecesores.

La siguiente característica más importante es la mejora del mecanismo de búsqueda interna, expresada en un aumento en el número de operadores y otros elementos de construcción de consultas. Hace unos años sólo se utilizaban dos, o en el mejor de los casos tres operadores booleanos clásicos: AND (y), OR (o) y NOT (not). Ahora hay NEAR en Alta Vista y SEGUIDO POR en OpenText, operadores de distancia extremadamente útiles que le permiten hacer su consulta lo más específica posible. Muchos sistemas le permiten truncar las terminaciones de los términos, limitar la búsqueda por la fecha de creación del documento, buscar palabras clave solo en elementos designados de las páginas web (título, encabezados, dirección de correo electrónico, etc.), así como buscar un frase exacta. Los últimos desarrollos también permiten detectar archivos de un determinado tipo (por ejemplo, gráficos o audio) y son sensibles a letras minúsculas y mayúsculas. La capacidad de buscar datos en cualquier idioma se está volviendo común. Todo esto permite crear una receta de búsqueda con un alto grado de precisión, lo que por supuesto aumenta la relevancia de los resultados obtenidos.

Actualmente, los motores de búsqueda más populares son Google y Yandex, comparémoslos:

    Número de páginas indexadas. Google tiene 8 mil millones y Yandex solo 2 mil millones.

    Es decir, cuatro veces menos. Victoria para Google.

    Relevancia del tema. La relevancia se refiere a la correspondencia de los resultados mostrados en la página del motor de búsqueda con su consulta.

    Diré de inmediato que aquí es difícil determinar el ganador. Google mostró buenos resultados en el segmento extranjero de Internet, pero en Runet Yandex siempre estuvo un poco por delante.

Servicios adicionales de Internet. Aquí la ventaja claramente pertenece a Yandex. Tiene decenas de servicios diferentes, convenientemente agrupados en categorías, mientras que Google tiene menos, además hay integración con la red social Google+, que a muchos no les gusta. En términos generales, podemos decir con seguridad que hoy Internet es un enorme "basurero"

donde podrás encontrar cualquier información, útil o no, no importa lo que sea!!! Pero para buscar información de forma eficaz, se necesitan algunas herramientas. Después de todo, ¡hay millones de sitios entre los cuales un principiante simplemente se pierde! Para clasificar la información según las consultas, existen motores de búsqueda

. Estos son servicios que lo ayudarán a encontrar la información que necesita basándose en una consulta clave en una fracción de segundo. Motores de búsqueda

son los verdaderos portadores de información en Internet. Saben de la existencia de todos los sitios que pueden resultarle útiles.

Para tener una idea general del motor de búsqueda, es necesario utilizarlo durante al menos media hora. Comprenderá inmediatamente las enormes oportunidades que estos mismos motores de búsqueda nos abren. Básicamente, ¿qué es un motor de búsqueda?

Este es un sitio que carga información sobre otros sitios en su base de datos y, si es necesario, nos la proporciona. Por ejemplo, un motor de búsqueda conoce cientos de sitios sobre informática, y si le pedimos que nos proporcione información sobre , en medio segundo encontrará esos sitios en su base de datos y los clasificará por orden de utilidad. El primero en la lista será el sitio que, en su opinión, mejor le informará sobre la instalación de Windows desde una unidad flash. Y así con cualquier solicitud de clave. ¡Ya sea sobre renovaciones, sobre el jardín, sobre animales, etc.! Hoy en día, en la Internet rusa, el motor de búsqueda más popular es yandex Google. Y si hablamos del motor de búsqueda más genial del mundo, este es, por supuesto,

!!! ¡Google es una buena corporación!

La buena visión, el oído, el funcionamiento fiable de todos los sentidos y una percepción objetiva de la realidad determinan en gran medida el uso correcto de la experiencia y el conocimiento acumulados y dan a la intuición la oportunidad de expresarse. Pero la respuesta correcta es el resultado no solo de la pregunta correcta, sino también de la información recopilada correctamente para resolverla (esta es el área del criterio).

¿Qué se entiende brevemente por buscador? historial de búsqueda en internet

En una época en la que las computadoras e Internet eran dominio exclusivo de unos pocos elegidos, se consideraba que la lógica de la biblioteconomía ordinaria era una demanda. ¿Por qué complicar la solución de un problema cuando un catálogo de archivos, datos, soluciones, programas y todo lo que se ha hecho y puede ser útil es suficiente para navegar en el espacio de la información?

¿No deberían los usuarios erigir un monumento? Recordemos que al trabajo de los aficionados a la informática se deben las redes, los catálogos, las oportunidades de comunicación y la acumulación “primaria”:

  • capital de información;
  • los fundamentos de las ideas modernas (se han hundido en el olvido, pero su aparición fugaz formó una perspectiva a largo plazo).

El poder y las capacidades de las computadoras pasaron rápidamente de la esfera informática a la esfera del procesamiento de información. Internet comenzó a conquistar rápidamente nuevos territorios en áreas de aplicación y en la mente de las personas. La biblioteconomía sencilla migró instantáneamente a los sofisticados mecanismos de los motores de búsqueda.

Numerosos ejércitos de buscadores, robots, “arañas” y otros algoritmos comenzaron a escudriñar todo lo que llegaba al espacio de Internet. Quizás fueron ellos quienes dejaron claro qué es un motor de búsqueda, cómo funciona la búsqueda, qué es Internet. Aprendieron a indexar información y llegaron a comprender qué se podía utilizar y cómo se debía utilizar.

Era un antiguo "mundo previo a la información", armas antediluvianas, técnicas primitivas de recolección, como la pesca y la caza en una época en la que la gente apenas comenzaba a representar algo social, socialmente significativo, separado de la naturaleza según el criterio de la racionalidad.

Indexación: no somos esclavos, pero todavía no tenemos nada

La indexación del espacio de información, el método de orientación en la información recopilada y la capacidad de ajustar correctamente lo disponible debido a los cambios detectados en el entorno externo (Internet) se convirtieron en la base de la supervivencia. Esto es habitual y el espacio de Internet ya ha adquirido vida propia y absolutamente real.

Siempre ha habido algo en la historia que se puede recordar, pero siempre surge la pregunta: ¿fue así? ¿Ese “ser” histórico está conectado con personas reales y recuerdos memorables?

Quizás el vecino de la escalera resultó ser el creador de Google o formuló los principios fundamentales de la prosperidad de Yandex. Pero muchos citan 1945 como el punto donde comenzó la idea del hipertexto, y la recuperación automática de texto mágica de Salton es considerada el padre de la tecnología de búsqueda moderna.

Desde entonces ha pasado mucha agua bajo el puente, y la lista de los primeros motores de búsqueda, los primeros algoritmos e ideas antiguas es tan grande que en sí misma es una buena tarea de búsqueda para sistematizar e indexar el pasado.

No es infundado afirmar que la razón de ser de Google como fenómeno y sistema moderno no es sólo una persona real, sus amigos y novias. ¿Por qué no es este un punto completamente diferente en el espacio de información que logró causar la resonancia o asociación deseada?

La conciencia pública agregada es todavía un universo oscuro en el que está muy lejos de su versión de la bombilla de Edison.

Año 1994: ¿qué robot dijo la palabra clave “mamá”?

En el mundo moderno, es difícil creer en el pasado, pero teniendo en cuenta la precisión de las fechas y la participación de personalidades reales, cabe señalar que la aparición de palabras clave aún no es un núcleo semántico.

Lo que a finales del siglo pasado se entendía por motor de búsqueda ya estaba absolutamente claro: se trataba de una docena de motores de búsqueda populares con clasificaciones competitivas en la lucha por el cliente. A algunos les gustó Yahoo, a otros Aport, a otros Rambler, pero al final quedaron Google y Yandex.

Todas estas son palabras, opiniones, preferencias y hechos interesantes. Sin embargo, se formaron monstruos del negocio de la búsqueda, crearon bases fundamentales, establecieron conocimientos objetivos y una sólida experiencia en la comprensión:

  • mecanismos de búsqueda;
  • palabras clave;
  • núcleo semántico.

El hipertexto no sólo despegó, sino que también se convirtió en la base de la programación de Internet y allanó el camino para tecnologías serias relacionadas.

Lo principal: no importa cómo entendamos lo que está sucediendo. Es importante que haya una dirección de movimiento y que sea correcta. Las fluctuaciones del tipo de cambio son normales; sin fluctuaciones, no habría razón para optimizar los criterios. Y el criterio tanto en la pregunta como en la respuesta es lo más importante.

El año 1989: el avivamiento olvidado

La reversión es un mecanismo histórico especial y siempre es un hecho interesante. Las personas, especialmente los científicos y los especialistas calificados, tienden a olvidarse de la esencia de las cosas y a soñar despiertas. El mundo de guerras, gladiadores y terribles batallas es divertido en comparación con las competiciones que se desarrollan en la conciencia pública y privada. Aquí hay un reino de oscuridad, pero debemos seguir adelante, y es imposible sin la victoria a cada paso.

El principio de funcionamiento del motor de búsqueda formó la base del algoritmo. Hay muchas implementaciones reales de los algoritmos. Muy pocos sobrevivieron, pero esto es lo que dividió a toda la comunidad de Internet. La lucha por los ideales en el campo de la búsqueda ya era importante entonces, pero incluso una breve historia del desarrollo de los motores de búsqueda dejó de interesar a los consumidores.

El usuario necesita una respuesta, no los logros de científicos y especialistas. El consumidor quiere saber cómo formular correctamente una pregunta para recibir una respuesta adecuada y estar seguro de que el mecanismo de búsqueda funcionó correctamente y aplicó criterios objetivos.

¿A quién le importa el hecho interesante de que la programación orientada a objetos y las nubes se inventaron en 1989-1991? ¡Absolutamente nadie! Pero hace apenas una docena de años hubo un retroceso: ahora es imposible sin programación orientada a objetos y tecnologías en la nube. Pero la reversión "no avanzó" en la dirección correcta, por lo que no hay una respuesta específica a la pregunta de qué se entiende por motor de búsqueda. No ha aparecido nada nuevo, pero hay algo superfluo.

Definición de buscador y motor de búsqueda.

Cuando aparecieron las calculadoras, la gente pensó que olvidarían las reglas de la suma, la multiplicación y la división. Pasó el tiempo y el miedo se disipó. Las calculadoras están vivas y la gente no ha olvidado cómo realizar operaciones matemáticas sencillas en una columna.

En un momento en el que funcionan Google y Yandex, y hay un pequeño número de motores de búsqueda de buena reputación, existe una opinión: la búsqueda es un algoritmo informático y un motor de búsqueda (la definición de una palabra y su significado) es un software y complejo de hardware con una interfaz web , que brinda la posibilidad de buscar información en Internet.

Resultados del motor de búsqueda

No es difícil imaginar qué se entiende por motor de búsqueda. Hay una cadena de consulta, el visitante escribe una palabra clave, hace clic en el botón "buscar" y obtiene el resultado. Pero los resultados de la búsqueda no son la respuesta y la palabra clave no es la pregunta.

En la vida cotidiana, una persona no utiliza palabras clave y nunca obtiene ningún resultado. Si un niño quiere comer, se lo contará a mamá o a papá. Todo depende de lo que el bebé quiera exactamente: comer o conseguir dinero para un helado. La respuesta de los padres puede ser muda, pero la acción seguirá.

El empleado no se comunicará con el empleador mediante palabras clave; de ​​lo contrario, el resultado será un despido sin palabras.

Todos estos son hechos, pero una persona y un sistema informático son una esfera de relaciones diferente. Siempre que tenga una idea clara de lo que se entiende por motor de búsqueda, no se trata de preguntas, respuestas, criterios, sino palabras clave y los resultados del motor (resultados de búsqueda).

El beneficio real del momento actual.

Pasiones por el SEO, el rápido crecimiento del número de estudios web, el desarrollo de la publicidad, la imposición de ideas, toneladas de spam y basura en los resultados de búsqueda: todo esto es natural y objetivamente normal. Es hora de luchar contra el spam, los piratas informáticos y la negatividad. Esto debe hacerse con cuidado, pero el beneficio real de la situación actual es sólo otra etapa en el desarrollo del negocio de las búsquedas.

Palabras clave: excelente. El núcleo semántico del sitio es excelente. La computadora puede traducir textos a diferentes idiomas y analizar oraciones naturales. El lenguaje SQL se ha convertido en el lenguaje de facto para "comunicarse" con las bases de datos. SQL tiene muchos dialectos y este es un indicador real. ¡El lenguaje artificial se ha vuelto viable! El lenguaje puede proporcionar acceso a enormes cantidades de información sistematizada.

Oracle y otros grandes líderes de bases de datos han pasado décadas presentando información. Google: sobre mecanismos de recopilación e indexación de información. La familia Linux se mantuvo firme, Windows se mantuvo a flote y el número de lenguajes de programación se redujo a un nivel suficiente.

La inteligencia artificial ha entrado en el mundo de los sueños, los desarrolladores y consumidores se han lanzado objetivamente al mundo de la gestión creativa de la información y su uso.

Resultados de la búsqueda: importantes e inútiles

No es tan difícil sistematizar los resultados de búsqueda, pero no han cambiado en los últimos diez años. Esencialmente, cierto. Si la barra de búsqueda contiene una palabra clave y no una pregunta, ¿de qué tipo de respuesta podemos hablar? Todos los motores de búsqueda modernos tienen criterios, son tratados con la debida comprensión, pero ¿por qué limitar al consumidor?

Lo importante es la reacción del usuario ante qué parte de los resultados de búsqueda selecciona. Esta es su opinión sobre los resultados del buscador. Los motores de búsqueda aprecian esto y lo tienen en cuenta no sólo en una solicitud específica, sino también en general.

Tanto el flujo de palabras clave como el flujo SERP contienen información basura. Esta es también una razón para formular criterios. La tarea de búsqueda no puede considerarse como la aplicación de una palabra clave y un algoritmo a la información acumulada, como un refinamiento de la información acumulada.

Acerca de las perspectivas: de la búsqueda a la solución

La mejor solución es no tomar ninguna decisión. Ya sea que los desarrolladores de motores de búsqueda entiendan esto o no, el hecho es que lo que es un motor de búsqueda, los desarrolladores lo saben en el contexto de una respuesta a una palabra clave, como un índice en el contexto de la recuperación de información a partir de datos ya disponibles y sistematizados.

El propio consumidor elegirá entre los resultados de la búsqueda lo que considere necesario y tomará una decisión. El motor de búsqueda lo tendrá en cuenta y lo recordará. Cómo utilizará una persona la información recibida será la siguiente palabra clave.

Así es como un motor de búsqueda aprende a tomar decisiones y una persona aprende a formular preguntas. Por ahora, estas son palabras clave y el resultado de la respuesta son los resultados de búsqueda. Pero la cantidad siempre se convierte en calidad.

¿Qué son los motores de búsqueda de Internet? Una realidad basada en el avance. No hay muchos problemas prácticos que requieran inteligencia de los sistemas informáticos. En la mayoría de los casos, basta con que respondan adecuadamente a las preguntas planteadas correctamente.

¡Hola queridos lectores! Ekaterina Kalmykova está contigo. El artículo de hoy estará dedicado al concepto de motor de búsqueda, qué es y para qué sirve. También consideraremos en detalle los tipos de motores de búsqueda en Internet.

Si tiene una pregunta: "¿Por qué necesito saber acerca de estos motores de búsqueda?", Le responderé de esta manera. Cuando comes una deliciosa sopa en un restaurante, ¿te gustaría saber con qué ingredientes está hecha para poder recrearla tú mismo en casa? Después de todo, si está satisfecho con el resultado final, es decir, el sabor de la sopa, probablemente le interese saber qué llevó a este resultado.

Lo mismo puede decirse de trabajar con un motor de búsqueda (SE). Si crea su propio blog en el futuro y, sabiendo cómo funciona el PS, no tendrá que recurrir a especialistas en busca de ayuda. Podrás gestionar tu proyecto de forma independiente de tal forma que el motor de búsqueda pueda verlo y mostrarlo a otros usuarios. Después de todo, el tráfico a su recurso dependerá de esto y, en consecuencia, sus ganancias.

Así que comencemos.

¿Qué es un motor de búsqueda?

Un motor de búsqueda es un recurso especial en Internet que proporciona información al usuario de acuerdo con su solicitud. Es decir, este recurso recopila todos los datos de la red global, todos los proyectos web, y cuando se recibe una solicitud específica de un usuario, proporciona la información necesaria buscada dirigiéndolo, por ejemplo, a un blog o sitio web temático.

Así, después de crear tu proyecto, tu tarea será ingresar a los resultados de búsqueda, es decir, a la “lista” o base de datos del motor de búsqueda. Dado que la promoción de un sitio web en Internet simplemente no es posible sin utilizar algún tipo de motor de búsqueda, deberá cuidar la calidad de su recurso, su optimización interna y externa. Discutiremos cómo hacer esto en los siguientes artículos. Así que no te lo pierdas.

Mientras tanto, si decides crear tu propio blog, te recomiendo leer estos artículos:

Dado que casi todos los días aparecen nuevos recursos web, la base de datos del motor de búsqueda debe actualizarse constantemente. Cada sitio recién creado debe ser indexado por un robot. En palabras simples, los asistentes de los motores de búsqueda (robots) deben familiarizarse con el nuevo recurso y transferir estos datos al propio motor de búsqueda.

Bueno, aquí probablemente habrás adivinado que cuando un robot visita tu blog, todo le debería gustar. Tu destino futuro dependerá de este invitado.

Te contaré cómo hacer que el robot esté completamente encantado con tu proyecto en uno de los siguientes artículos. No te lo pierdas, habrá información interesante y muy interesante que compartiré contigo.

Los motores de búsqueda funcionan.

Todo el trabajo relacionado con el PS comienza ingresando la consulta deseada en la barra de búsqueda. ¿Qué pueden buscar los usuarios? Sí, cualquier cosa, desde una receta de empanadas con repollo hasta la eterna pregunta “cómo ganar más dinero sin hacer nada”.

Para que su recurso sea la respuesta a la pregunta, debe estar por delante de sus competidores. Para hacer esto, debe prestar especial atención a la promoción de su proyecto, que incluye actividades como escribir contenido optimizado de alta calidad, es decir, responder a las solicitudes del artículo, mejorar el factor de comportamiento, es decir, hacerlo interesante para que su lector esté en el recurso, mejorando la usabilidad, es decir, la comodidad del visitante y muchos otros factores. Todos aprenderemos a hacer esto contigo.

Componentes del motor de búsqueda

¿Y qué ayuda a los motores de búsqueda, por ejemplo, Google, a indexar su recurso?

  1. Los agentes son trabajadores que hacen la mayor parte del trabajo: indexar y analizar sitios.
  2. Las arañas son un programa que puede descargar páginas de un recurso web y recopilar información general sobre él.
  3. Crawlers (rastreador): un programa que busca todos los enlaces de las páginas y luego busca nuevos datos que los motores de búsqueda no conocen.
  4. Indexador: analiza texto, títulos, estilo, etc.
  5. Robots: indexe sus páginas de contenido y también estudie varios enlaces.

Para que la indexación se realice de la manera que necesita, debe crear un documento especial "robots.txt". Permite que el sistema revise solo aquellas páginas que necesita y elimine las que no debería ver.

Tipos de motores de búsqueda

Existen varias opciones para los sistemas de búsqueda de información:

  • Catálogos. Una comparación de búsqueda simple es una estantería en una biblioteca. Todo se almacena allí en subcategorías y categorías de temas específicos. Si se encuentra en un motor de búsqueda de este tipo, créame, la información que encuentre allí será más que útil y comprensible para su percepción. ¿Puedes adivinar de qué sitio común estamos hablando? Por supuesto, sobre Wikipedia, que ha recopilado todo un directorio de información útil.
  • Índices de búsqueda. La búsqueda de datos se realiza mediante frases clave. Esto es conveniente e inconveniente al mismo tiempo. Creo que me entenderán aquellas personas que buscan, por ejemplo, “Una chica muestra su clase”, y encuentran como una chica muestra el pulgar hacia arriba, pero en la búsqueda sale algo no muy decente. 🙂 Este tipo de búsqueda caracteriza a la mayoría de los buscadores.
  • Sistemas de calificación. Determinan su popularidad en función del número de visitas. Por supuesto, este no es el mejor criterio, ya que no siempre se tiene en cuenta la utilidad y calidad del recurso en sí. Un ejemplo de un sistema de este tipo es el recurso de Internet alexa.com.

Los servidores de búsqueda también se dividen en generales y especializados. Los motores de búsqueda generales clasifican los datos de información sin realizar ninguna selección en todos los recursos web que conocen. Estos incluyen Yandex, Rambler, Google. Especializado: ordenar por idioma utilizado.

Los motores de búsqueda también se pueden dividir en distribución regional y global.

Hoy en día, todos los motores de búsqueda mejoran constantemente sus algoritmos para seleccionar recursos relevantes y de alta calidad.

un poco de historia

PS apareció en RuNet en 1996: estos son Aport y Rambler. Un año después, en 1997, se formó Yandex y un año después, en 1998, apareció otro competidor: Google. Actualmente los más populares son Yandex y Google.

¿Qué motores de búsqueda son los más populares ahora?

Aquí están las estadísticas:

Como puede ver, Yandex es ahora el más popular en Rusia, junto con Google y Mail.

De esta manera, podrás ver las búsquedas principales en las que debes centrarte al crear y promocionar tu proyecto.

Motor de búsqueda Yandex

El principio de funcionamiento es el siguiente: ingrese la consulta deseada en la barra de búsqueda, haga clic en "Buscar" y observe los resultados. Yandex ha seleccionado 13 millones de respuestas a su solicitud. También puedes buscar en imágenes, vídeos y en el mercado (ver la columna de la izquierda).

Además, puede configurar la región de búsqueda. Para hacer esto, haga clic en el ícono al lado de la cruz en la barra de búsqueda y seleccione la región deseada en la ventana de filtro.

motor de búsqueda de google

Google funciona de manera similar a Yandex. Puedes buscar información en diferentes secciones: imágenes, vídeos, noticias, mapas, etc.

Si haces clic en “Herramientas de búsqueda”, se abrirá un panel de configuración donde podrás seleccionar la región, el idioma y por cuánto tiempo buscar información.

Ahora sabe qué motores de búsqueda existen en Internet, también ha visto los más populares y ahora, armado con información, puede establecer sus conexiones e interacción con los motores de búsqueda.

Eso es todo por hoy. ¿Te gusta el artículo?

Adiós a todos.

Te aconsejo que actualices tu blog para no perderte las últimas novedades.

Ekaterina Kalmykova

Un sistema de búsqueda es un complejo de software y hardware diseñado para buscar en Internet y responder a una solicitud de usuario, especificada en forma de frase de texto (consulta de búsqueda), generando una lista de enlaces a fuentes de información, en orden de relevancia ( de acuerdo con la solicitud). Los mayores motores de búsqueda internacionales: "Google", "Yahoo", "MSN". En la Internet rusa es: "yandex", "Excursionista", "Aporto".

Describamos las principales características de los motores de búsqueda:

    Lo completo

La integridad es una de las principales características de un sistema de búsqueda, que es la relación entre el número de documentos encontrados mediante solicitud y el número total de documentos en Internet que satisfacen la solicitud determinada. Por ejemplo, si hay 100 páginas en Internet que contienen la frase "cómo elegir un automóvil" y solo se encontraron 60 de ellas para la consulta correspondiente, entonces la integridad de la búsqueda será 0,6. Evidentemente, cuanto más completa sea la búsqueda, menos probable será que el usuario no encuentre el documento que necesita, siempre que exista en Internet.

    Exactitud

La precisión es otra característica principal de un motor de búsqueda, que está determinada por el grado en que los documentos encontrados coinciden con la consulta del usuario. Por ejemplo, si la consulta "cómo elegir un automóvil" contiene 100 documentos, 50 de ellos contienen la frase "cómo elegir un automóvil" y el resto simplemente contiene estas palabras ("cómo elegir la radio adecuada e instalarla en un coche”), entonces la precisión de la búsqueda se considera igual a 50/100 (=0,5). Cuanto más precisa sea la búsqueda, más rápido el usuario encontrará los documentos que necesita, menos tipos diferentes de "basura" se encontrarán entre ellos y menos frecuentemente los documentos encontrados no corresponderán a la solicitud.

    Pertinencia

La relevancia es un componente igualmente importante de la búsqueda, que se caracteriza por el tiempo que transcurre desde el momento en que los documentos se publican en Internet hasta que se ingresan en la base de datos del índice del motor de búsqueda. Por ejemplo, al día siguiente de que aparecieran noticias interesantes, una gran cantidad de usuarios recurrieron a los motores de búsqueda con consultas relevantes. Objetivamente, ha pasado menos de un día desde la publicación de noticias sobre este tema, pero los principales documentos ya están indexados y disponibles para su búsqueda, gracias a la existencia de la llamada “base de datos rápida” de los grandes buscadores, que se actualiza varias veces al día.

    Velocidad de búsqueda

La velocidad de búsqueda está estrechamente relacionada con su resistencia a la carga. Por ejemplo, según Rambler Internet Holding LLC, hoy durante el horario comercial el motor de búsqueda Rambler recibe alrededor de 60 solicitudes por segundo. Esta carga de trabajo requiere reducir el tiempo de procesamiento de una solicitud individual. Aquí coinciden los intereses del usuario y del motor de búsqueda: el visitante quiere obtener resultados lo más rápido posible, y el motor de búsqueda debe procesar la solicitud lo más rápido posible, para no ralentizar el cálculo de consultas posteriores.

    Visibilidad

La presentación visual de los resultados es un componente importante de una búsqueda cómoda. Para la mayoría de las consultas, el motor de búsqueda encuentra cientos o incluso miles de documentos. Debido a consultas poco claras o búsquedas inexactas, ni siquiera las primeras páginas de resultados de búsqueda contienen siempre sólo la información necesaria. Esto significa que el usuario a menudo tiene que hacer su propia búsqueda dentro de la lista encontrada. Varios elementos de la página de resultados del motor de búsqueda le ayudan a navegar por los resultados de la búsqueda. Puede encontrar explicaciones detalladas de la página de resultados de la búsqueda, por ejemplo para Yandex, en el enlace. http://help.yandex.ru/search/?id=481937.

4. Breve historia del desarrollo de los motores de búsqueda.

En el período inicial de desarrollo de Internet, el número de usuarios era pequeño y la cantidad de información disponible era relativamente pequeña. En su mayor parte, sólo el personal de investigación tenía acceso a Internet. En ese momento, la tarea de buscar información en Internet no era tan urgente como lo es ahora.

Una de las primeras formas de organizar el acceso a los recursos de información de la red fue la creación de directorios abiertos de sitios, cuyos enlaces a recursos se agrupaban según el tema. El primer proyecto de este tipo fue el sitio web Yahoo.com, que se inauguró en la primavera de 1994. Después de que la cantidad de sitios en el directorio de Yahoo aumentó significativamente, se agregó la capacidad de buscar la información necesaria en el directorio. En sentido pleno, todavía no era un motor de búsqueda, ya que el área de búsqueda se limitaba únicamente a los recursos presentes en el catálogo y no a todos los recursos de Internet.

Los directorios de enlaces se utilizaban ampliamente en el pasado, pero hoy en día han perdido casi por completo su popularidad. Dado que incluso los catálogos modernos, de gran volumen, contienen información sólo sobre una parte insignificante de Internet. El directorio más grande de la red DMOZ (también llamado Open Directory Project) contiene información sobre 5 millones de recursos, mientras que la base de datos del motor de búsqueda Google consta de más de 8 mil millones de documentos.

El primer motor de búsqueda completo fue el proyecto WebCrawler, publicado en 1994.

En 1995 aparecieron los motores de búsqueda Lycos y AltaVista. Este último es líder en el campo de la búsqueda de información en Internet desde hace muchos años.

En 1997, Sergey Brin y Larry Page crearon el motor de búsqueda Google como parte de un proyecto de investigación en la Universidad de Stanford. ¡Google es actualmente el motor de búsqueda más popular del mundo!

En septiembre de 1997, se anunció oficialmente el motor de búsqueda Yandex, que es el más popular en Internet en idioma ruso.

Actualmente, existen tres principales motores de búsqueda internacionales: Google, Yahoo y MSN, que tienen sus propias bases de datos y algoritmos de búsqueda. La mayoría de los demás motores de búsqueda (de los cuales hay un gran número) utilizan de una forma u otra los resultados de los tres enumerados. Por ejemplo, la búsqueda de AOL (search.aol.com) utiliza la base de datos de Google, mientras que AltaVista, Lycos y AllTheWeb utilizan la base de datos de Yahoo.

5. Composición y principios de funcionamiento del sistema de búsqueda.

En Rusia, el principal motor de búsqueda es Yandex, seguido de Rambler.ru, Google.ru, Aport.ru, Mail.ru. Además, actualmente Mail.ru utiliza el motor de búsqueda y la base de datos Yandex.

Casi todos los principales motores de búsqueda tienen su propia estructura, diferente de los demás. Sin embargo, es posible identificar los principales componentes comunes a todos los motores de búsqueda. Las diferencias en la estructura sólo pueden estar en la forma de implementación de los mecanismos de interacción de estos componentes.

Módulo de indexación

El módulo de indexación consta de tres programas auxiliares (robots):

Spider es un programa diseñado para descargar páginas web. La araña descarga la página y recupera todos los enlaces internos de esa página. Se descarga el código html de cada página. Los robots utilizan protocolos HTTP para descargar páginas. La araña funciona de la siguiente manera. El robot envía la solicitud "obtener/ruta/documento" y algunos otros comandos de solicitud HTTP al servidor. En respuesta, el robot recibe un flujo de texto que contiene información del servicio y el propio documento.

    URL de la página

    fecha en que se descargó la página

    Encabezado http de respuesta del servidor

    cuerpo de la página (código html)

Crawler (araña “viajante”) es un programa que sigue automáticamente todos los enlaces que se encuentran en la página. Selecciona todos los enlaces presentes en la página. Su trabajo es determinar dónde debe ir la araña a continuación, basándose en enlaces o en una lista predeterminada de direcciones. El rastreador, siguiendo los enlaces encontrados, busca nuevos documentos que aún son desconocidos para el motor de búsqueda.

Indexer (robot indexador) es un programa que analiza las páginas web descargadas por las arañas. El indexador analiza la página en sus componentes y los analiza utilizando sus propios algoritmos léxicos y morfológicos. Se analizan varios elementos de la página, como texto, encabezados, enlaces, características estructurales y de estilo, etiquetas HTML de servicios especiales, etc.

Por lo tanto, el módulo de indexación le permite rastrear un conjunto determinado de recursos utilizando enlaces, descargar páginas encontradas, extraer enlaces a páginas nuevas de los documentos recibidos y realizar un análisis completo de estos documentos.

Base de datos

Una base de datos, o índice de motor de búsqueda, es un sistema de almacenamiento de datos, una matriz de información en la que se almacenan parámetros especialmente convertidos de todos los documentos descargados y procesados ​​por el módulo de indexación.

Servidor de búsqueda

El servidor de búsqueda es el elemento más importante de todo el sistema, ya que la calidad y velocidad de la búsqueda dependen directamente de los algoritmos que subyacen a su funcionamiento.

El servidor de búsqueda funciona de la siguiente manera:

    La solicitud recibida del usuario es sometida a análisis morfológico. Se genera el entorno de información de cada documento contenido en la base de datos (que posteriormente se mostrará en forma de snippet, es decir, información de texto correspondiente a la solicitud en la página de resultados de la búsqueda).

    Los datos recibidos se pasan como parámetros de entrada a un módulo de clasificación especial.

    Los datos se procesan para todos los documentos, como resultado de lo cual cada documento tiene su propia calificación que caracteriza la relevancia de la consulta ingresada por el usuario y los distintos componentes de este documento almacenados en el índice del motor de búsqueda.

    Dependiendo de la elección del usuario, esta calificación se puede ajustar mediante condiciones adicionales (por ejemplo, la llamada “búsqueda avanzada”).

    A continuación, se genera un fragmento, es decir, para cada documento encontrado, se extraen de la tabla de documentos el título, un breve resumen que mejor se adapta a la consulta y un enlace al documento en sí, y se resaltan las palabras encontradas.

Los resultados de búsqueda resultantes se transmiten al usuario en forma de SERP (página de resultados del motor de búsqueda), una página de resultados de búsqueda.

Como puede ver, todos estos componentes están estrechamente relacionados entre sí y trabajan en interacción, formando un mecanismo claro y bastante complejo para el funcionamiento del sistema de búsqueda, que requiere enormes cantidades de recursos.

Ningún motor de búsqueda cubre todos los recursos de Internet.

Cada motor de búsqueda recopila información sobre los recursos de Internet utilizando sus propios métodos únicos y forma su propia base de datos actualizada periódicamente. El acceso a esta base de datos se concede al usuario.

    Los motores de búsqueda implementan dos formas de buscar un recurso: Buscar por tema catálogos - información

    se presenta en forma de estructura jerárquica. En el nivel superior hay categorías generales (“Internet”, “Negocios”, “Arte”, “Educación”, etc.), en el siguiente nivel las categorías se dividen en secciones, etc. El nivel más bajo son los enlaces a páginas web específicas u otros recursos de información. Búsqueda de palabras clave (búsqueda de índice o búsqueda detallada): el usuario envía al motor de búsqueda pedido , que consta de palabras clave. Sistema al usuario una lista de recursos encontrados a pedido.

La mayoría de los motores de búsqueda combinan ambos métodos de búsqueda.

Los motores de búsqueda pueden ser locales, globales, regionales y especializados.

En la parte rusa de Internet (Runet), los motores de búsqueda de propósito general más populares son Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www. google.ru).

La mayoría de los motores de búsquedaimplementado en forma de portales.

Portal (del inglés.portal- entrada principal, portón) es un sitio web que integra diversos servicios de Internet: herramientas de búsqueda, correo, noticias, diccionarios, etc.

Los portales pueden ser especializados (como,www. museo. ru) y general (por ejemplo,www. kilómetros. ru).

Buscar por palabras clave

El conjunto de palabras clave utilizadas para la búsqueda también se denomina criterio de búsqueda o tema de búsqueda.

Una solicitud puede consistir en una palabra o una combinación de palabras combinadas por operadores: símbolos mediante los cuales el sistema determina qué acción debe realizar. Por ejemplo: la solicitud "Moscú San Petersburgo" contiene el operador AND (así se percibe un espacio), lo que indica que se deben buscar documentos que contengan ambas palabras: Moscú y San Petersburgo.

Para que la búsqueda sea relevante (del inglés relevante - relevante, relevante), se deben tener en cuenta varias reglas generales:

    Independientemente de la forma en que se utilice la palabra en la consulta, la búsqueda tiene en cuenta todas las formas de las palabras de acuerdo con las reglas del idioma ruso.

    Por ejemplo, la consulta “ticket” también encontrará las palabras “ticket”, “ticket”, etc.

    Las letras mayúsculas sólo deben usarse en nombres propios para evitar ver referencias innecesarias. A petición de los "herreros", por ejemplo, se encontrarán documentos que hablan tanto de los herreros como de los Kuznetsov.

    Es recomendable limitar la búsqueda utilizando algunas palabras clave.

Si la dirección requerida no se encuentra entre las primeras veinte direcciones encontradas, deberá cambiar la solicitud.

Cada motor de búsqueda utiliza su propio lenguaje de consulta. Para familiarizarse con él, utilice la ayuda integrada del motor de búsqueda.

Los sitios grandes pueden tener sistemas de recuperación de información integrados en sus páginas web.

Las consultas en dichos sistemas de búsqueda, por regla general, se crean de acuerdo con las mismas reglas que en los motores de búsqueda globales; sin embargo, estar familiarizado con la ayuda aquí no será superfluo.

Búsqueda avanzada Las consultas en dichos sistemas de búsqueda, por regla general, se crean de acuerdo con las mismas reglas que en los motores de búsqueda globales; sin embargo, estar familiarizado con la ayuda aquí no será superfluo. permite editar los parámetros de búsqueda, especificar parámetros adicionales y seleccionar la forma más conveniente para mostrar los resultados de la búsqueda. A continuación se describen los parámetros que se pueden especificar durante una búsqueda avanzada en los sistemas Yanex y Rambler.

Descripción del parámetro

Nombre en Yandex

Nombre enExcursionista

Dónde buscar palabras clave (título del documento, cuerpo del texto, etc.)

Filtro de diccionario

Buscar por texto...

Qué palabras deberían o no estar presentes en el documento y qué tan precisa debe ser la coincidencia

Filtro de diccionario

Buscar palabras de consulta... Excluir documentos que contengan las siguientes palabras...

¿A qué distancia deben ubicarse las palabras clave?

Filtro de diccionario

Distancia entre palabras de consulta...

Restricción en la fecha del documento.

Fecha del documento...

Limite su búsqueda a uno o más sitios

Sitio/Arriba

Busque documentos sólo en los siguientes sitios...

Limitar la búsqueda por idioma del documento

Idioma del documento...

Busque documentos que contengan una imagen con un nombre o firma específicos

Imagen

Encontrar páginas que contengan objetos

Objetos especiales

Formulario de presentación de resultados de búsqueda

Formato de emisión

Mostrando resultados de búsqueda

Algunos motores de búsqueda (por ejemplo, Yandex) le permiten ingresar consultas en lenguaje natural. Escribe lo que necesita encontrar (por ejemplo: pedir billetes de tren de Moscú a San Petersburgo). El sistema analiza la solicitud y produce el resultado. Si no está satisfecho con él, cambie al idioma de consulta.




Arriba