Motor de cerca

De la Viquipèdia, l'enciclopèdia lliure.
Saltar a la navegació Saltar a la cerca

Com a part de la tecnologia d' Internet , un motor de cerca (en anglès search engine) és un sistema automatitzat que, a petició, analitza un conjunt de dades (sovint recopilades per ell mateix) i retorna un índex de contingut disponible [1] classificant-se automàticament segons sobre fórmules estadístic-matemàtiques que indiquen el grau de rellevància donada una clau de cerca específica. Un dels camps en què els motors de cerca troben un major ús és el de la recuperació d’ informació i el web . Els motors de cerca més utilitzats el 2017 van ser: Google , Bing , Baidu , Qwant , Yandex , Ecosia , DuckDuckGo .

Descripció

Logotip de Google , el motor de cerca més utilitzat al món

Conceptualment, un motor de cerca és un sistema molt similar a una aplicació web o un sistema client - servidor , a través d' Internet , on el client està representat pel navegador web de l'usuari que, a petició d'aquest, es connecta a un servidor que al seu torn realitza una consulta de cerca, mitjançant algoritmes de cerca adequats, en bases de dades ( bases de dades distribuïdes ). En l'anàlisi dels resultats proporcionats, un component essencial és l'anomenat rastrejador o aranya. Un bon motor de cerca és el que aconsegueix trobar el major nombre de continguts d'acord amb el tipus de sol·licitud, ordenant-los per importància i rellevància segons l'especificació de cerca.

Fases operatives

El treball dels motors de cerca es divideix principalment en tres fases:

  • anàlisi del camp d’acció (mitjançant l’ús de rastrejadors específics);
  • catalogació del material obtingut;
  • resposta a les sol·licituds dels usuaris.

Catalogació

Després de l'anàlisi de les pàgines, segons criteris que varien d'un motor a un altre, algunes d'elles s'insereixen a la base de dades i a l'índex del motor de cerca.

A continuació, s’analitzarà la part textual emmagatzemada durant la fase d’anàlisi per proporcionar respostes a les cerques dels usuaris. Molts motors de cerca web també ofereixen una còpia de les dades textuals de cada pàgina emmagatzemada quan no es pugui accedir al recurs original: aquesta funció s’anomena emmagatzematge en memòria cau .

Respon

Respondre a les sol·licituds dels usuaris implica la necessitat d’enumerar els llocs per ordre de rellevància respecte a la sol·licitud rebuda.

Per establir la rellevància d’un lloc, es busquen a la base de dades els documents que contenen la paraula clau introduïda per l’usuari, després dels quals cada motor de cerca utilitza els seus propis algoritmes per classificar les pàgines, comprovant, per exemple, quantes vegades es repeteixen les paraules clau, molts enllaços reben aquest document, en quins punts de la pàgina es col·loquen les paraules clau, quants llocs de la base de dades contenen enllaços a aquesta pàgina o quantes vegades un usuari ha visitat aquest lloc després d'una cerca.

Refinament de la investigació

La possibilitat de perfeccionar la cerca varia d'un motor a un altre, però la majoria d'ells us permeten utilitzar operadors booleans : per exemple, podeu cercar " Ganimedes I satèl·lit NO cupaire " per buscar informació sobre Ganimedes pensada com a planeta i no com a una figura mitològica .

A Google i als motors més moderns és possible afinar la cerca segons l’idioma del document, les paraules o frases presents o absents, el format de fitxer ( Microsoft Word , PDF , PostScript , etc.), segons la data. de la darrera actualització i molt més. També podeu cercar contingut en un lloc concret, per exemple, " Ganymede site: nasa.gov " cercarà informació sobre Ganymede al lloc de la NASA .

A Exalead hi ha una part especial per refinar la cerca de manera més intuïtiva.

Indexació

Icona de la lupa mgx2.svg El mateix tema en detall: indexació (motors de cerca) .

La indexació fa referència a la inserció d’un lloc web a la base de dades d’un motor de cerca. La indexació d’un lloc web, és a dir, és la forma en què el lloc és adquirit i interpretat pels motors de cerca i, per tant, apareix a les seves pàgines de resposta a les consultes dels usuaris del web.

Posicionament

Icona de la lupa mgx2.svg El mateix tema en detall: Posicionament (motors de cerca) .

El terme posicionament significa l’adquisició de visibilitat entre els resultats dels motors de cerca. Més concretament, és l’operació mitjançant la qual s’optimitza el lloc perquè aparegui als resultats en una posició el més favorable i rellevant possible.

Optimització

Icona de la lupa mgx2.svg El mateix tema en detall: Optimització (motors de cerca) .

El terme optimització de motors de cerca significa, en l’idioma d’Internet, totes aquelles activitats destinades a millorar la visibilitat d’un lloc web als motors de cerca (com ara Google, Yahoo!, Etc.) per tal de millorar (o mantenir) posicionament a les pàgines de resposta a les consultes dels usuaris del web. Al seu torn, el bon posicionament d’un lloc web a les pàgines de resposta dels motors de cerca és funcional per a la visibilitat dels productes / serveis venuts.

Resultats patrocinats

Els motors de cerca també proporcionen resultats patrocinats, és a dir, es mostren de manera més destacada als llocs web de SERPs ( Search Engine Result Pages ) d’empreses que paguen per estar entre els millors resultats a l’hora de cercar termes (anomenats paraules clau. ) Relacionats amb l’àrea de Competència de la pròpia empresa. Els resultats patrocinats del motor també poden aparèixer als llocs que participen al seu programa d'afiliació. En particular, Google permet que els resultats de pagament comprats amb el programa AdWords apareguin a les seves pàgines de resultats (clarament diferents dels resultats "naturals"). A més, també ofereix un servei de patrocini que atén tots els llocs que tenen determinats requisits, anomenat AdSense. Google AdSense (sovint abreujat com a Google AS) utilitza la capacitat del motor de cerca per interpretar el tema de la pàgina on es col·loca el codi adequat per publicar anuncis temàtics. Yahoo! Search ha anunciat l'arribada d'un programa similar anomenat Panamà.

Motors de cerca populars

Logotip de Yahoo
Logotip de Bing
Logotip de Baidu
Logotip de Ask.com
Logotip d’ Ecosia

Els motors de cerca amb més rellevància internacional el 2020 són:

  • Google , a més de ser el més utilitzat directament, també és el que té un major nombre de llocs que utilitzen la base de dades , també a causa del programa de patrocini "AdSense per a cerques" que pertany al programa AdSense més gran.
  • Microsoft Bing , motor creat per Microsoft i utilitzat per Microsoft Network, més conegut com MSN .
  • Baidu , un motor de cerca xinès que recopila una base d’usuaris tan extensa com creixent, atesa la potència aclaparadora total sobre els altres motors de cerca utilitzats a la Xina .
  • Yandex , el motor amb més quota de mercat a Rússia .

Aquests 4 motors de cerca estan equipats amb tecnologia pròpia.

Altres mencions importants són:

  • Qwant , un motor de cerca europeu que pretén oferir a l’usuari una major privadesa.
  • DuckDuckGo , motor de cerca adequat per a la privadesa.
  • Ecosia , un motor de cerca ecològic alemany, produeix menys diòxid de carboni que els servidors de la competència; El 80% dels ingressos s’utilitzen per plantar arbres a tot el món i reduir la deforestació , i es va fundar en col·laboració amb el WWF .
  • Startpage , un dels pocs motors de cerca del món que garanteix la privadesa , ja que no emmagatzema ni registra les adreces IP dels que fan cerques.
  • Yahoo! , ara totalment basat en la tecnologia Bing.
  • Ask.com

Entre aquests últims, els únics que estan parcialment equipats amb un índex propietari són Qwant i en part DuckDuckGo

A Itàlia

Logotip de Qwant
Logotip de Yandex
Logotip de Virgilio.it
  • Google també l’utilitzen Libero , Virgilio i Tiscali (que qualsevol persona pot verificar immediatament). A Itàlia, la bretxa entre l’ús de Google i els altres és tan gran que, tot i que les dades són òbviament variables, el percentatge de cerques realitzades a Google és igual a un múltiple de la suma de tots els altres motors de cerca units.
  • Istella Italia és un motor de cerca desenvolupat per Tiscali però, fins i tot si s’hi pot accedir, no s’ha actualitzat des del 2016

Llista

Curs Motor Esdeveniment Motor Estat actual
1993 Suïssa Catàleg W3 Llançament Ociós
1993 Suïssa Aliweb Llançament Ociós
Escòcia JumpStation Llançament Ociós
Estats Units WWW Worm Llançament Ociós
1994 Estats Units WebCrawler Llançament Bing Actiu
Estats Units Go.com Llançament Ociós
Estats Units Infoseek Llançament Ociós
Estats Units Lycos Llançament Bing Actiu
Itàlia Spenki Fundació Ociós
1995 Estats Units AltaVista Llançament Inactiu, redirigit a Yahoo!
Corea del Sud Daum Llançament Actiu
Estats Units Magallanes Llançament Ociós
Estats Units Emocionar Llançament Inactiu, només per a notícies
Portugal HO SÉ Llançament Inactiu, només per a notícies
Estats Units Yahoo! Llançament Inactiu (es va convertir en Yahoo! Search)
1996 Estats Units Gosseta Llançament Agregador Actiu
Estats Units Inktomi Fundació Inactiu, adquirit per Yahoo!
Estats Units HotBot Fundació Actiu
Itàlia Arianna Fundació Inactiu, incorporat a Libero
Itàlia Multisoft Fundació Ociós
Itàlia Virgili Fundació Actiu, resultats de Google
Estats Units Pregunta a Jeeves Fundació Inactiu (canviat amb el nom de ask.com)
1997 Estats Units Llum del Nord Llançament Ociós
Rússia Yandex Llançament Propietari Actiu
1998 Estats Units Google Llançament Propietari Actiu
Europa Països Baixos Ixquick Llançament Agregador També actiu com a pàgina d' inici
Estats Units Cerca MSN Llançament Inactiu, converteix-te en Bing
Corea del Sud empas Llançament Inactiu (combinat amb NATE)
1999 Noruega Alltheweb Llançament Inactiu (URL redirigit a Yahoo! )
Canadà GenieKnows Llançament Ociós
Corea del Sud Naver Llançament Actiu
Estats Units Theoma Fundació Pregunta Actiu
Estats Units Vivíssim Fundació Inactiu, IMB
Itàlia superEva Llançament Inactiu, només anàlisi de tendències
2000 Xina Baidu Fundació Propietari Actiu
França Exalead Llançament Propietari Actiu
Estats Units Gigablast Llançament Propietari Actiu
2001 França Kartoo Llançament Ociós
2003 Anglaterra Info.com Llançament Bing Actiu
Scroogle Llançament Ociós
2004 Estats Units Yahoo! Cerca Llançament final Bing Actiu
Estats Units A9.com Llançament Ociós
Xina Sogou Llançament Actiu
2005 Estats Units Windows Live Search Llançament final Ociós
Estats Units Bona cerca Llançament Ociós
Estats Units SearchMe Llançament Ociós
2006 Xina Més o menys Llançament Actiu
França Unió Europea Quaero Fundació Ociós
Estats Units Cerca.com Fundació Propietari Actiu (només cerca CBS)
Estats Units Ask.com Llançament Actiu
Estats Units Windows Live Search Llançament Ociós
Estats Units ChaCha Llançament beta Ociós
Índia Guruji.com Llançament beta Ociós
2007 Estats Units Wikiseek Llançament Ociós
Estats Units Sproose Llançament Ociós
Estats Units Cerca de Wikia Llançament Ociós
2008 Estats Units Cuil Llançament Ociós
Estats Units Conjunt de potència Llançament Ociós
Rússia Picollator Llançament Ociós
Estats Units Viewzi Llançament Ociós
Anglaterra Boogami Llançament Ociós
Estats Units LeapFish Llançament Ociós
Alemanya Forestle Llançament Ociós
Austràlia Ecocho Llançament Ociós
Estats Units DuckDuckGo Llançament Bing + Algorismes propietaris Actiu
2009 Anglaterra Wolfram Alpha Llançament Propietari Actiu
Estats Units Bing Llançament Propietari Actiu
Estats Units Yebol Llançament Ociós
Estats Units Mugurdy Llançament Ociós
Estats Units Scout (Goby) Llançament Ociós
Estats Units Coozila! Llançament Ociós
Alemanya Ecosia Llançament Bing + Algorismes propietaris Actiu
Corea del Sud NATE Llançament Actiu
2010 Estats Units iAlgae Llançament Actiu
Estats Units Blekko Llançament Inactiu (venut a IBM)
Estats Units Cuil Llançament Ociós
Rússia Yandex (versió

en anglès)

Llançament Actiu
2011 Estats Units Ja Llançament Inactiu (programari allotjat a si mateix)
2012 Itàlia Volunia Llançament Ociós
Itàlia Idea Llançament Ociós
2013 Itàlia Istella Llançament Propietari Arribable, inactiu
Europa França Qwant Llançament Bing + Algorismes propietaris Actiu
Estats Units Aoohe Llançament Ociós
Vietnam Coc Coc Llançament Actiu
Bandera del Kurdistan.svg Egerin Llançament Motor de cerca actiu, kurd / sorani
2014 Searx Llançament Agregador Actiu
Suïssa Swisscows Llançament Bing Actiu
2015 Europa Alemanya Cliqz Llançament Propietari Ociós
2017 França Xaphir Beta Propietari Inactiu, adquirit per Qwant [2]

La majoria dels motors de cerca que operen al web són dirigits per empreses privades que utilitzen algoritmes privats i bases de dades que es mantenen en secret. No obstant això, hi ha diversos intents de crear motors de cerca basats en programari lliure , alguns exemples són:

Altres motors de cerca actius a març de 2020 són: Metager (per privadesa), Serch Encrypt, SearX, Gibiru, YaCy (descentralitzat), Yippi, Lukol i Boardreader.

Perspectives de desenvolupament

Les innovacions més recents en la producció d’algoritmes i sistemes de recuperació d’ informació es basen en l’anàlisi semàntica de termes i la consegüent creació de xarxes semàntiques . Google mateix ha adoptat sistemes per prevenir errors i contextualitzar els resultats.

És raonable predir que d'aquí a uns anys els motors de cerca basaran les seves tecnologies tant en l'anàlisi quantitativa dels continguts (les paraules mateixes), com sobretot en la qualitativa (el sentit de les paraules). Els motors de cerca, per exemple, podran distingir el significat de la paraula " pesca " segons el context en què es troba la paraula (per entendre si es tracta de la fruita, l'esport o un altre). Per avançar en aquesta direcció, Google va adquirir Oingo (anteriorment conegut com "el motor dels conceptes") i la tecnologia de l'empresa que el va crear, Applied Semantics.

La web 2.0 i el futur dels motors de cerca

Icona de la lupa mgx2.svg El mateix tema en detall: web 2.0 .

La nova frontera dels motors de cerca és la web 2.0 . En adoptar aquesta lògica, molts motors i directoris internacionals pretenen una major participació dels usuaris en la creació de contingut del motor de cerca, per tal d’eliminar qualsevol ús d’aranyes o enllaços patrocinats. Amb aquesta lògica, els usuaris poden informar els enllaços ells mateixos i decidir si donen o no popularitat als llocs informats.

El web 2.0 també té com a objectiu una facilitat d’ús més ràpida, ràpida i intuïtiva gràcies a l’ús de motors de cerca metàstica (o diversos motors de cerca), com ara:

Nota

  1. ^ Alta Vista , pàg. 6 .
  2. ^ ( FR ) Qwant represe Xilopix, creador del motor Xaphir - Le Monde Informatique , a LeMondeInformatique . Consultat el 15 de gener de 2018 .
  3. ^ Winner tinooo.com un motor de cerca - Winner tinooo.com, un motor de cerca que en pocs clics es pot personalitzar per trobar qualsevol cosa al web.

Bibliografia

  • Guia de tècniques d’investigació a Internet , Milà, Loeacher, 2000.

Articles relacionats

Altres projectes

Enllaços externs

Control de l'autoritat Thesaurus BNCF 37517 · LCCN (EN) sh00001050 · GND (DE) 4423007-2 · BNF (FR) cb13558463d (data) · NDL (EN, JA) 00.964.483
Internet Portal d'Internet : accediu a les entrades de Viquipèdia relacionades amb Internet