Hur Sökmotorer Arbete

September 4

Hur Sökmotorer Arbete


Sökmotorer är ett av de viktigaste verktyg som du kan använda när du surfar på world wide web. De fungerar som en portal till de enorma mängder information som finns på nätet. När sökmotorer var i sin linda, användes de för ett par tusen förfrågningar per dag. Nu är siffran står i tiotals miljoner, med hundratals miljoner indexerade sidor. Sökmotorer som Google, Yahoo och Bing är att genomsöka webben varje dag för att hjälpa till att organisera och presentera ny information i en sök-stånd format.

web genomsökning

Innan visa sökträffar baserad på en fråga, måste sökmotorer göra en lokal databas för att ge resultat. Detta utförs med hjälp av programvara "robotar" som kallas "spindlar". Varje dag dessa robotar krypa igenom webbsidor, indexering som de går. När sökmotorn har besökt en webbplats index sida, blir det sedan krypa igenom varje efterföljande sida letar efter nyckelord för att lagra och hyperlänkar som att fortsätta sin färd. Olika sökmotorer fungerar på olika sätt. Googles spindlar utelämna ord som "a", "ett" och "den", medan Altavistas spindlar index varje ord på sidan. Detta är anledningen till att olika tjänster samla olika resultat.

indexering

När en spindel besöker en webbplats, skannar den efter vissa ord att använda som sökord, som kommer att utlösa webbplats i sökresultaten. Dessa ord måste tilldelas någon sorts prioritera exakt kategorisera platsen. Spindlar kommer att söka efter frekvensen av ord, platsen för ord (i rubriker, som titlar och hyperlänkar) och inom HTML för metataggar och sedan använda en "vikt" till varje post. Detta prioriterar sökresultaten och ger noggranna översikter av en webbsida verkliga innehåll.

Kodning och Hashning

När en sökmotor spindlar har skapat sina sökordslistor, samlas data kodas för att spara lagringsutrymme. Komprimera alla insamlade data gör att den kan hittas snabbt och lagras så ekonomiskt som möjligt. Kodade data indexeras därefter, och en hashtabell skapas. Hash tabellen är ett viktigt verktyg vid indexering som den tilldelar ett numeriskt värde för varje sökord med hjälp av en formel. Denna formel fördelar indexerade nyckelord över ett bestämt antal divisioner, vilket gör poster lätt att komma åt. Detta säkerställer att även komplicerade sökningar med massor av sökord kan snabbt nås med hjälp av numeriskt värde tilldelas sökord snarare än en alfabetisk fråga.

metataggar

Metataggar är sökord som ingår i en webbsida HTML. De är placerade i dokumentet specifikt ska kunna hittas av en sökmotors spindlar. Webbplatsägare kan ange direkt till spindeln vilket innehåll sidan innehåller och sökord som skulle vara relevanta i en sökning. Det finns inget som hindrar författare till en sida att lägga metataggar som inte är tillämpliga på sidan för att öka trafiken till webbplatsen. Så många spindlar nu verifiera metataggar med ord inom sidan för noggrannhet. Metataggar är användbara när ett ord har flera betydelser, se spindeln har indexerat innehåll korrekt.

Boolean Logic

Boolean logik har utvecklats av George Boole i mitten av 19-talet och har genomförts i sökmotorer. Med hjälp av olika "aktörer", är det möjligt att ange om du vill inkludera, utesluta och samla mycket speciella resultat. Vanliga operatörer att använda inom sökmotorer inkluderar:

OCH: säkerställer två ord förenade med och är med i sökresultat-vin och Kalifornien

OR: säkerställer åtminstone ett av orden förenade med eller verkar inom resultat Kalifornien rött eller vitt

INTE: säkerställer termen följande inte är utesluten från resultat Kalifornien vin INTE röd

Följt av säkerställer en av söktermerna direkt följer den andra-Kalifornien FÖLJT AV vin

Citattecken "": för att söka efter en exakt fras i en sida- "California vin 2009"

Dessa aktörer kan användas för att styra sökmotorn till rätt delar av sitt lokala databasen och ger betydligt mer korrekta resultat.


        

Välkommen till dig för att skicka en kommentar:

            
            
            
            

© 2020 Astrixsoft.com | Contact us: webmaster# astrixsoft.com