Op internet wordt de gebruiker op verschillende sites een grote hoeveelheid verschillende informatie aangeboden. Zoekmachines zijn gemaakt om de nodige informatie te verkrijgen, zoeken naar antwoorden op vragen. Bij het horen van deze zin denken veel mensen aan Google, Yandex. Er zijn echter veel meer zoekmachines op internet.
Wat is een zoekmachine
Een zoekmachine wordt beschouwd als software die bestaat uit een database met documenten. Gebruikers krijgen een speciale interface waarmee ze de nodige vragen kunnen invoeren en links met relevante informatie kunnen ontvangen. Documenten die het beste overeenkomen met wat een bepaalde persoon zoekt, staan altijd bovenaan de zoekresultaten.
Zoekresultaten, die worden gegenereerd in overeenstemming met de ingevoerde zoekopdracht, bevatten meestal verschillende soorten resultaten. Het kan webpagina's, video- en audiobestanden, afbeeldingen, pdf-bestanden, specifieke producten bevatten (als de zoekopdracht wordt uitgevoerd in een online winkel).
Classificatie van zoekmachines
Bestaande zoekmachines zijn onderverdeeld in verschillende typen. Allereerst is het de moeite waard om traditionele zoekmachines te noemen. Voor dergelijke zoekmachines zijn de werkprincipes gericht op het vinden van informatie op een groot aantal bestaande sites. Zoekmachines zijn nog steeds beschikbaar op afzonderlijke internetbronnen:
- in online winkels (om naar de juiste producten te zoeken);
- op forums en blogs (om naar berichten te zoeken);
- op informatiesites (om te zoeken naar artikelen over het gewenste onderwerp of nieuws), enz.
Zoekmachines zijn ook onderverdeeld op basis van geografische kenmerken. In deze classificatie zijn er 3 groepen zoekmachines:
- Globaal. De zoektocht wordt over de hele wereld uitgevoerd. De leider in deze groep is de Google-zoekmachine. Voorheen waren er zoekmachines zoals Inktomi, AltaVista, enz.
- Regionaal. De zoekopdracht wordt uitgevoerd per land of groep van landen, die verenigd zijn door één taal. Regionale zoekmachines zijn wijdverbreid. Hun voorbeeld in Rusland is Yandex, Rambler.
- Lokaal. De zoekopdracht wordt uitgevoerd in een specifieke stad. Een voorbeeld van zo'n zoekmachine is Tomsk.ru.
Onderdelen van zoekmachines
In elke zoekmachine zijn er 3 samenstellende elementen die de principes van de zoekmachine bepalen:
- robot (indexer, spider, crawler);
- database;
- verzoekbehandelaar.
Robot is een speciaal programma dat tot doel heeft een database te vormen. De database slaat op en sorteertalle informatie verzameld. De request handler, ook wel de client genoemd, werkt met gebruikersverzoeken. Het heeft toegang tot de database. De client bevindt zich niet altijd op dezelfde computer. De verzoekbehandelaar kan worden verspreid over verschillende fysiek niet-gerelateerde elektronische computers.
Principes van zoekmachines
Alle bestaande systemen werken volgens hetzelfde principe. Denk bijvoorbeeld aan het functioneren van traditionele zoekmachines die zijn ontworpen voor internet. De werking van de robot is vergelijkbaar met de handelingen van een normale gebruiker. Dit programma omzeilt periodiek alle sites, voegt nieuwe pagina's en internetbronnen toe aan de database. Dit proces wordt indexeren genoemd.
Wanneer een gebruiker op internet een bepaalde zoekopdracht in het zoekvak invoert, begint de client te werken. Het programma benadert de bestaande database en genereert resultaten op basis van trefwoorden. De zoekmachine biedt links naar de gebruiker in een bepaalde volgorde. Ze worden gesorteerd zoals ze overeenkomen met de zoekopdracht, d.w.z. er wordt rekening gehouden met de relevantie.
Elke zoekmachine heeft zijn eigen manier om de relevantie te bepalen. Als de gebruiker een specifiek verzoek naar verschillende systemen stuurt, krijgt hij niet precies dezelfde resultaten. Het algoritme voor het bepalen van de relevantie wordt geheim gehouden.
Relevantie details
In eenvoudige woorden, relevantie is de overeenkomst van het woord of de combinatie van woorden die in de zoekopdracht zijn ingevoerdspecifieke links in de SERP. Verschillende nuances beïnvloeden de positie van documenten in de lijst:
- Aanwezigheid van zoekwoorden in documenten. Deze nuance is duidelijk. Als het document woorden bevat uit de zoekopdracht die door de gebruiker is ingevoerd, dan betekent dit dat dit document overeenkomt met de zoekvoorwaarden.
- Frequentie van voorkomen van woorden. Hoe vaker trefwoorden in een document worden gebruikt, hoe hoger het in de SERP-lijst komt. Echter niet allemaal zo eenvoudig. Te veel gebruik van woorden kan een teken zijn van inhoud van lage kwaliteit voor de zoekmachine.
Het algoritme voor het bepalen van de relevantie is nogal ingewikkeld. Een paar jaar geleden konden links die de nodige trefwoorden bevatten, maar er inhoudelijk niet mee overeenkomen, in de zoekresultaten terechtkomen. Op dit moment zijn de werkingsprincipes van zoekmachines ingewikkeld. Nu kunnen robots de hele tekst analyseren. Zoekmachines houden rekening met een groot aantal verschillende factoren. Hierdoor wordt het probleem gevormd door relevante links van de hoogste kwaliteit.
Hoe u verzoeken correct formuleert
Zelfs op school hebben we geleerd om vragen correct te stellen. Het hangt af van wat voor soort antwoorden we zullen krijgen. Deze regel hoeft echter niet in acht te worden genomen bij het gebruik van zoekmachines. Voor moderne zoekmachines maakt het niet uit in welk nummer of in welk geval een persoon zijn verzoek schrijft. Hoe dan ook, de uitvoer zal dezelfde resultaten bevatten.
Zoekmachines hebben geen duidelijke formulering van de vraag nodig. De gebruiker hoeft alleen de juiste zoekwoorden te kiezen. Overweeg een voorbeeld. We moeten vindende tekst van het nummer "A Day Without You", dat wordt uitgevoerd door de beroemde vrouwelijke popgroep "Via-Gra". Bij contact met een zoekmachine is het niet nodig om de groep een naam te geven, wel aan te geven dat dit een nummer is. Het is genoeg om "een dag zonder je sms'en" te schrijven. Bewaar de case, leestekens zijn niet vereist. Met deze nuances wordt geen rekening gehouden door zoekmachines.
Ranking van zoekmachines in de wereld
De toonaangevende zoekmachine ter wereld is Google. Het werd opgericht in 1998. Het systeem is erg populair, wat wordt bevestigd door analytische informatie. Ongeveer 70% van de verzoeken die op internet komen, wordt afgehandeld door Google. De database van zoekmachines is enorm. Meer dan 60 biljoen verschillende documenten zijn geïndexeerd. Google trekt gebruikers aan met een eenvoudige interface. De hoofdpagina heeft een logo en een zoekbalk. Met deze functie kunnen we Google een van de meest minimalistische zoekmachines noemen.
Bing is de op één na populairste zoekmachine. Het verscheen in hetzelfde jaar als Google. De maker van deze zoekmachine is het bekende internationale bedrijf Microsoft. Lagere posities in de ranglijst worden ingenomen door Baidu, Yahoo!, AOL, Excite, Ask.
Wat is populair in Rusland
Yandex is de populairste zoekmachine in Rusland. Deze dienst verscheen in 1997. In eerste instantie was het Russische bedrijf CompTek International ermee bezig. Even later verscheen het bedrijf Yandex, dat zich bleef bezighouden met een zoekmachine. Zoekmachine voorjaar van bestaan is enorm populair geworden. Het kan in verschillende talen worden doorzocht - Russisch, Wit-Russisch, Oekraïens, Tataars, Kazachs, Engels, Duits, Frans, Turks.
Uit statistische gegevens is bekend dat "Yandex" interessant is voor meer dan 50% van de Runet-gebruikers. Meer dan 40% van de mensen geeft de voorkeur aan Google. Ongeveer 3% van de gebruikers koos voor Mail.ru, een Russischtalige internetportal.
Beschermde zoekmachines
De gebruikelijke zoekmachines die ons bekend zijn, zijn niet bepaald geschikt voor kinderen. Jonge internetgebruikers kunnen per ongeluk materiaal voor volwassenen vinden, informatie die de psyche kan schaden. Om deze reden zijn er speciale beveiligde zoekmachines in het leven geroepen. Hun databases bevatten alleen veilige inhoud voor kinderen.
Een voorbeeld van zo'n zoekmachine is Sputnik. Children. Deze dienst is vrij jong. Het is gemaakt door Rostelecom in 2014. De hoofdpagina van de zoekmachine is helder en interessant ontworpen. Het presenteert een breed scala aan binnen- en buitenlandse tekenfilms voor kinderen van verschillende leeftijden. Bovendien zijn er op de hoofdpagina informatieve links met betrekking tot verschillende rubrieken - "Sport", "Ik wil alles weten", "Doe het zelf", "Games", "Technologie", "School", "Natuur".
Een ander voorbeeld van een veilige zoekmachine voor kinderen is Agakids.ru. Dit is een absoluut veilige bron. Hoe werkt een zoekmachine? De robot is zo geconfigureerd dat hij alleen die sites omzeilt die te maken hebben met kinderonderwerpen of:zijn nuttig voor ouders. De database van de zoekmachine bevat bronnen met tekenfilms, boeken, educatieve literatuur, games, kleurboeken. Ouders die Agakids.ru gebruiken, kunnen voor zichzelf sites vinden over de opvoeding en gezondheid van kinderen.
Concluderend is het vermeldenswaard dat zoekmachines complexe systemen zijn. Ze worden met veel problemen geconfronteerd: de problemen van spam, het bepalen van de relevantie van documenten, het screenen van inhoud van lage kwaliteit, het analyseren van documenten die geen tekstuele informatie bevatten. Om deze reden introduceren ontwikkelaars nieuwe benaderingen en algoritmen die handelsgeheimen zijn in het werk van internetzoekmachines.