Hoe zoekt een zoekmachine?

De enige zinvolle ingang naar internetpagina’s is het gebruik van een zoekmachine. Hiermee beperk je de miljarden pagina’s die er zijn tot die pagina’s die over het onderwerp gaan waar je nu naar wil kijken. Maar, hoe bepaalt die zoekmachine welke pagina’s tevoorschijn moeten komen en hoe heb je er, als eigenaar van een pagina, invloed op wanneer jij getoond wordt?

Hoe doet een zoekmachine zijn werk?

Alleen al deze vraag geeft in september 2020 bij Google een resultaat van ruim 481.000 pagina’s. Google is dus één van de zoekmachines. Die bestaan er in enkele vormen. Zo is Google een zoekmachine die gebruik maakt van software met namen als ‘crawlers’ of ‘spiders’. Verderop in dit artikel zal ik hier uitgebreider op ingaan. Een andere vorm van zoekmachines is ‘Subject directory’, waarbij eerst pagina’s rondom een specifiek onderwerp worden opgebouwd. Een goed voorbeeld hiervan is Startpagina.nl, maar ook Google Maps zou je zo’n soort zoekmachine kunnen noemen. Tenslotte hebben we nog ‘Meta zoekmachines’ die de informatie van andere zoekmachines combineren. Een Nederlands voorbeeld hiervan is Vinden.nl die de resultaten van Google, Yahoo en Bing combineert. De grootste en ook belangrijkste vorm van zoekmachines zijn dus de ‘crawlers’ van de bekende bedrijven als Google, Yahoo en Microsoft (Bing).

Wat doet een crawler?

Het proces van een crawler is redelijk simpel. Het vertrekpunt van deze software is een bestaande index met internetpagina’s. Hierin staan links naar webpagina’s. De crawler pakt hiervan een link en gaat naar die pagina. Van deze pagina worden alle HTML gegevens gehaald en opgeslagen. En staat er een link op deze pagina, dan wordt ook die weer gevolgd. Dat blijft zich zo herhalen. De opgeslagen informatie van een crawler wordt opgeslagen in een groot index en bij het verwerken van een zoekopdracht wordt gezocht in deze index. In een volgend blog beschrijf ik wat een zoekmachine verder doet zodat een zoekopdracht leidt tot een gepersonaliseerd antwoord op jouw vraag. Voor nu wil ik stilstaan bij het belangrijke inzicht dat, jij als eigenaar van een webpagina, tijdens het proces van de crawler, nog veel invloed hebt op de gegevens die de zoekmachine verzamelt

Wat ziet een zoekmachine?

Een webpagina is in veel gevallen een tekstbestand waarin, in de programmeertaal HTML, verschillende onderdelen beschreven staan. Natuurlijk is dat de tekst, maar dat zijn ook de afbeeldingen, diverse codes die beschrijven hoe de opmaak van de tekst of de pagina eruit moet zien, stukjes echte programmeercode en verwijzingen naar andere pagina’s of passages op dezelfde pagina. Ook webpagina’s in WordPress maken uiteindelijk een HTML pagina. Een crawler haalt deze HTML pagina op en leest alleen de HTML tekst. Het programma ‘ziet’ dus geen afbeeldingen, maar leest alleen de volgende code:

<img class="wp-image" src="https://pereffect.nl/wp-content/uploads/2020/09/Welke-soorten-zoekmachines-zijn-er-1024x688.jpg" alt="Welke soorten zoekmachines zijn er" sizes=width="1024" height="688">

Bij het schrijven van een pagina helpt het om de lezer enige structuur te laten zien. Dat doen we dan meestal door het plaatsen van een tussenkop zoals bovenaan deze alinea of door het gebruik van opsommingstekens. Bij een HTML pagina krijgen deze onderdelen een aparte code zoals <H2> voor een koptekst of <li> voor een opsomming. Een crawler herkent hierdoor dus ook de structuur op een pagina. Een link naar een andere pagina ziet er als volgt uit:

<a href="https://pereffect.nl/contact/">Contact</a>

Aan de hand hiervan weet de crawler dat er nog meer pagina’s zijn die bezocht moeten worden.

Ook bevat een HTML pagina veel informatie die wij als lezer niet zien, maar die weer speciaal voor de crawler bedoeld is. Je kunt op een webpagina dus ook een samenvatting of een omschrijving van de pagina meegeven. Zie dit maar als de achterkant van een boek waarop de schrijver vertelt waar het boek over gaat. In mijn geval leest een crawler dus deze boodschap:

<meta name="description" content="Leo Eumelen helpt ondernemers met hun aanwezigheid online. Hun website ontwerpen, bouwen en onderhouden en hun vindbaarheid vergroten.">

Zoek je vervolgens in Google op “Pereffect”, dan is het resultaat van de zoekopdracht dit:

Welke invloed heb je op de zoekmachine?

Natuurlijk zijn er veel ingrediënten die uiteindelijk van invloed zijn op het zoekresultaat van een gebruiker. En een zoekmachine doet veel meer dan het kijken naar een zoekterm die  de gebruiker intypt. Maar, de grondstof voor het zoekresultaat heb je wel degelijk onder controle en hiervoor hoef je geen HTML te kennen. Je kunt bedenken welke zoektermen voor jou van belang zijn en zorgen dat de die term nog eens extra benoemt in de samenvatting van een pagina. Als je een afbeelding gebruikt die betrekking heeft op een zoekterm zorg dat dan de afbeelding de naam en de alternatieve tekst krijgt van die zoekterm en laat niet als naam <IMG20200921111300.JPG> staan. Hier kan de zoekmachine niets mee, dus help de crawler om de juiste inhoud te vinden.

Zoekmachine optimalisatie

Rondom het bouwen van websites is een nieuw vakgebied ontstaan. SEO (‘Search Engine Optimization’) en SEA (‘Search Engine Advertising’) zijn erg belangrijk geworden, vooral voor die websites die moeten knokken om in een brede internetmarkt bovenaan te komen. Maar iedere website krijgt te maken met de vraag hoe een gebruiker, die interesse heeft in het onderwerp van de website, precies deze website op de eerste pagina van de zoekresultaten gaat zien. Het antwoord op die vraag schuilt gedeeltelijk in een stukje techniek zoals ik hierboven heb beschreven, gedeeltelijk in een manier van schrijven die ik zeker in een volgende blog ga opnemen en voor een groot deel in het maken van interessante inhoud voor een webpagina. Een webpagina die zo interessant is dat die veel gedeeld wordt en dus van meer links in de index van een zoekmachine staat, wordt vervolgens ook meer weergegeven.

Wil je meer weten over het optimaliseren van jouw webpagina’s, nodig me dan eens uit voor een kopje koffie. Vind je dit ook een interessant verhaal voor jouw omgeving, stuur dan gerust een link door.