Kennisbank
1.000 veelgestelde vragen, 500 tutorials en uitlegvideo's. Hier vind je alleen maar oplossingen!
Beheer het standaard robots.txt-bestand
Deze handleiding bevat informatie over het standaard gegenereerde bestand robots.txt voor webhosting, en wat te doen als dit bestand ontbreekt.
Inleiding
- Het bestand
robots.txtdient als leidraad voor de zoekmachinecrawlers. - Het bevindt zich in de hoofdmap van een website en bevat specifieke instructies voor deze crawlers, waarin staat welke mappen of pagina's ze mogen doorzoeken en welke ze moeten negeren.
- Houd er echter rekening mee dat de crawlers deze richtlijnen kunnen negeren, waardoor de
robots.txtmeer een vrijwillige leidraad wordt dan een strikte regel.
Inhoud van het bestand
Als het bestand robots.txt op een Infomaniak-website ontbreekt, wordt er automatisch een bestand met dezelfde naam aangemaakt met de volgende richtlijnen:
User-agent: *
Crawl-delay: 10Deze richtlijnen geven de crawlers de opdracht om hun verzoeken met 10 seconden te vertragen, waardoor onnodige overbelasting van de servers wordt voorkomen.
De standaard gegenereerde robots.txt omzeilen
Het is mogelijk om de robots.txt te omzeilen door de volgende stappen te volgen:
- Maak een leeg bestand
robots.txtaan (dit dient alleen als tijdelijke oplossing, zodat de regels niet worden toegepast). - Beheer de omleiding van de URI (Uniform Resource Identifier)
robots.txtnaar het door u gekozen bestand met een.htaccess-bestand.
Voorbeeld
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_URI} /robots.txt$
RewriteRule ^robots\.txt$ index.php [QSA,L]
</IfModule>Uitleg
- De module
mod_rewritevan Apache is geactiveerd om omleidingen mogelijk te maken. - De voorwaarde
RewriteCond %{REQUEST_URI} /robots.txt$controleert of de aanvraag betrekking heeft op het bestandrobots.txt. - De regel `RewriteRule ^robots\.txt$ index.php [QSA,L]` stuurt alle verzoeken naar `robots.txt` door naar `index.php`, waarbij de optie `[QSA]` ervoor zorgt dat de queryparameters behouden blijven.
Het wordt aanbevolen om deze instructies bovenaan het bestand `.htaccess` te plaatsen.
Link naar deze veelgestelde vragen: https://faq.infomaniak.com/2136
Is deze veelgestelde vragenlijst nuttig geweest?