Robots.txt
Robots.txt
ist eine Datei, die üblicherweise im Stammverzeichnis einer Website platziert wird. Sie entscheidet, ob Crawler Zugriff auf die Website haben oder nicht.
Zum Beispiel kann der Webseiten-Administrator Crawler daran hindern, einen bestimmten Ordner (und alle darin enthaltenen Dateien) zu besuchen oder eine spezifische Datei zu crawlen, normalerweise um zu verhindern, dass diese Dateien von anderen Suchmaschinen indexiert werden.
Siehe auch
- Robots.txt auf Wikipedia
- https://developers.google.com/search/docs/crawling-indexing/robots/robots_txt
- Standardspezifikation: RFC9309
- https://www.robotstxt.org/