META-Angaben

Durch <meta> Angaben im Header können nicht sichtbare, übergeordnete Informationen mitgeteilt werden, die von Suchmaschinen verarbeitet werden. Damit kann u.a. das Ranking verbessert werden.

<html> 
<head> 
	<title>24 Meta-Angaben</title> 
	<meta http-equiv="content-type" content="text/html; charset=UTF8" /> 
	<meta http-equiv="refresh" content="5; URL=http://www.uni-weimar.de" /> 
	
	<meta name="author" content="Fritzchen Müller" /> 
	<meta name="description" content="Meta-Angaben im HTML-Header enthalten Informationen für Suchmaschinen-Indizierer..."/> 
	<meta name="keywords" lang="de" content="html, meta, tag, schlüsselwort, autmatische, indizierer, ..." /> 
	<meta name="keywords" lang="en" content="html, meta, tag, keywords, crawler, robots, ..." /> 
	<meta name="language" content="de" /> 
	<!-- weglassen des Folgenden bedeutet <meta name="robots" content="all" />, siehe auch robots.txt -->
	<meta name="robots" content="noindex,nofollow" /> 
</head> 

<body>  
... Seiteninhalt …
</body> 
</html>


robots.txt

Durch eine Datei mit dem Namen "robots.txt", die im Wurzelverzeichnis des Webservers (root) liegt, kann "freundlichen" Suchmaschinen-Bots (Bots, Robots, Crawler oder Indexer) mitgeteilt werden, ob und welche Inhalte indiziert werden dürfen.

Dem Beispiel ist anzumerken: Das stellt natürlich keine sicherheitsrelevante Einstellung dar, im Gegenteil können hiermit "unfreundliche" Bots erst auf "interessante" Verzeichnisse aufmerksam werden! Ernsthafte Sicherheit bietet z.B. Zugriffskontrolle via .htaccess.

# Dateiname: robots.txt
User-agent: *
Disallow: /privatepics
Disallow: /bankkonto/summen.txt
Allow: /index.php

Siehe auch: Robots Exclusion Standard(Wikipedia)



Diese Seite ist Teil der Werkmodule Grundlagen der Webprogrammierung und WebApps - Grundlagen Webprogrammierung von Michael Markert für Interface Design / Fakultät Medien an der Bauhaus-Universität Weimar.