Meta dados incorporados ao código XHTML são, na verdade, estruturas de dados sobre os próprios dados, uma breve descrição do conteúdo da página, seu autor, data de criação, linguagem e outras informações relevantes.
Alguns sistemas de busca dão aos conteúdos das meta tags uma forte ênfase no ranking dos sites, a maioria deles indexa os dados das meta tags description e keywords como sumários da página.
Se estas tags forem usadas correta e racionalmente elas podem aumentar a relevância nos resultados de busca o que é vantajoso tanto para o proprietário do site quanto para seu usuário.
Prós e Contras
Como qualquer ferramenta, a utilização das meta tags tem seus prós e contras, vale ressaltar que o uso consciente de suas potencialidades pode praticamente anular seu lado negativo. Seguem algumas dicas:
Mantenha as meta tags simples e concisas: Descrições muito longas e palavras-chave em excesso serão ignoradas por alguns buscadores, inclusive, alguns deles indexam apenas as seis primeiras keywords. Sistemas de indexação podem também identificar o chamado "metatag spamming", onde as palavras-chave são repetidas várias vezes, penalizando, assim, o site em seu ranking.
Dê prioridade às palavras-chave mais importantes: Uma vez que alguns sistemas de indexação lêem somente algumas das keywords é importante listar as mais importantes primeiro.
Evite o uso da meta tag REFRESH para redirecionamento: Antigamente muito usada, hoje deve ser evitada, primeiramente porque ela tende a confundir os bancos de dados dos sistemas de indexação e depois porque confundem também ao usuário, especialmente os que porventura estejam navegando com leitores de tela.
Não abuse das meta tags: Meta tags fornecem informações usadas para categorizar, priorizar e rankear websites além de controlar seu conteúdo pelos webmasters e/ou autores, mas este privilégio não deve ser abusado. Como dito anteriormente muitos sistemas de indexação são "inteligentes" o suficientes para perceber quando há este tipo de abuso, penalizando o site em sua colocação no ranking.
Para o Google, elas não existem! Devido à grande quatidade de "metatag spamming" o robô de busca do Google foi programado para ignorá-las! Ele indexa parte do conteúdo da própria página em seu banco de dados ao invés da "description".
Tipos de meta tags
HTTP-EQUIV
Meta tags com o atributto HTTP-Equiv são equivalentes aos cabeçalhos http. Normalmente elas controlam as ações dos browsers e podem ser usadas para melhor especificar as informações.
Tags usadas desta forma têm um efeito equivalente quando sendo usadas como um cabeçalho HTTP.
Nota: Enquanto este tipo de meta tags funciona normalmente no Netscape, outros browsers podem ignorá-las. Elas também são ignoradas por servidores proxy, que vêm se tornando muito comuns. É mais recomendável usar o cabeçalho HTTP equivalente, como, por exemplo, do Apache.
Os cabeçalhos HTTP são definidos em
HTTP 1.0 e HTTP 1.1
Estes cabeçalhos podem ser gerados por scripts CGI e no Apache usando um arquivo contendo meta dados.
Name
Meta tags com o atributo "name" são usadas para tipos que não correspondem a cabeçalhos HTTP. Muitas vezes esta distinção é ignorada. Por exemplo, alguns buscadores reconhecem a meta tag "Keywords" com o tipo "http-equiv", outros com o tipo "name".
Dublin Core
Com o objetivo de melhorar a indexação das páginas pelos motores de busca, muitos grupos de desenvolvedores acabam criando sua própria "liguagem de metatags", a mais popular delas pertence ao projeto Dublin Core iniciado em 1995 buscando, segundo organizadores, mais flexibilidade para os autores.
Site oficial do projeto: http://www.dublincore.org
Lista de Metatags, atributos e especificações
Apesar de todo o alvoroço existente em torno dos meta dados, muitas pessoas ainda não tem um conhecimento adequado da maioria dos recursos que estas ferramentas proporcionam, abaixo segue uma lista das principais meta tags, seus valores e funcionalidades.
Nota: As palavras-chave "http-equiv", "name" e "content" são case-insensitive, assim como seus valores, mas segundo as especificações do XHTML, todo o código deve ser em letras minúsculas.
Author
O nome do autor da página.
<meta name="author" content="André" />
Cache-Control
Esta tag é apenas reconhecida pelo http 1.1 e permite os seguintes valores:
* Public: Os dados da página podem ser armazenados de forma compartilhada, isto é, será utilizado por diferentes usuários de um mesmo browser (Notar que só é possível especificar usuários de browser no Firefox e Opera).
* Private: É o contrário de public, o cache é armazenado para um específico usuário.
* No-Cache: A página não é armazenada em Cache.
* No-Store: É feito um cache temporário, a página não é arquivada.
Nota: A diretiva "cache-control:no-cache" tem a mesma função de "pragma:no-cache". O ideal quando se usa essa instrução é utilizar ambas as formas caso não se saiba se o servidor é ou não compatível com o HTTP 1.1.
<meta http-equiv="cache-control" content="no-cache" />
Content-language
Declara a(s) linguagem(ns) natural(is) do documento. Pode ser usada pelos motores de busca para categorizar por idioma.
<meta http-equiv="content-language" content="pt-br, en-US, fr" />
* Content-type: Define o tipo de conteúdo da página e o tipo de codificação de caracteres. Pode-se dizer que é a meta tag mais importante, sempre deve ser usada.
<meta http-equiv="content-type" content="text/html; charset=UTF-8" />
CopyRight
Como o nome já diz declara o direito autoral da página.
<meta name="copyright" content="© 2004 tex texin" />
Description
Contém uma descrição da página
<meta name="description" content="...resumo da página..." />
Expires
A data e a hora depois dos quais o documento deve ser considerado como expirado. Uma data ilegal como, por exemplo "0" é considerada como "agora".
Configurar "Expires" como "0" pode também ser usado para forçar uma nova checagem a cada visita do robô de busca.
Nota: Alguns robôs de busca podem deletar um documento de seu banco de dados ao encontrá-lo expirado, outros podem marcar uma revisita
<meta http-equiv="expires" content = "Mon, 22 jul 2006 11:12:01 GMT" />
Keywords
As keywords tipicamente são usadas por alguns motores de busca para indexar os documentos juntamente com informações encontradas em seu título e body.
As frases ou palavras devem ser separadas por vírgulas.
<meta name="keywords" content="..palavras-chave do documento" />
Pragma no-cache
Faz com que o navegador não armazene a página em cache. Diferencia-se de "cache-control:no-cache" pelo fato de ser reconhecida por todas as versões do HTTP.
<meta http-equiv="pragma" content="no-cache" />
Refresh
Especifica um tempo em segundos para o browser atualizar a página, opcionalmente pode-se adicionar uma URL para a qual será redirecionado.
<meta http-equiv="refresh" content="15;url=http://www.thechessman.org" />
Robots
Especifica informações de indexação para os robôs de busca, suporta os seguintes valores:
* All: Valor default, significa vazio, o robô de busca não recebe nenhuma informação.
* Index: Os robôs de busca podem incluir a página normalmente.
* Follow: Robôs podem indexar a página e ainda seguir os links para outras páginas que ela contém.
* NoIndex:Os links podem ser seguidos, mas a página não é indexada.
* NoFollow: A página é indexada, mas os links não são seguidos.
* None: Os robôs podem ignorar a página.
* NoArchive (Apenas Google): A página não é arquivada.
<meta name="robots" content="all" />
GoogleBoot
Em adição com a meta tag "Robots", o Google suporta um commando "GoogleBoot". Dizendo ao google que não quer que a página seja indexada.
Nota: A página continuará a ser indexada pelos outros buscadores
<meta name="robots" content="all" />
Imagetoolbar
No internet explorer elimina aquela pequena barra de opções que aparece ao passarmos o mouse por cima de uma imagem
<meta http-equiv="imagetoolbar" content="no" />
Generator
Indica o software usado para criar a página como forma de medir a popularidade do produto.
<meta name="generator" content="Dreamweaver 8" />
Revisit-After
Diz para os servidores proxy refazer o cache da página depois de um tempo específico.
Esta meta tag não faz com que os motores de busca voltem para sua página, eles fazem isso em períodos aleatórios.
<meta name="revisit-after" content="15 days" />
Rating
Esta tag funciona para classificar a página por censura, assim como no cinema, suporta os valores:
* General: Para qualquer idade
* 14 years: Censura 14 anos
* Mature: Para pessoas acima de 18 anos
<meta name="rating" content="general" />
Content-Script-Type
Define o tipo padrão da linguagem de script do documento.
<meta http-equiv="content-script-type" content="text/javascript" />
Content-Style-Type
Define o tipo padrão de linguagem para estilização do documento.
<meta http-equiv="content-style-type" content="text/css" />
DC.title
Desempenha a mesma função da tag "title", e deve conter o mesmo valor.
<meta name="DC.title" content="Mr.TheChessMan - Impressões Ideológicas" />
DC.Creator
Tem o mesmo papel da meta tag "Author"
<meta name="DC.creator " content="Gazola, André" />
DC.Creator.adress
E-mail para contato com o autor da página.
<meta name="DC.creator.address" content=mr.thechessman@gmail.com" />
DC.Suject
Tem a mesma função da meta "Keywords".
<meta name="DC.subject" content="metadata, metatags, dublin core,web design" />
DC.Description
Tem a mesma função da meta "Description".
<meta name="DC.description" content="..aqui vai a descrição da página.." />
DC.Publisher
Nome da organização que é responsável pelo documento.
<meta name="DC.publisher" content="Info Web Design" />
DC.Custodian
Normalmente, o webmaster responsável pela página.
<meta name="Custodian" content="Gazola, André" />
DC.Date.Created
Data de criação da página no formato AAAA-MM-DD.
<meta name="DC.date.created" content="2006-02-01" />
DC.Date.Modified
Última data de modificação do documento, importante para buscas por data.
<meta name="DC.date.modified" content="2006-02-01" />
DC.Identifier
URL do documento.
<meta name="DC.Identifier" content="http://www.thechessman.org">
DC.Format
Especifica o tipo de dados contidos no documento.
* Text/html;
* Text/xml;
* Text/html;
* Image/jpg;
* Image/gif;
* Video/quicktime;
<meta name="DC.format" content="text/xhtml" />
DC.Type
Text, Home Page, menu, image, vídeo, dados, software ou sound são alguns dos valores suportados.
<meta name="DC.type" content="text.homepage.institucional" />
<br /></span>
Fonte: developer.mozilla.org