SEO - Vantagens que a Web Semântica ira trazer ao seu site

Preview:

DESCRIPTION

Palestra realizada no evento Road Show de TI SENAC Santo André

Citation preview

SEO - Vantagens que a Web Semântica ira trazer ao seu site

Renato Bongiorno

Bem Vindos

Perguntas, idéias, links e o que quiserem - compartilhem:

#roadSemantico

A Web hoje...

Milhões de informações encontram-se disponíveis na web

Páginas são publicadas de forma exponencial a cada dia

Alcance da publicidade na Web em larga escala

Ferramentas facilitadoras para desenvolvimento

permitiram que usuários não familiarizados com

linguagens da web também criassem suas páginas

Até Fevereiro de 2012 2.795.361 registros

cadastrados só com a categoria .BR

A Web hoje...

A Web hoje... GRÁFICO DA EVOLUÇÃO DO NÚMERO DE DOMÍNIOS .br

Qual será a melhor forma de capturarmos informações relevantes e aproveitarmos melhor esse volume

imenso de informação?

A Web hoje...

O que é SEO?

Search Engine Optimization

Técnicas que tem o objetivo de melhorar o posicionamento das páginas do seu site nos resultados orgânicos dos mecanismos de busca

SEO - Busca Orgânica

SEO - Busca Orgânica

Por que eu preciso

me preocupar com a busca orgânica?

SEO - Busca Orgânica

70% dos “internautas” acessam

somente os resultados orgânicos (MarketingSherpa)

75% dos “internautas“ pesquisam somente os resultados obtidos na primeira página

(Marketshare.hitslink.com)

Foco no Google! Porque eu preciso me preocupar tanto com o Google?

Como aparecer no Google?!

As etapas essenciais para ser indexado pelo Google!

Como aparecer no Google?!

Tenha um site bem estruturado!

Tenha um site bem estruturado

Tenha títulos (tag <title>) bem definidos e independentes por página

O conteúdo dos títulos das páginas

geralmente aparecem na primeira linha dos resultados de pesquisa

Tenha um site bem estruturado

Títulos para páginas internas de seu site devem descrever com precisão o assunto

dessa página em particular

Utilize títulos descritivos e curtos (evite keyword spamming)

Tenha um site bem estruturado

Exemplo:

Título descritivo – curto e objetivo:

Dados Semânticos – Artigos sobre Web Semântica

Título incorreto – Keyword Spamming:

Dados Semânticos – Tudo sobre Web Semântica, Linguagens da Web Semântica, Dicas de Web Semântica, Desenvolvendo em Web Semântica

Tenha um site bem estruturado

Exemplo do título da página nos resultados

de busca

Títulos nos resultados de busca:

Tenha um site bem estruturado

Utilize tags de cabeçalho (títulos - h1 - h6)

As tags de cabeçalho são utilizadas para apresentar estrutura da página para os usuários

Utilizar tags de cabeçalhos de diversos tamanhos cria uma ordem hierárquica e

ajuda a estruturar o seu conteúdo

Tenha um site bem estruturado

Evite colocar textos nas tags de cabeçalho e que não sejam úteis na definição da estrutura da página, bem como colocar headings sem

seguir uma hierarquia

Utilize tags de cabeçalho com moderação!

Tenha um site bem estruturado

Otimize o uso de imagens

Todas as imagens devem ter um nome de arquivo e atributo "alt" únicos

Armazene imagens em um diretório separado

Utilize formato de arquivos amplamente suportados e leves

Tenha um site bem estruturado

Evite:

Utilizar nomes genéricos como "imagem1.jpg", "foto.gif", "1.jpg"

Escrever nomes extremamente longos e

preencher o atributo “alt” com palavras-chave ou copiar e colar frases inteiras podem ser considerados “spams”

Descreva quem é você na web!

Meta tags de descrição são importantes porque o Google talvez as utilize como descrição de suas

páginas (conhecidos como "snippets")

Talvez...?!

Se algum conteúdo é mais relevante, é ele que vale!

Descreva quem é você na web!

Meta descrições (snippets) nos resultados de busca:

Exemplo de descrições nos resultados de

busca

Adicione descrições individuais em cada página de seu site

Tenha objetividade nas descrições, evite:

› Descrições que não tenham relação com o conteúdo do site

› Descrições indicando palavras chave

› Descrições genéricas

› Copiar e colar todo o conteúdo do documento na descrição

Descreva quem é você na web!

Seja organizado!

Tenha uma estrutura organizada e URL amigáveis

Seja organizado!

Exemplos de URL:

URL amigável:

http://www.w3.org/standards/semanticweb/

URL não amigável:

http://www.ccae.ufpb.br/sbie2010/index.php?option=com_content&view=article&id=78&Itemid=67&lang=en

Seja organizado!

As URLs também fazem parte dos resultados de busca:

Exemplo de URL amigável nos

resultados de busca

Seja organizado!

Tenha um site fácil de navegar

Utilize sempre um mapa do site como link adicional de navegação em sua

estrutura HTML e no formato XML para ajudar o Google no

reconhecimendo de suas páginas

Seja organizado!

Evite:

Criar links de navegação complexos

Exagerar na segmentação do conteúdo (fazendo com que o usuário de muitos cliques para chegar a informação)

Imagens para menu de navegação

Utilize breadcrumbs

Avise possíveis problemas no site!

Tenha uma página de erro 404 util!

Evite que páginas de erro 404 sejam indexadas – utilize nofollow!

Utilize o design das páginas 404 de acordo com o design da página!

Avise possíveis problemas no site!

Exemplos de páginas 404!

Avise possíveis problemas no site!

Exemplos de páginas 404!

Conteúdo – A chave do Sucesso!

Ofereça conteúdo e serviços de qualidade!

Criar conteúdo útil e atraente irá exercer maior influencia no ranking

no seu site do que qualquer um dos outros fatores discutidos aqui.

Conteúdo – A chave do Sucesso!

Escreva textos de fácil leitura e coesos

Mantenha-se centrado no tema

Evite grandes quantidades de texto sobre temas variados em uma única página

Formate corretamente seu texto (títulos, parágrafos, subtítulos)

Evite erros ortográficos e gramaticais

Não incorpore textos em imagens

Utilize uma linguagem adequada

Conteúdo – A Chave do Sucesso!

Crie conteúdo e serviços exclusivos e atualizados!

Conteúdo original fará com que seus

usuários atuais voltem e trará novos visitantes

Conteúdo – A Chave do Sucesso!

Crie conteúdo essencialmente para os seus usuários e não para os

mecanismos de pesquisa!

Conteúdo – A Chave do Sucesso!

Evite:

Plágio e versões duplicadas do seu conteúdo

Palavras-chave repetidas no decorrer do texto

Erros ortográficos premeditados para palavras “possivelmente” pesquisadas erradas (ex.: dedetizadora, detetizadora)

Inserir texto escondido para os usuários, mas aparente aos mecanismos de pesquisa

Conteúdo – A Chave do Sucesso! Estruture textos âncoras no conteúdo do seu site

Este texto diz aos usuários e ao

Google algo sobre a página que

você está apontando

(seja interno ou externo).

Quanto melhor o texto âncora,

mais fácil será para os usuários

navegar e para o Google

entender do que se trata a

página direcionada.

Conteúdo – A Chave do Sucesso!

Escolha um texto descritivo, ao invés de "clique aqui”

Utilize textos se relacionam com o conteúdo da página apontada

Escreva textos concisos – curtos e descritivos

Torne fácil a distinção entre links e textos

Estruture textos âncoras no conteúdo do seu site

Não quer aparecer, avise!

Faça uma utilização eficaz do robots.txt

Um arquivo "robots.txt" informa aos mecanismos de pesquisa se podem ou não acessar parte de seu site.

Se você tem pastas pessoais que não deseja ser localizada pelos mecanismos de busca, informe!

Sigam-me os bons!

Nofollow – utilize de forma correta!

Indica um conteúdo do seu site que não

deve ser referenciado pelo Google

Sigam-me os bons!

Quando utilizar:

Conteúdo não confiável

Links pagos

Priorização de rastreamento

PageRank

Métrica utilizada pelo Google para representar a importância e a reputação do seu site na Web.

Um bom PageRank depende de diversos fatores como:

• A qualidade do conteúdo e a quantidade de links referenciados

• A posição do link na página, bem como sua visibilidade

• A semântica do conteúdo

PageRank

Mudanças do Google com PageRank:

• Não indexa links pagos

• PageRank depende da qualidade do conteúdo, confiabilidade da fonte de dados e credibilidade do link

• Remoção das ferramentas de PageRank da central do webmaster

• Google PageRank toolbar com poucas atualizações anuais

PageRank

O PageRank ainda é importante para SEO?

Conforme Matt Cutts, engenheiro de software do Google:

“O PageRank continua importante, é uma das métricas mais importantes dentro das 200 que

temos, mas é uma entre as 200 métricas que utilizamos no para rankear páginas...”

Redes Sociais - Entre ou saia do mercado!

Links âncora são essenciais para o bom ranking do seu

site nos mecanismos de busca, mas criar uma conta

nas redes sociais visando somente SEO não é seu

foco principal.

Redes Sociais - Entre ou saia do mercado!

Confiança é o que sua empresa deverá transmitir através de conteúdos

EXCLUSIVOS (nada de Ctrl+C e Ctrl+V )

Sendo os fatores de maior impacto nos resultados de SEO.

Redes Sociais - Entre ou saia do mercado!

Links adicionados em portais como Facebook e Twitter atribuem rel=“nofolow” nos seus links...

Porém, existe uma tendência que essas redes a trabalhem como o Google Profile e Youtube quando o conteúdo

transmitir confiança ao consumidor o mecanismo remove o atributo nofollow e passa a “rankear” seu site nos resultados

de pesquisa....

Redes Sociais - Entre ou saia do mercado!

Linkedin não utiliza “nofollow”, isto significa que se a página informada em seu perfil é totalmente relevante

para mecanismos de busca!

Redes Sociais - Entre ou saia do mercado!

Recentemente Danny Sullivan (editor chefe da Search Engine Land) realizou uma entrevista com o Google e o Bing, e ambos informaram que os links publicados nas redes sociais tem

impacto sobre o ranking nos resultados de busca, utilizando a autoridade do autor (quem é você nas redes sociais), a qualidade do post e quantas

pessoas confiam neste post...

Redes Sociais - Entre ou saia do mercado!

“SocialRank”

“HumanRank”

“AuthorRank”

Novas métricas:

Redes Sociais - Entre ou saia do mercado!

1. Número de seguidores no Twitter

2. Número de Fans em sua Fan Page

3. Número de Tweets e RTs no Twitter

4. Número de Shares e Likes no Facebook

5. A relação entre seguidores de amigos

6. A autoridade das pessoas que seguem você

7. A autoridade das pessoas que compartilham o seu conteúdo

8. A qualidade média das suas mensagens previamente compartilhadas

9. O número de menções e compartilhamentos únicos

10. A fonte e o rank dos links que você compartilha

Os 10 fatores que ajudam nessas novas métricas:

E o Google +?

Em pesquisas fora da rede Google+, segundo Vasilis Vryniotis (Engenheiro de Software e co-fundador do Web

SEO Analytics), o Google utilizará os dados da mesma forma que utiliza das demais redes

E o Google +?

Porém, se você utiliza a rede, os resultados mudam...

Redes Sociais - Entre ou saia do mercado!

E o principal...

Quanto mais visitas pelo conteúdo do seu site , mais credibilidade, e para obter

confiança dos internautas, as redes sociais são o melhor caminho....

Redes Sociais - Entre ou saia do mercado!

Redes Sociais - Entre ou saia do mercado!

Estatísticas das redes – Twitter (twitter.com/blog):

3 anos, 2 meses e 1 dia: › Tempo que levou desde o primeiro tweet ao tweet bilionésimo

1 semana: › Tempo que leva agora para os usuários enviarem um bilhão de Tweets

50 milhões: › Número médio de tweets enviados por dia em março de 2010

140 milhões: › Número médio tweets enviados por dia em fevereiro de 2011

177 milhões: › Total de tweets enviado em 11 de março de 2011

Redes Sociais - Entre ou saia do mercado!

Estatísticas das redes – Twitter (twitter.com/blog): 460.000:

› Número médio de novas contas por dia até fevereiro de 2011

182%: › Aumento do número de usuários móveis em relação a fevereiro de 2010

Estatísticas das redes - Facebook (http://newsroom.fb.com/):

845 milhões: › Usuários mensais ativos no final de Dezembro de 2011

425 milhões: › Usuários mensais ativos que usaram Facebook em mobile em dezembro de 2011

PageRank Sculpting

Abandone técnicas do passado...

Técnica utilizada para “filtrar” os links com “nofollow” visando somente os links mais interessantes

Cadastro do site em vários diretórios

Abandone técnicas do passado...

Cadastrar seu site em muitos diretórios e receber aprovação para aparecer na listagem de sites nestes

diretórios não garantem mais um bom ranking

Cadastro do site em vários diretórios

Abandone técnicas do passado...

Cadastrar seu site em diretórios com qualidade de conteúdo - quality Directories (DMOZ and Yahoo Directory) – pode ajudar no ranking, mas para isso, seu site precisa ter bom

conteúdo para ser aceito nestes diretórios

Palavras chaves (Meta keywords) Não servem mais para nada!

Abandone técnicas do passado...

Em função da quantidade de spam e a declarações de palavras chave sem relação ao conteúdo do site, o Google não utiliza

mais a meta tag keyword em seus resultados.

Palavras chaves (Meta keywords)

Não servem mais para nada!

Abandone técnicas do passado...

Homem e máquina pensando juntos!

Torne seu site compreensível para humanos e máquinas…

Homem e máquina pensando juntos!

Como assim?!

Legível para máquinas e humanos?!

Homem e máquina pensando juntos!

Pesquisas como...

“A melhor padaria de Santo André”

Ainda não resultam em resultados precisos...porque?!

Homem e máquina pensando juntos!

Máquinas são utilizadas somente para

exibir a informação na tela

Para realizarmos buscas de informações precisas na Web, é imprescindível a

intervenção humana

A Web de hoje...

Dificuldades de captura de dados precisos na web atual:

Resultados sensíveis à forma de pesquisa - a ordem das palavras nos mecanismos de busca, impactam no resultado, mesmo referenciando o mesmo assunto

Resultados isolados - informações espalhadas em várias páginas necessitam de várias buscas para a obtenção do resultado desejado

Processamento da Web Atual

Dificuldades de captura de dados precisos na web atual:

Resultados com grande número de páginas - muitas vezes, poucas páginas com a informação que solicitamos

Resultados individuais - resultados referenciando a mesma página

Processamento da Web Atual

Como fazer com que os mecanismos de busca localizem os conceitos dos

itens buscados e não somente as palavras chaves?

A Web mudou e o Google também!

Web 3.0 – Web Semântica

Web Semântica é a forma de funcionamento da web

que visa facilitar a obtenção, classificação e

organização das informações na web, estruturando os

documentos para torná-los legíveis tanto para

humanos quanto para máquinas.

Google anuncia - Novo algoritmo! Matéria Olhar Digital – Março de 2012

Essa mudança não é de hoje...

Google

Em Maio de 2009 o Google anunciou a utilização de Microformatos e RDFa para enriquecer os resultados

de busca

Em Maio de 2010 anunciou a utilização de Microformatos e RDFa no “Google Squared” provendo buscas semânticas

para imagens

Essa mudança não é de hoje...

Linguagens da Web Semântica:

XML

RDF

RDFa

Microformats

GRDDL

OWL

SPARQL

HTML5

Metadados! A chave para o sucesso da

Web Semântica! E o que são metadados?

Segundo a International Federation of Library Associations (IFLA):

"Metadados são dados sobre dados. O termo se refere a qualquer informação utilizada para a

identificação, descrição e localização de recursos"

Para o W3C, metadados são definidos como:

"Informações para Web que podem ser compreendidas por máquinas"

Segundo o filósofo e consultor David Weinberger:

"Os dados são o que você procura e os metadados aquilo que você sabe..."

Como os dados podem se conectar via web através das linguagens da

Web Semântica?

Língua franca da web permitindo que máquinas possam interagir de

modo significativo.

Representação formal de um grupo de conceitos

dentro de um domínio e as relações

entre estes conceitos. (Pollock , Jeffrey t.)

Especificações formais e explícitas de

conceitualizações compartilhadas. (Britman, Karin)

Uma base de conhecimento comum sobre um determinado domínio (assunto) que

permite ligar informações na web de forma categorizada e disponibilizá-la

universalmente. (Renato Bongiorno)

EDUCAÇÃO

› DOCENTE DO SENAC SP › MINISTRA CURSOS WEB

Unidades

Docentes

Cursos Imagine que a minha página pessoal contendo metadados, se conecte com o vocabulário

educacional e que neste vocabulário tenha disponível as vinculação de: Unidades,

Docentes e Cursos

EDUCAÇÃO

› DOCENTE DO SENAC SP › MINISTRA CURSOS WEB

Unidades Docentes Cursos

Docente SENAC Web SP

Veja como a informação

acrescida de semântica

será compreendida na web.

Como o Google indexa as linguagens da Web Semântica?

Pequenas linhas de texto que aparecem embaixo de todo resultado de pesquisa, desenvolvidos para dar aos

usuários uma noção sobre o conteúdo da página e por que ela é relevante para a consulta.

Como adicionar Rich Snippets?!

Adicionando metadados ao seu HTML!

Escolha um formato de marcação:

Microdados Microformatos RDFa

Microdados / Microformats / RDFa: Forma de marcar um conteúdo em HTML

com sua ontologia específica afim de descrever um tipo específico de informação

Pessoas Eventos Resenhas Notícias

Rich Snippets - Microdados

<div> Meu nome é Bob Smith, mas todos me chamam de Smithy. Esta é a minha página inicial: <a href="http://www.example.com">www.example.com</a> Moro em Albuquerque, Novo México, e trabalho como engenheiro na ACME Corp. </div>

<div itemscope itemtype="http://data-vocabulary.org/Person"> Meu nome é <span itemprop="name">Bob Smith</span> mas todos me chamam de <span itemprop="nickname">Smithy</span>. Esta é a minha página inicial: <a href="http://www.example.com" itemprop="url">www.example.com</a> Moro em Albuquerque, Novo México, e trabalho como <span itemprop="title">engenheiro</span> na <span itemprop="affiliation">ACME Corp</span>. </div>

Com microdados:

Sem microdados:

Rich Snippets - Microformats

<div> <img src="www.example.com/bobsmith.jpg" /> <strong>Bob Smith</strong> Editor sênior da ACME Reviews 200 Main St Desertville, Arizona 12345 </div>

<div class="vcard"> <img class="photo" src="www.example.com/bobsmith.jpg" /> <strong class="fn">Bob Smith</strong> <span class="title">Editor sênior</span> na <span class="org">ACME Reviews</span> <span class="adr"> <span class="street-address">200 Main St</span> <span class="locality">Desertville</span>, <span class="region">Arizona</span> <span class="postal-code">12345</span> </span> </div>

Com microformats:

Sem microfortmats:

Rich Snippets - RDFa

<div> Meu nome é Bob Smith, mas todos me chamam de Smithy. Esta é minha página inicial: <a href="http://www.example.com">www.example.com</a>. Moro em Albuquerque, Novo México, e trabalho como engenheiro na ACME Corp. </div>

<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person"> Meu nome é <span property="v:name">Bob Smith</span>, mas todos me chamam de <span property="v:nickname">Smithy</span>. Esta é a minha página inicial: <a href="http://www.example.com" rel="v:url">www.example.com</a>. Moro em Albuquerque, Novo México, e trabalho como <span property="v:title">engenheiro</span> na <span property="v:affiliation">ACME Corp</span>. </div>

Com RDFa:

Sem RDFa:

As possíveis ontologias que você poderá relacionar seu conteúdo...e isso varia de negócio para negócio!

O que difere as tecnologias?

Rich Snippets - Ontologias

Ontologia recomendada pelo Google: Creative works Event

Organization

Person Place, LocalBusiness, Restaurant ...

Product, Offer, AggregateOffer

Review, AggregateRating

Linking Open Data - visa tornar os dados livremente disponível

para todos!

As figuras a seguir mostram a evolução dos conjuntos de dados que foram publicados e

interligados pelo projeto até agora:

Com essa informação fica fácil identificar os vocabulários conforme sua necessidade!

2007

2008

2009

2010

2011

Até Setembro de 2011 95 conjuntos de dados composto

por mais de 31 bilhões triplos RDF, que são interligadas por cerca de

504 milhões ligações RDF.

2011

2011

Busca Semântica

Baseia – se em consultas relacionadas ao conceito das palavras chave retornando as informações

necessárias em documentos, permitindo relações entre os documentos que tenham

conteúdo semântico.

Busca semântica x Buscador Semântico

Buscador Semântico

Sistema que coleta, indexa e analisa os documentos semânticos da web, baseia-se nos dados publicados como dados abertos

(RDF, RDFs, OWL), permitindo que se realize as buscas semânticas.

Busca semântica x Buscador Semântico

Buscador Semântico – Visão Geral

Crawling:

• Sistema de “rastreamento”, permite que o sistemas de busca acessem todo conteúdo semântico disponível na web.

• O que diferencia dos “crawlers” nos sistemas de busca convencionais é a possibilidade de rastrear diferentes fontes de informação

Buscador Semântico - Crawling

Crawling:

• PingTheSemanticWeb.com

• Sistema que alerta os crawlers sobre novas fontes de dados

Buscador Semântico - Crawling

• Crawling:

Buscador Semântico - Crawling

Olha meu site aqui bongiornoweb.com.br

Indexing:

• Processo “core” dos mecanismos de busca, indexa as informações relacionadas para serem exibidas nos retornos das pesquisas

• Relacionam metadados, elementos relacionados, permitindo uma consulta eficiente

Buscador Semântico - Indexing

Indexing & Crawling em sistemas semânticos, permitem diferentes níveis no acesso a informação:

Buscador Semântico – Indexing & Crawling

Inference:

Nos sistemas de busca semântica, as inferências são as influências que os sistemas atribuem as consultas para aumentar a coleta de dados

Buscador Semântico – Inference

Ranking:

O objetivo principal para “rankear” as informações em sistemas de busca semânticos

está em retornar nas primeiras posições a informação mais relevante.

Buscador Semântico – Ranking

Retrieval:

Diferentes retornos de dados podem ser obtidos em sistemas de busca semânticos, desde simples URIs direcionando aos documentos semânticos

ou objetos (ex.:triplas RDF) ou apresentar dados e metadados associados ao retorno da

pesquisa

Buscador Semântico – Retrieval

Queryring:

Diferentes sistemas de pesquisa são disponibilizados nos sistemas de busca

semânticos, desde os campos de formulários convencionais até sistemas de busca mais assertivos na busca de URIs e ontologias.

Buscador Semântico – Querying

SPARQL endpoint

Buscador Semântico – Querying

Navegação:

O sistema de navegação proporcionado pelos sistemas de busca semânticos são obtidos como em sistemas de busca comuns, via browser, porém permitem que outras

aplicações utilizam de seus resultados para localizar mais informações no resultado

obtido.

Buscador Semântico – Navegação

Navegação:

Um exemplo de pesquisa por aplicação – um resultado pode conter dados de uma pessoa em formato aberto (FOAF) e localizar todas as informações publicadas por essa pessoa.

Buscador Semântico – Navegação

Interface de busca:

As interfaces com os resultados de busca podem variar conforma a necessidade de acesso, se por agentes de software – permitindo acesso direto aos metadados – ou por usuários finais – permitindo uma “user interface” amigável.

Buscador Semântico – Interface

Tratamento de variações morfológicas:

Um motor de busca semântico lida com as variações morfológicas os resultados não devem mudar se você digitar "melhorar, melhora, melhoraria, melhorarado”

Tratamento de sinônimos com os sentidos corretos:

Um motor de busca semântico lida com sinônimos (cura, curar, tratar, etc ..) no contexto certo e com os sentidos de palavras corretas.

Motores de busca semântico devem reconhecer conceitos e trazer

resultados relevantes

Motores de busca semântico devem responder de forma sensata

quando a consulta é em uma forma de perguntas (o quê, onde,

como, porquê, etc)

Uma consulta deve apontar não só aos documentos, mas também

as seções relevantes dos mesmos

Estes são apenas alguns exemplos do poder da união

dos dados...querem mais?

O Google já está preparado, agora só falta você!

Abram seus dados! “Open your data”

Lembra da busca inicial...da melhor padaria de Santo André...

twitter.com/bongiornoweb

facebook.com/bongiornoweb

renatobonfanti@yahoo.com.br

Renato Bongiorno