Tutorial: Como fazer feeds RSS de outros sites

De Projeto RSSficado 2

Este artigo pertence à seção

RSS Avançado
do
Projeto RSSficado 2

Sub-seções...

Broadcatching
Como fazer feeds RSS de outros sites
Divulgue seus sites RSSficados

Outras seções...

Feeds RSS para Iniciantes
Podcasting para iniciantes
Blogueiros e webmasters
Avançado
Desenvolvedores

Sempre que possível devemos dar preferência para um feed RSS feito pelo próprio site, pois ele tende a ser bem mais estável do que um gerador à parte, uma vez que algumas mudanças no template do website podem acarretar num mau funcionamento do gerador de feeds. Caso o site não forneça um feed tente falar com o dono dele e expor sua necessidade de um feed RSS, talvez ele se interesse e crie um. Se não, neste artigo serão apresentadas algumas das várias maneiras de se criar um feed RSS de um site que não possui tal recurso, umas mais complicadas outras menos.


Índice de conteúdo

[editar] Site Exemplo: Teste RSSficar

Como exemplo será usado um blog fictício: O Teste RSSficar. O autor não tem muitos cuidados em manter seu código limpo, usando o Word para criar seus posts e o Blig como ferramenta para blogar. Neste exemplo poderemos ver um caso clássico que você poderá encontrar por aí, apesar de em outras situações o cenário pode ser bem mais desanimador.


[editar] Usando o Feed43 (Feed for Free)

O Feed43 (Feed For Free) é um serviço grátis (Com recursos extras pagos) para a criação de feeds RSS. Oferece uma interface simples para a realização da tarefa. Pode ser manipulado por qualquer um com conhecimentos intermediários de informática, em contrapartida é menos flexível, logo pode ser mais difícil criar um feed RSS.

  • Depois de criada a conta no serviço, clique em: Create your own feed, aceite os termos para continuar e clique em continue;
  • No 1o passo vamos fornecer a URL de onde serão extraídos os conteúdos do site, no nosso caso, a URL é: http://z001.ig.com.br/ig/16/28/1025052/blig/rssficar/. Depois há a opção de fornecer a codificação da página, este é um campo opcional, deixe em branco, caso ocorra algum problema como caracteres estranhos no conteúdo ou um erro "Invalid XML file" tente colocar "iso-8859-1, "windows-1251" ou "utf-8" neste campo. No caso do nosso exemplo é necessário colocar iso-8859-1.
  • Chegamos ao ponto principal da criação do feed, há agora dois campos para preencher: Global Search Pattern e Item (repeatable) Search Pattern.
    • Global Search Pattern (Padrão de buscas global): Opcional. Atua como um delimitador para a busca do sistema por itens. Apenas o código que está dentro desta delimitação será utilizada para extração do conteúdo. Se não usado faz que a busca ocorra em todo o código fonte. Como usar: Início_itens{%}Fim_itens. No nosso caso podemos deixar este campo em branco.
    • Item (repeatable) Search Pattern (Padrão de busca de itens): Obrigatório. Aqui colocaremos os padrões que o gerador de feeds vai buscar para obter os links, títulos e se possível o conteúdo. Para criar os padrões o site fornece alguns "operadores" que podemos usar para criar os padrões:
      • {%} - Parâmetro: É o extrator do conteúdo, adiciona para os resultados da busca qualquer trecho de texto até os pontos que foi delimitado;
      • {*} - Skip: É o "genérico", pula qualquer trecho de texto entre os pontos que foi delimitado;
      • {_} - Espaço Branco: Pula qualquer trecho de espaços, tabs, ou quebras de linha entre os pontos delimitados;
      • {|} - Quebra de linha: Pula qualquer trecho de quebras de linha entre os pontos delimitados;
Vejamos o trecho que corresponde a um post:
<a name='post_19020528'><span class='data_hora'>08/12/2007 12:44</span></a><br>
<br><b>4o post - Texto puro</b><br><br>
 
Este é um post com texto puro...<br>
 
<span class='nick'>enviada por pedro</span><br><script language='JavaScript'>exibeComentario(19020528,
'rssficar','2007_12.html#post_19020528');</script><br><br>

Aqui podemos ver que dentro dos <span class='data_hora'>(Data)</span> temos a data do post (Que neste caso não nos interessa), entre os <br><br><b>(Título)</b><br><br> temos o título, depois de </b><br><br> há o conteúdo do post, que termina antes de <br><span class='nick'>. Sabendo isso podemos criar nosso padrão de busca, que ficará desta forma:

<span class='data_hora'>{*}<br><b>{%}</b><br><br>{|}{%}<br>{|}<span class='nick'>{*}exibeComentario({*},'{%}');</script><br><br>
  • Ao clicarmos em Extract, se tudo foi feito corretamente teremos a listagem com cada um dos Títulos, links e conteúdos do Feed, prontos para serem utilizado para criar nosso feed RSS.
  • No terceiro passo vamos inserir as propriedades do feed RSS: Título, Link e Descrição. Estas opções ficam ao gosto de cada um.
  • Depois serão colocadas as propriedades de cada item, onde serão posicionados cada um dos itens extraídos:
    • Item Title Template: Aqui colocaremos o padrão de cada título, podendo (ou não) inserir outros trechos de texto. Para este exemplo vamos colocar apenas {%1}, que corresponde aos títulos na listagem de itens encontrados no passo 2.
    • Item Link Template: Aqui colocaremos o padrão de cada link, podendo (ou não) inserir outros trechos de texto. Neste caso específico teremos que adicionar mais um pedaço de texto para formarmos a URL completa dos itens do feed: http://z001.ig.com.br/ig/16/28/1025052/blig/rssficar/{%3}
    • Item Content Template: Mesmo sistema do Item Title Template, desta vez para o conteúdo dos itens. Neste caso usaremos apenas {%2}
  • Agora é só clicar em Preview para ver o resultado final. Verifique se tudo está OK.
  • No passo 4 é fornecido o link para o feed RSS finalizado e outro para editá-lo em algum momento futuro. O Feed de Exemplo Finalizado é: http://feed43.com/5021735868541464.xml
  • Parabéns! Você acaba de criar um feed RSS de um site!

Obs: O Feed43 possui ainda outras funcionalidades que fogem ao escopo deste artigo, não deixe de conhecê-las também.

[editar] Usando PHP

Veja artigo principal: Como fazer feeds RSS de outros sites Usando PHP

[editar] Outros Serviços de criação de feeds RSS

Há ainda outros serviços de criação de feeds RSS disponíveis online. Cada um possui suas características especiais, alguns são mais cheios de recursos, outros simpificam ao máximo o processo. Esta lista foi obtida do site mGarret, artigo 7 Tools To Create An RSS Feed From Any Website (Em Inglês)


[editar] Observações Importantes

  • Nem todo webmaster poderá ficar feliz em ter o conteúdo do seu site extraído para criar um feed RSS, principalmente se este possuir algum tipo de publicidade. Por isso sempre que possível fale com ele antes de fazer o feed. O Projeto RSSficado 2 não se responsabiliza por quaisquer problemas que o (mau) uso destas instruções possam trazer, faça por sua própria conta e risco.
Ferramentas pessoais