Como descobrir o número de assinantes do seu feed via Google Reader, analisando o log de seu blog
O blog oficial do Google Reader anunciou na sexta-feira que passou a informar aos responsáveis pelos sites o número leitores que assinam cada um de seus feeds, a exemplo do que fazem vários outros serviços de agregação.
Naturalmente o serviço não pode simplesmente deixar a informação disponível de tal forma que qualquer interessado possa consultá-la, pois dispor desta informação é um privilégio do autor de cada site, que então pode optar entre divulgar ou não.
Assim, o Google Reader passou a disponibilizar a informação na "assinatura" que o seu robô de coleta de feeds deixa nos logs de acesso de cada servidor web que visita, como na figura acima.
Se você usa serviços de geração e administração de feeds como o Feedburner, provavelmente a contagem de leitores do feed do seu blog já foi atualizada para incluir o número adicional do Google Reader. Mas se você deixa o seu CMS (o Wordpress, o Drupal ou outro software similar) cuidar dos seus feeds de forma automática, como ocorre por default, ter acesso ao número de leitores do feed é uma tarefa que depende de análises de log do servidor web.
Esta análise pode ser simples ou não, mas no que se refere especificamente aos leitores que acessam via Google Reader, é bastante simples, especialmente se o seu provedor de hospedagem oferece acesso ssh à sua conta (os melhores costumam oferecer - eu recomendo o Dreamhost.
A tarefa se divide em 3 pontos:
- acessar o diretório onde estão os logs do site
- processar o arquivo de log
- analisar o resultado
O ideal é exportar os dados para uma planilha - algo que você pode fazer simplesmente copiando e colando a saída dos comandos abaixo em um arquivo com a extensão .csv e abrindo no OpenOffice Calc ou no Excel - e realizar análises de forma detalhada, mas a maioria dos blogs tem poucos feeds, e uma análise simplificada, a partir da própria saída do script, pode ser suficiente.
Você terá que descobrir em que diretório o seu provedor de hospedagem disponibiliza os logs para consulta. No caso do Dreamhost, por default é usado o diretório ~/logs/domínio-do-site/http. Após localizar o arquivo, que no caso do Dreamhost tem o nome padrão de access.log, basta extrair dele os dados relevantes.
Se você não tem proficiência na linha de comando do Linux, tente seguir os 2 comandos do exemplo abaixo, trocando a URL do Efetividade.net pela sua (e realizando as demais adaptações necessárias ao seu provedor de hospedagem, se for o caso):
cd ~/logs/efetividade.net/http
awk '/Feedfetcher-Google;/ {print $14,$7}' access.log|sort -nr|uniq
Você verá uma saída similar a esta, mostrando o número de assinantes de cada feed seu:
9367 /feed/
2103 /feed/atom/
72 /category/organizacao/feed/
61 /category/web/feed/
Se desejar, substitua o segundo comando pela variação abaixo (apesar de quebrada, deve ser digitada em uma linha só) que acrescenta um total geral ao final:
awk '/Feedfetcher-Google;/ {print $14,$7}' access.log|sort -nr|uniq|awk '{print;t+=$1} END{print "TOTAL",t}'
Lembre-se de que os números mostram apenas os assinantes do seu feed via Google Reader, e que é provável que você tenha muitos outros assinando via outros serviços on-line (como o Bloglines, por exemplo) e via leitores desktop em geral.
O número pode ser uma surpresa, como foi para mim saber que mais de 30000 pessoas assinam o feed principal do BR-Linux via serviços do Google, ou pode ser o esperado - mas sem dúvida é útil conhecê-lo!
Comentar
Comentários arquivados