Data Sampling do Google Analytics: O Que Você Precisa Saber Sobre GAU e GA4

Neil Patel
Espero que você goste desse artigo. Se você quer que meu time faça o seu marketing, clique aqui.
Author: Neil Patel | Co Founder of NP Digital & Owner of Ubersuggest
Published abril 1, 2024

E se eu te dissesse que seus relatórios do Google Analytics podem não ser tão precisos quanto você imagina?

Isso porque o Google Analytics usa data sampling (ou amostragem de dados) — um método que reduz a carga de trabalho, mas aumenta o risco de resultados imprecisos — em certos relatórios e situações específicas.

A boa notícia é que você não precisa ser um profissional do Google Analytics para entender a amostragem e como ela pode impactar seus relatórios e a qualidade dos dados.

Neste post, explicarei o que é a amostragem de dados do Google Analytics, por que ela é usada e como funciona.

Também vou compartilhar problemas que a amostragem do Google Analytics pode causar em seus relatórios, incluindo um exemplo de um cliente da NP Digital.

Claro, também compartilharei maneiras de evitar e gerenciar a amostragem de dados no GA.

Se você está pronto para aprender mais sobre data sampling no GA4 do que jamais pensou que precisaria, continue lendo.

Principais Pontos Sobre Amostragem de Dados do Google Analytics

  • Existem dois tipos de amostragem de dados no Google Analytics: amostragem de sessões (implementada em relatórios ad-hoc) e amostragem de coleta de dados (que ocorre antes dos dados serem enviados para o Google Analytics). Isso visa reduzir o tempo de processamento.
  • O principal inconveniente é a possível perda de precisão, afetando sites pequenos e grandes.
  • A comparação de dados amostrados e não amostrados para um cliente na NP Digital mostrou variações nos números relatados.
  • Aplicar o mesmo regex como segmento (amostrado) e como filtro avançado (não amostrado) resultou em diferentes resultados ano a ano.
  • Para garantir comparações precisas, recomenda-se exportar dados amostrados do GA4 se houver probabilidade de criar amostras de grandes conjuntos de dados.
  • Reduzir o intervalo de datas é uma maneira eficaz de evitar a amostragem, pois menos sessões ficam abaixo do limite da conta.
  • Utilizar relatórios padrão sem filtros ou segmentos é a maneira infalível de evitar o data sampling.
  • Solicitar resultados sem amostragem no GA 360 é uma solução alternativa, mas vem com considerações como custo e resultados em tempo real, somente leitura.

O Que É Amostragem de Dados (Data Sampling) no Google Analytics?

Existem dois tipos de amostragem de dados no Google Analytics.

O primeiro tipo é a amostragem de sessões, implementada nos relatórios para essa finalidade do Google Analytics após a coleta dos dados de sessão.

O segundo tipo é a amostragem de coleta de dados, onde os dados coletados pelo seu site ou aplicativo são apenas uma amostra de todos os hits que sua propriedade recebeu.

Isso ocorre antes dos dados serem enviados ao Analytics, portanto, apenas as informações da amostra e não todas que são armazenadas pelo GA.

O principal benefício da amostragem de dados é a geração de relatórios mais rápida.

Você está analisando menos dados (com amostragem de sessão) ou coletando menos dados (amostragem de coleta de dados), portanto, o tempo de processamento é reduzido.

Para entender quando e por que a amostragem de dados pode ocorrer, é importante entender as duas categorias diferentes de relatórios no GA4 (e anteriormente disponíveis no GAU): relatórios padrão e relatórios ad-hoc.

Relatórios padrão são aqueles que aparecem na barra de navegação esquerda da sua propriedade GA4:

Quando você executa esses relatórios no estado original (ou seja, sem segmentos ou filtros adicionados), o Google Analytics obtém resultados de suas tabelas de dados agregadas. Nesses relatórios padrão, não ocorre amostragem.

Relatórios ad-hoc são relatórios padrão com segmentos, filtros ou dimensões secundárias, ou são relatórios personalizados com dimensões e métricas que não existem nos relatórios padrão. Relatórios ad-hoc estão sujeitos à amostragem.

Quando o data sampling do Google Analytics é aplicada?

De acordo com o Google, “consultas ad-hoc estão sujeitas a amostragem se o número de sessões para o intervalo de datas que você está usando exceder o limite para o tipo de sua propriedade”.

Então, quais são os limites por tipo de propriedade?

Para o tipo de conta Analytics Standard, o limite é de 500 mil sessões no nível da propriedade. Para o tipo de conta Analytics 360, o limite é de 100 milhões de sessões no nível da exibição.

Por que a Amostragem do Google Analytics Pode Ser um Problema para Seus Relatórios

Apesar do benefício de gerar relatórios mais rápidos, o data sampling do Google Analytics pode causar alguns problemas.

O maior inconveniente é a perda de precisão. Isso pode ocorrer tanto para sites pequenos (onde o tamanho da amostra pode ser muito pequeno) quanto para sites grandes (onde o tamanho da amostra se torna menos representativo da sessão média).

Para sites menores, o risco é que o tamanho da amostra seja muito pequeno.

Quando o tamanho da amostra é muito pequeno, você obtém uma representação pobre de todos os dados. Isso é especialmente importante para métricas de desempenho que já são um pequeno subconjunto de sessões, como adição ao carrinho e taxa de conversão.

Para sites maiores, as sessões da amostra podem não ser representativas do usuário médio. É impossível controlar quais dados são amostrados, então outliers podem ser incluídos.

Dito isso, quanto maior o seu site se torna, mais imprecisos seus relatórios tendem a ser.

Há outro risco enfrentado por sites pequenos e grandes, que é a inconsistência entre seus relatórios. Ou seja, alguns relatórios utilizarão dados não amostrados, enquanto outros utilizarão dados amostrados.

Em muitos casos, isso resultará em uma diferença nos números que você vê e, em última análise, nas decisões que toma.

Vamos revisar os dados de um cliente da NP Digital, minha agência de marketing digital, como exemplo dessas inconsistências.

Como a Amostragem Pode Impactar os Dados: Exemplos Reais

Para mostrar a diferença nos números entre dados amostrados e não amostrados, comparamos a mesma expressão regular (regex) usada para isolar páginas de destino quando criada como um segmento versus um filtro avançado.

Primeiro, a regex quando aplicada como um segmento:

Ao aplicar esse segmento para analisar dados de sessões orgânicas de um mês (1º de julho de 2023 a 31 de julho de 2023) em comparação com o ano anterior, obtemos um aumento de 13% (6.754 vs 5.986) ano a ano (YoY):

Quando aplicamos a mesma regex como um filtro avançado, no entanto, obtivemos uma diminuição de 9% (6.012 vs 6.600) YoY:

Como isso é possível?

No primeiro exemplo, ao aplicar a regex como um segmento, vemos dados amostrados. Você pode identificar isso observando o escudo no canto superior esquerdo da página. Nesse caso, o escudo é amarelo, indicando que são dados amostrados. Além disso, está usando apenas 58% das sessões para basear os dados:

No segundo exemplo, ao aplicar a regex como filtro avançado em um relatório padrão, vemos dados não amostrados. Isso é evidenciado pelo escudo verde no canto superior esquerdo.

Então, talvez você esteja se perguntando, como sabemos que estamos comparando coisas iguais? Afinal, é possível configurar incorretamente um segmento ou um filtro avançado, mesmo que aparentemente estejam usando a mesma regex.

Quando verificamos o segmento e o filtro avançado em um único mês, em vez de um único mês comparado ao ano anterior, os números do segmento e do filtro avançado correspondem.

Por quê? Lembre-se que a amostragem do Google Analytics só é aplicada a consultas ad-hoc se o número de sessões para o intervalo de datas que você está usando exceder o limite para o tipo de sua propriedade.

Portanto, quando analisamos um intervalo de datas menor, não excedemos nosso limite e, portanto, os dados não são amostrados.

Aqui está o mesmo segmento regex aplicado apenas a julho de 2023, que mostra 6.012 sessões:

Podemos ver que o ícone de escudo está verde (indicando dados não amostrados) e as sessões se alinham com o regex adicionado ao filtro avançado.

Talvez você esteja pensando: o regex é grande e complexo. Isso pode estar impactando o que vemos?

Embora o exemplo acima seja para um regex maior, isso acontece até mesmo quando se aplica um segmento simples de tráfego orgânico. No exemplo abaixo, a equipe da NP Digital aplicou o segmento de Tráfego Orgânico ao relatório Página de Destino:

Isso ultrapassou o limite de sessões e, portanto, o relatório agora está puxando dados amostrados.

Então, qual é a conclusão?

Se a precisão é importante, não aplique um segmento em conjuntos de dados grandes. Se o conjunto de dados exceder o limite da sua conta, os dados serão amostrados e isso pode levar a imprecisões.

Não tem certeza se seu conjunto de dados será muito grande para o seu tipo de propriedade? Olhe para o escudo.

  • Se estiver verde, não está amostrado e você está obtendo a imagem completa.
  • Se estiver amarelo, está amostrado e o que você está vendo é apenas um subconjunto dos dados.

Dito isso, você deve garantir que os dados exportados do Google Analytics Universal sejam amostrados.

Por quê?

Ao analisar dados, é crucial comparar maçãs com maçãs.

Se sabemos que grandes conjuntos de dados serão amostrados no GA4, então os dados que exportamos do GAU devem ser amostrados para levar isso em conta.

Caso contrário, você estará comparando dados amostrados do GA4 com dados não amostrados do GAU, e suas comparações serão imprecisas como resultado.

O Que Você Pode Fazer Para Evitar Amostragem de Dados no GA?

As melhores maneiras de evitar o data sampling do Google Analytics são reduzir o intervalo de datas e utilizar relatórios padrão.

Ao reduzir o intervalo de datas, você reduz o número de sessões. Se o número de sessões ficar abaixo do limite da sua conta, seus relatórios personalizados não serão amostrados.

A única maneira infalível de evitar a amostragem de dados no GA é utilizar relatórios padrão sem nenhum filtro ou segmento aplicado.

Gerenciando a Amostragem de Dados

Nem sempre é possível evitar a amostragem de dados no GA. Então, o que você pode fazer para gerenciar a amostragem do Google Analytics e garantir a precisão dos relatórios? Existem alguns truques a serem considerados.

Ajuste o Tamanho da População

Se um tamanho de amostra muito pequeno for um risco, então ajustar o tamanho da população pode ajudá-lo a obter resultados mais precisos.

A maneira mais rápida de ajustar o tamanho da população é reduzir o intervalo de datas.

É algo que pode ajudá-lo a evitar a amostragem por completo, ou pelo menos garantir que você esteja obtendo dados mais precisos.

Ajuste o Nível de Precisão (somente GA 360)

Se você possui uma conta GA 360, pode usar o ícone de qualidade de dados para selecionar uma das duas opções que impactarão o tamanho da amostra. De acordo com o Google:

  • Maior precisão: usa o tamanho máximo de amostra possível para fornecer resultados que sejam a representação mais precisa do seu conjunto de dados completo.
  • Resposta mais rápida: usa um tamanho de amostra menor para fornecer resultados mais rápidos.

Solicite Resultados Sem Amostragem (somente GA 360)

Se você possui uma conta GA 360, também pode solicitar resultados não amostrados.

Lembre-se que as explorações não amostradas não são em tempo real, são somente leitura e temporárias. Elas também custam “tokens” para obtê-las.

Portanto, embora não seja a solução perfeita, é uma boa solução alternativa em determinadas situações.

Conclusão

Mesmo que você não possa evitar a amostragem de dados em todos os casos no Google Analytics, você pode minimizar o impacto que ela tem em seus relatórios.

Ao entender o que é data sampling, por que ela é usada e como funciona, você pode começar a modificar seus relatórios do GA para garantir que os dados atendam às suas necessidades.

Melhor ainda, você voltará a ser o mestre dos dados de desempenho do seu site.

Tem dúvidas sobre amostragem de dados no GA? Fale comigo nos comentários abaixo.

Perguntas Frequentes sobre Amostragem de Dados no Google Analytics

O que é amostragem de dados do Google Analytics?

A amostragem de dados do Google Analytics é um método que permite coletar dados mesmo quando o limite da sua propriedade GA é excedido. Significa que dados de uma porcentagem das sessões do seu site são coletados e usados para fornecer insights direcionais e precisos.

Como funciona a amostragem do Google Analytics?

O Google Analytics usa dois tipos de amostragem: amostragem de sessão e amostragem de coleta de dados. Na amostragem de sessão, todos os dados são coletados, mas os relatórios são baseados em apenas uma porcentagem deles. Com a amostragem de coleta, apenas uma porcentagem dos dados do seu site é coletada e os relatórios são criados usando apenas eles como referência.

Quando o Google Analytics usa dados amostrados para relatórios?

Nem todos os relatórios do GA usam dados amostrados. Então, quando os dados amostrados são usados? Os dados amostrados são usados ao criar um relatório ad-hoc que analisa mais sessões do que o limite da sua propriedade permite. Você também pode ver informações amostradas em relatórios padrão ao usar segmentos ou filtros avançados.

Como evitar a amostragem de dados no Google Analytics?

Existem duas maneiras infalíveis de evitar a amostragem de dados no Google Analytics. A primeira é usar apenas relatórios padrão sem adicionar segmentos ou filtros que possam puxar mais sessões do que o limite da sua propriedade permite. A segunda é reduzir o intervalo de datas para que você analise menos sessões.

NP Digital Brasil

Você quer resultados imediatos?

Minha agência pode fazer todo o trabalho pra você. Somos especialistas em:

  • SEO - Colocamos seu site no topo das pesquisas do Google
  • Mídia Paga - Fazemos seu negócio alcançar quem importa no momento certo
  • Data & Conversion Intelligence - Desbloqueamos as conversões do seu site e criamos dashboards para melhores análises

Fale com um especialista

Consultoria com Neil Patel

Ubersuggest

Desbloqueie milhares de palavras-chave com Ubersuggest

Quer superar a concorrência?

  • Encontre palavras-chave de cauda longa com alto ROI
  • Encontre centenas de palavras-chave
  • Transforme buscas em visitas e conversões

Ferramenta gratuita

Neil Patel

About the author:

Neil Patel

Co Founder of NP Digital & Owner of Ubersuggest

Ele é o co-fundador da NP Digital. O The Wall Street Journal o considera como influenciador top na web. A Forbes diz que ele está entre os 10 melhores profissionais de marketing e a Enterpreuner Magazine diz que ele criou uma das 100 empresas mais brilhantes do mercado. O Neil é um autor best-seller do New York Times e foi reconhecido como um dos 100 melhores empreendedores até 30 anos pelo presidente Obama e como um dos 100 melhores até 35 anos pelas Nações Unidas.

Follow the expert:

Compartilhe

Neil Patel

source: https://neilpatel.com/br/blog/data-sampling/