7 důvodů odlišnosti dat zpracovaných z Google Analytics skrze Big Query

manažer sedí před počítačem na kterém jsou promítnuté sloupcové grafy datové analytiky

Troufáme si říct, že většina společností, které provozují webové stránky, využívá také Google Analytics k měření jejich výkonnosti a ke sledování uživatelského chování na webech. Část těchto společností se časem uchýlí také k využití Big Query a dojdou tak do bodu, kdy se všimnou, že data zobrazovaná v rámci Google Analytics a exportovaná do Big Query z větší či menší části nesouhlasí. Na tento nesoulad upozorňuje i samotný Google.

Každou schůzku, kterou absolvujeme s marketingovým oddělením, které tato řešení využívá, se věnujeme vysvětlení, odkud rozdíly v datech pramení, a jak k nim přistoupit. Vzhledem k tomu, jak často je tato otázka řešena, nabízíme v rámci tohoto článku nejzákladnější vysvětlení těchto rozdílů a nabízíme také cestu, jak těchto rozdílů využít ve svůj prospěch. 

Nejdříve je vhodné zopakovat, k čemu oba nástroje slouží, protože rozdíly ve zpracování dat plynou již ze samotného účelu těchto nástrojů. Big Query je cloudový datový sklad od společnosti Google, který slouží pro rychlé zpracování a analýzu velkého objemu dat s pomocí dotazů SQL. Tento nástroj umožňuje efektivní analýzu velkých dat v reálném čase. Oproti tomu Google Analytics je nástroj, který je využívaný pro sledování a analýzu webu nebo mobilních aplikací a poskytuje uživatelům informace ohledně chování uživatelů na webu (vč. možnosti mapovat efektivnost marketingových kampaní). 

Big Query tedy umožňuje zpracovat velké objemy dat bez nutnosti nákladnější správy datové infrastruktury, rychle zvládá zpracovat velké objemy dat a lze ho snadno propojit s dalšími datovými zdroji a nástroji (např. s CRM firmy). Nevýhodou ale je, že je zde potřebná znalost SQL a porozumění datovým strukturám. V rámci Google Analytics nejsou tyto znalosti potřebné, protože je zde vytvořeno intuitivní a snadno použitelné uživatelské rozhraní, které nabízí širokou škálu metrik pro analýzu výkonnosti webu. Na druhou stranu zde mohou být data omezená a vzorkovaná a mohou být ovlivněna blokování cookies nebo nastavením soukromí uživatelů, což může vést k zobrazení zkreslených dat v rámci rozhraní Google Analytics. 

Tedy už z této podstaty vyplývá, že se můžeme setkat s mírnými rozdíly při zpracování dat v rámci těchto nástrojů. V rámci Google Analytics jsou data automaticky zpracovaná tak, aby s nimi uživatel mohl okamžitě pracovat, a toto automatické zpracování podléhá určitým specifikům. V rámci Big Query jsou ale data surová a uživatel si je může dále zpracovat dle vlastního uvážení. Toto je bod, ve kterém mohou odlišnosti v datech vznikat. 

A teď tedy konkrétních 7 důvodů vzniku těchto nesrovnalostí v datech z Google Analytics a Big Query. Je vhodné také zmínit, že rozdíly mohou být větší, menší nebo dokonce i žádné – to se odvíjí od velikosti webu (počtu návštěv) a nastavení Google Analytics a Big Query. 

  1. Zpracování a agregace dat 

Hlavním důvodem nesrovnalostí je rozdíl ve způsobu zpracování a agregaci dat oběma nástroji. Google Analytics provádí automatickou agregaci dat tak, aby bylo možné data rychle a efektivně zobrazit v rámci uživatelského rozhraní. Může zde probíhat zaokrouhlování, odhadování nebo vyřazení některých dat, což vede ke vzniku odchylek. Big Query ale pracuje s neagregovanými surovými daty, což umožňuje podrobnější pohled na data, ale také vytváří prostor pro vznik rozdílů oproti datům automaticky agregovaným. 

  1. Blokace cookies

Pokud si uživatel zablokuje cookies na vašem webu, vede to k omezení sbíraných dat. Google Analytics tak může shromažďovat neúplná data o návštěvnosti webu. Big Query oproti tomu obsahuje i data neúplná nebo některé informace o těchto uživatelích, které nejsou v rámci Google Analytics obsaženy. V případě Big Query je tedy možné pracovat s komplexnějšími daty. V rámci Google Analytics mohou být naopak chybějící data odhadována a statisticky dopočítána nebo zcela vynechána. 

  1. Sampling 

Google Analytics využívá ve svém rozhraní tzv. sampling neboli vzorkování dat. Může zpracovávat pouze reprezentativní vzorek dat, ze kterého může odvozovat zbylé chování uživatelů na webu. Tímto způsobem je zajištěna nižší zátěž serveru a vyšší výkonnost systému Google Analytics. V rámci Big Query se sampling neuplatňuje, a tedy zde najdeme veškerá data, a ne pouze data statisticky odvozená z reprezentativního vzorku. Nesrovnalosti vlivem samplingu vznikají zejména na webech s vyšším počtem uživatelů. 

  1. Identifikace uživatelů

V rámci Google Analytics jsou uživatelé sledovaní skrze cookies, ale v rámci Big Query je možné je sledovat dle ID či jiným způsobem, což může vést k odlišnému počtu unikátních uživatelů vlivem toho, že v rámci Big Query lze odhalit také uživatele, kteří mohou mít omezené sledování v rámci webu. Tedy v rámci Big Query můžeme sledovat uživatele všechny a alespoň číst jejich chování na webu, a to i v případě, kdy si nepovolí cookies. 

  1. Konfigurace a uživatelské nastavení

V rámci Google Analytics můžeme mít různé nastavení filtrů, segmentů nebo i cílů. Pokud toto nastavení neodráží export dat do Big Query, může to vést ke vzniku nesrovnalostí. Naštěstí lze tento faktor eliminovat při kvalitní práci s nastavením exportu dat.

  1. Limitace Google Analytics ve vztahu k surovým datům

Google Analytics má vestavěná omezení ve zpracování a zobrazení dat, která mohou vést k rozdílům oproti Big Query. Google Analytics často omezuje hloubku historických dat nebo množství dat zobrazených v jednotlivých sestavách. Zatímco Google Analytics poskytuje data typicky za posledních 90 dní, Big Query umožňuje přístup k celé historii akumulovaných dat. Google Analytics aplikuje interní filtry a algoritmy na data pro optimalizaci výkonu a uživatelské zkušenosti, což může ovlivnit přesnost a úplnost zobrazených dat. Big Query na druhé straně umožňuje přístup k surovým, nefiltrovaným datům.

  1. Přístup k uživatelsky definovaným a vlastním metrikám

Google Analytics a Big Query se liší ve schopnosti uživatele definovat a přizpůsobit metriky. V Google Analytics jsou uživatelé omezeni na předdefinované metriky a dimenze, které platforma poskytuje. Uživatelé mají omezené možnosti pro vytváření vlastních metrik nebo upravování stávajících. Big Query naopak poskytuje flexibilnější prostředí, kde uživatelé mohou vytvářet složité dotazy a definovat vlastní metriky podle svých potřeb. Tato rozšířená funkcionalita umožňuje uživateli provádět detailnější a specifičtější analýzy, což může vést k odlišným výsledkům oproti standardním metrikám GA.

Každý web a firma jsou specifické a chování jejich návštěvníků na webu, nastavení Google Analytics a tedy i odchylky v datech mohou být různé. Důležité je zejména komplexní porozumění vlastním datům a nastavení obou platforem, které vede k tomu, že firmy nebo uživatel získají z dat odpovědi, které potřebují. 

Veškeré výše zmíněné rozdíly zmiňuje také samotný Google a můžete si o nich více přečíst zde. V rámci tvorby tohoto článku jsme vycházeli nejen z oficiální dokumentace a doporučení Google, ale především z vlastních zkušeností z práce s těmito nástroji. 

V rámci pokročilejší datové analytiky doporučujeme kombinovat využití Google Analytics a Big Query. Touto kombinací lze totiž získat ten nejvíce ucelený pohled na data a přijmout tak kvalitnější rozhodnutí nejen v oblasti marketingu. Google Analytics doporučujeme využívat jako základní přehled o uživatelském chování a Big Query poté doporučujeme pro hloubkovou analýzu dat včetně možnosti napojení na další datové zdroje společnosti (např. na CRM). Analytik je tímto způsobem schopen lépe datům porozumět, identifikovat různé trendy a provádět komplexní analýzy. 

K využívání Big Query poté doporučuje přistoupit v bodě, kdy je web větší a generuje větší množství dat. Pokud se společnost rozhodně využívat machine learning nebo predikční modelování dat, poté považujeme Big Query za nezbytnost. Pokud máte k této problematice dotaz nebo se chystáte toto řešení ve vaší společnosti zavést, můžete se nám ozvat skrze formulář níže a rádi vám s implementací i analýzou webových dat pomůžeme.

skupina manažerů konzultuje u kulatého stolu
Jsme tu pro Vás

Chcete konzultaci zdarma?

Bez jakýchkoli závazků. Podepíšeme si mlčenlivost a můžete s námi probrat cokoli budete potřebovat ohledně Vašich dat.