Asi už jste si všimli, že po nasazení cookie lišt po tzv. Cookie apokalypse vám chybí v Google Analytics podstatná část dat. Pokud jste typicky eshop a vyhodnocujete výkon dle Google Analytics, je založeno na velký problém. GA podměřovala tak nějak odjakživa a s cca 10% výpadkem dat jsme byli všichni zvyklí počítat. Nyní vám ale může chybět i 30 % dat a to už může vaše rozhodování o řízení kampaní fatálně ovlivnit.
Jak to celé ne/funguje a jak k situaci přistupovat z pozice PPC specialisty popisuje velmi hezky a srozumitelně Peťa Větrovka na svém blogu, ona byla vždy přes čísla 🙂 Já bych se rád zaměřil na technickou část věci.
Když jsme se na podzim 2021 nad problémem výpadku dat zamýšleli s klienty a kolegy napadlo nás poměrně jednoduché řešení. Vyžaduje to jednoduchý CSV soubor z CRM/e-shopu klienta s datem a reálným zaznamenaným obratem z e-shopu za daný den a trošku počítání ve Spreadsheetu nebo v BigQuery.
Princip je snadný. Vezmeme reálný obrat v daný den a vydělíme ho obratem z GA. Tak získáme na úrovni dne DayRate, který nám říká kolik tržeb nám v GA chybí. Tímto DayRate pak tržby v GA nejlépe na úrovni kampaně násobíme.
Reálná tržba z CRM / Tržba z GA = mělo by vyjít číslo větší než 1
Ve výpočtu této denní konstatny tkví celé kouzlo. Jednoduše tak zjistíme o jak velký podíl tržeb jsme přišli. Je to dobré kontrolní číslo i pro posouzení výkonu různých typů cookie lišt. Pak už je to jen o výpočtech. V první fázi jsem zkoušel výpočty udělat ve Spreadsheetu. Pro menší eshopy to funguje bez problému, ale u větších byl problém s objemem dat a vzorkováním Google Analytics – tam jsem již zapojil BigQuery.
Jak na CSV
Nejlepší řešení jak CSV získat se nakonec ukázal obyčejný e-mail. CRM pošle každý den email ve tvaru Datum, Reálná tržba, (případně počet transakcí) na Gmail účet. Script pak přiložené CSV zpracuje a vloží do Spreadsheetu. Mně napsal skript Standa Jílek – včetně inkrementálního doplňování řádků. Hezké řešení jak CSV zpracovat pomocí Integromatu (včetně importu do BigQuery) popsal Dan Zrůst.
Záměrně se nezamotávám do tématu započítávání vratek a storen. Nicméně základ je posílat v CSV tržby bez DPH, pošty atd. A dodržet formát data ve formátu YYYY-MM-DD nebo si datum správně naformátovat. Nezapomeňte si na začátku data v CSV pečlivě zkontorlovat zda sedí proti e-shopu. Cílem je co nejvíce simulovat chování GA – tedy reálné tržby za daný den na e-shopu (nezajímají vás například prodejny atd).

Spreadsheet
Než se ukázalo, že Spreadsheet není pro větší klienty vhodný, sestavil jsem celou logiku v něm. Pokud provozujete střední eshop měl by vám Spreadsheet stačit. Přikládám odkaz kde si můžete Vše zkusit na vlastním webu. Na vyzkoušení vám stačí ručně vložit CSV do záložky RevenueCSV a zbytek přes Google Analytics Ad-on stáhnout z Google Analytics. Automaticky se vám dopočítají data pro všechny zdroje ne jen pro PPC.
- Vložte do záložky RevenueCSV data z vašeho CSV (zachovejte pořadí sloupců a pozor na formát data YYYY-MM-DD)
- Potřebujete mít Add-on Google Analytics pro Spreadshhety
- V záložce Report Configuration doplňte ID vašich GA (označeno červeně)
- Stáhnětě data z GA přes Add-on
- Do záložky DataStudio se vám pak načtou data připravená pro vizualizaci v datastudiu

Big Query
Po experimentech se Spreadsheetem jsem se dostal k řešení přes BigQuery. Což je robustní databáze od Google. 10 GB ukládaných dat měsíčně a 1 TB zpracovaných dat za měsíc je zdarma. Mně se zatím nepodařilo neplacený režim překonat.

Největší problém byl jak data z GA a CSV do BigQuery dostat. Naštěstí jsem dostal tip na skvělé rozšíření pro Spreadsheety – BigQuery uploader for Sheets od https://mythicalreports.com to úplně změnilo situaci. Snadný upload dat, který jde navíc časovat, takže vše probíhá naprosto automaticky.

Pokud máte data z GA v BigQuery, tak už jen stačí vše napočítat úplně stejně jak v předchozím příkladu a vyplivnout data do finální tabulky, kterou opět vizualizujete v Data Studio. Jen jsem musel trošku oprášit základní znalosti SQL.

Odpadá vám navíc problém se vzorkováním dat z GA, přehledy v DataStudio se krásně zychlí. DataStudio dotazy na BigQuery automaticky cachuje.

V BiqQuery jednoduše načasujete výpočty nad tabulkami, a data máte každý den napočítána čerstvá a přesnější než kdy dřív.
A jak řešíte Cookie apokalypsu vy?
Účelem článku nebylo ukázat postup krok za krokem, ale nastínit možná řešení jak z cookie průšvihu ven. Inspirovaly mně k tomu množící se dotazy v PPC skupinách co s tím.
V budoucnu nám můžou pomoci GA4 a modelace dat. Případně lépe vymyšlený zákon, než ten stávající. Nyní nám, nezbývá než pracovat s tím co máme.
Upřímně by mě zajímalo, jaké další postupy jste při řešení výpadku dat z GA řešili. Zahlédl jsem řešení přes Measurement protocol, případně přepočet počtu kliků z Ads na kliky v GA. Dejte mi vědět mailem nebo třeba v komentářích.
Poděkování
Za inspiraci, rady a tipy děkuji kolegům: Tomáš Hanáček, Jiří Mařík, Dan Zrůst, Standa Jílek, Radim Hodura a Petra Větrovská.