Product Philosophy

Son Yazılar


Product Philosophy

Regresyon Analizi ile Google Ads Performansınızı Artırın

Basit bir makine öğrenmesi tekniği olan regresyon analizi ile dijital dünyadaki reklamlarınızdan daha fazla gelir elde etmek için basit bir rehber.

Murat OvaMurat Ova

Google reklamlarında akıllı teklif stratejileri ve otomasyonların pazarlama dünyasına hakim olmasından bu yana online reklam dünyasında başarılı olmak için, herkesin yaptıklarının bir adım ötesine geçmeniz ve sistemin işleyiş modellerine yeni açılardan yaklaşmanız gerekmektedir.

Arama moturu reklamcılığı (search engine marketing) performansınızı daha yukarı taşımanın yollarından birisi de gelişmiş bir istatistiki analiz olan regresyon yöntemidir. Regresyon temel bir makine öğrenmesi (machine learning) modeli ve görece basit bir matematiksel uygulamadır. Reklamlarınızı optimize ederken regresyon ve benzeri makine öğrenmesi temelli analizler yapmak; varsayımlar üzerinden öznel tahminlerde bulunmak ve karar almak yerine, verilerinizden daha bilimsel tahminler yapmaya ve gerçekçi sonuçlar üzerinden optimizasyonlar gerçekleştirmenizi sağlar.

Regresyon tanım itibariyle kulağınıza biraz zor gibi geliyor olabilir fakat matematik dünyasında o kadar da gelişmiş bir yöntem sayılmaz, gerçekleştirmesi görece kolay bu analiz için formülü ve yöntemi bilmek reklamcılar için yeterli olabilir.

Kampanya bütçelerini düzenleyerek elde edebileceğiniz dönüşüm hacmini tahmin etmek için google reklamlarınızda regresyon yöntemini inceleyeceğiz, modeli oluşturmak ve uygulamak sandığınız kadar zor değil.

Regresyon Nedir?

Regresyon analizi genel olarak iki değişken (variable) arasındaki ilişkiyi açıklamak (explanation) ve tahmin etmek (prediction) için kullanılmaktadır, regresyon analizi değişkenlerin geçmiş verilerini baz alarak gelecekte ne gibi sonuçlar elde edilebileceğini de tahmin ederek öngörüsel (predictive) analiz yapmamıza da yardımcı olmaktadır.

Dijital pazarlama dünyasındaki kullanım alanlarından yola çıkarak şu an için regresyonun iki farklı versiyonunu incelemek pazarlamacılar ve reklamcılar için yeterli olabilir.

Basit Regresyon Analizi (Simple Linear Regression Analysis)

Bağımlı bir değişken (dependent variable) ve bağımsız bir değişken (independent variable) arasındaki ilişkiyi inceler, ortaya çıkan ilişki doğrusal bir denklem ile tanımlanır.

Çoklu Regresyon Analizi (Multiple Linear Regression Analysis)

Bağımlı bir değişken (dependent variable) ve birden fazla bağımsız değişken (independent variable) arasındaki ilişkiyi inceler.

Basit Doğrusal Regresyon Formülü

$y = a + bx + e$

$y$ = bağımlı değişken (dependent variable)
$a$ = sabit (intercept)
$b$ = çarpan katsayı (slope)
$x$ = bağımsız değişken (independent variable)
$e$ = hata terimi (error term)

Formülde en çok ilgileneceğimiz nokta $b$ katsayısı olacaktır, çünkü $b$ katsayısı $x$ değişkenindeki 1 birimlik artışın $y$ değişkeninde kaç birimlik artışa neden olduğunu gösterecek çarpan katsayısıdır.

Veri Seti: Günlük Dönüşümler ve Maliyetler

Görüntülemek için bu linke tıklayınız.

Regresyon Doğrusu

Aşağıdaki grafikte (X ve Y eksenleri), bağımsız bir değişken olan “cost” (Google reklamlarının günlük harcaması) ve bağımlı bir değişken olan “conversions” (reklamların getirdiği günlük dönüşüm sayısı) arasındaki ilişki bir doğru ile gösterilmektedir. Regresyon doğrusunu iki değişken arasındaki ilişki üzerinden gözlemledik, şimdi doğru üzerinde 4000 TL seviyesindeki maliyetin, çizgi üzerinde 75 dönüşümle kesiştiğini söyleyebiliriz.

Dağılım Grafiği: Dönüşümler (Y) ve Maliyet (X)

Dolayısıyla veriler üzerinden elde ettiğimiz regresyon modeline dayanarak, eğer 4000 TL harcama yaparsak 75 dönüşüm alabileceğimizle ilgili tahmin yürütebiliriz.

Bu yazı hazırlanırken regresyon modellerinin çoğu test edilip karşılaştırıldı ve dijital reklamlar üzerine uygulayıp verim almak için gerekli en temel modeller kurgulandı.

Özellik / Değişken Seçimi (Feature Selection)

Çoklu regresyon; birden fazla bağımsız değişkenin bağımlı bir değişkene olan etkisini öngörmek için kullanıldığı yöntemdir. Google reklamlarında dönüşümlerin en güçlü etkileyicisi olan bağımsız değişkeni öngörmek zor değil, yapılan analizlerde cost (maliyet) değişkeni en yüksek etkiye sahip değişken olarak öne çıkmaktadır.

Regresyon dışındaki modellerde de, gün bazındaki maliyet ve dönüşüm verilerini geçmiş veri olarak (öğrenme verisi) sunup, değişkenler arasındaki ilişkiyi analiz etmek istediğimizde de maliyet hâlâ en önemli etken değişken olarak yer almaktadır, dolayısıyla analizimizi bu bağımsız değişkeni temel alarak gerçekleştireceğiz.

Root Mean Square Error (Kök Ortalama Kare Hatası)

\begin{align*}
RMSE = \sqrt{\frac{1}{n}\Sigma_{i=1}^{n}{\Big(\frac{d_i -f_i}{\sigma_i}\Big)^2}}
\end{align*}

RMSE; çoklu regresyon mantığıyla çalışan makine öğrenmesi modellerinde, tahminleyicinin (predictor) tahmin ettiği değerler ile gerçek değerler (öğrenme verisi) arasındaki uzaklığın bulunmasında kullandığımız, modelin hata payının büyüklüğünü temsil eden ölçüttür.

Aşağıdaki tabloda, farklı machine learning (makine öğrenmesi) modellerinin “Root Mean Square Error” (Kök Ortalama Kare Hatası) ölçütü gösterilmektedir.

TürkçeKarar AğacıK En Yakın KomşuDoğrusal RegresyonRassal OrmanDestek Vektör Regresyonu
İngilizceDecision TreeK Nearest NeighboursLinear RegressionRandom ForestSupport Vector Regression
RMSE
(Tüm Değişkenler)
1.511.611.771.241.84
RMSE
(Maliyet Hariç)
2.981.503.122.181.83

RMSE metriği ne kadar düşükse modelimizin tahmin edeceği sonuçlar için o kadar iyi olur, hatanın düşüklüğü modelimizin verileri iyi öğrenebildiğini gösterir ve tahminleme için kullanacağımızda daha doğru sonuçlar vereceğini öngörür.

Tüm Özellikler (Google Ads Değişkenleri): Day of Week, Keyword, CTR, CPC, Device, Final URL (landing page), Ad Position ve Cost.

Cost değişkeninin conversion’ları tahmin etmek üzerindeki etkisini 5 farklı makine öğrenmesi modeli kullanarak test ettik, model oluştururken kullandığımız algoritmalarımız sırasıyla: Decision Tree, K Nearest Neighbours, Linear Regression, Random Forest ve Support Vector Regression şeklindedir.

Modellerin test edilmesi ve karşılaştırılması esnasında Cost değişkeninin hariç tutulması çoğunlukla hata değerini diğer özelliklerin hariç tutulmasına kıyasla daha fazla artırmıştır. Bu durum, reklam maliyeti değişkeninin modelin doğru sonucu tahmin etmesinde en önemli etken olduğunu ve kullanılmazsa modelin gerçekleşme ihtimali düşük tahminler üretmesine neden olacağını gösterir.

Yukarıdaki sonuçlara bakarak Random Forest algoritması ile oluşturduğumuz modelin, Conversions değişkeni dahil edilerek gerçekleştirilen model karşılaştırma testinde, RMSE metriğine göre en iyi performansı gösterdiğini söyleyebiliriz. Conversions değişkenine etki eden diğer (bağımsız) değişkenlerin önem derecesini de, en iyi performansı gösteren modelin bağımlı değişken (Conversions) üzerindeki etkisini gösteren Değişken Önem Analizi (Variable Importance Analysis) üzerinden incelemek mümkün.

Değişken önem analizi sonrası bağımlı Conversions değişkenini etkileyen en önemli değişkeni bağımsız Cost değişkeni olduğunu görmekteyiz, bu bizler için pek sürpriz olmasa gerek, bu yüzden yazımızda dönüşüm hacmini tahminlemek için reklam maliyeti değişkenini kullanacağız.

Google Ads Verileriyle Doğrusal Regresyon Modeli Oluşturun

Şimdi ise bir maliyet belirterek, belirttiğimiz maliyete göre bu girdinin ne kadarlık dönüşüm getirebileceğini tahminlemek için kullanacağımız regresyon modelini oluşturmak için, bağımsız değişken olan “Daily Cost” (Günlük Maliyet) ve bağımlı değişken olan “Daily Conversions” (Günlük Dönüşümler) metriklerini içeren bir regresyon modelinin nasıl oluşturulacağını göreceğiz.

Regresyon modelimizi gerçekleştirmesi oldukça kolay 5 adımda tamamlayacağız.

Adım 1: Google Ads Raporu Oluşturma

Google Ads’e giriş yaptıktan sonra üst menü üzerinden sırasıyla aşağıdaki hiyerarşiyi takip ediniz.

Türkçe:
Raporlar >> Önceden Tanımlanmış Raporlar >> Saat >> Gün

İngilizce:
Reports >> Predefined Reports (Dimensions) >> Time >> Day

Google Ads Raporu

Adım 2: Raporu Hazırlayın ve İndirin

Aşağıdaki raporu görüntüledikten sonra, columns (sütunlar) butonuna tıklayın, ardından Cost ve Conversions (işaretli sütunlar) dışındaki tüm sütunları kaldırın. Daha sonra incelemek istediğiniz tarih aralığını seçin ve son olarak raporu “Excel .csv” formatında indirin.

Adım 3: Google Sheets’de Scatter Chart Oluşturun

İndirmiş olduğunuz *.csv dosyasını Google Sheets’te görüntüleyerek, Costs ve Conversions sütunlarını seçin.

Daha sonra grafik editörü (chart editor) alanına tıklayarak dağılım grafiği (scatter graph) chart tipini seçin.

Adım 4: Scatter Chart’ta Regresyon Doğrusu Oluşturun

Eklemiş olduğunuz scatter chart’ın üstüne tıklayarak sağ tarafta açılan chart editor (grafik editörü) sekmesine geçiş yapın, bu menüde trendline (eğim çizgisi) seçeneğini aktif hale getirin ve type (trend tipi) seçeneğini linear (doğrusal) olarak seçin.

Ardından label (denklem etiketi) seçeneğini use equation (denklemi kullan) olarak işaretleyin ve son olarak show R2 (r-kare’yi göster) seçeneğini aktifleştirin.

Adım 5: R2 Kullanarak En İyi Regresyon Doğrusunu Çizin

R-kare (R-squared) Nedir?

R2; doğrusal regresyon modelleri için tahmin performansını temsil eden ölçüttür. Bu metrik, bağımsız değişkenin bağımlı değişkeni etkilediği durumların yüzdesel hacmini açıklar, bağımsız değişkenle bağımlı değişken arasındaki ilişkinin gücünü 0-100% aralığında gösterir.

R2 değeri 100%’e yaklaştıkça ilişkinin çok güçlü olduğunu söyleyebiliriz, bu durumda model üzerinden gerçekleştirilecek tahminlerin doğruluk oranı da iyi performans gösterecektir. Metriğin düşük değerlere sahip olduğu durumlar sapma miktarının (standard deviation) yüksek olduğunu gösterir.

Tahminleme: Regresyon Denklemi İle Tahmin Yapın

Oluşturduğumuz regresyon doğrusu verileri yorumlamak için son derece kullanışlıdır. Görsel bir bakış açısıyla bile, beklenen günlük dönüşümlerin maliyetinin noktalar üzerinde hangi miktara geldiğini görebilmekteyiz.

Bu analiz işlemi görsel olarak yapılabilir olsa da, R2 değerini ve içerisinde barındırdığı sapmaların modelin güven aralığını etkilediğini düşünürsek, tahminlerimizi ortaya çıkan regresyon formülü üzerinden gerçekleştirmenin daha doğru olduğunu söyleyebiliriz.

Aşağıdaki görselde, regresyon formülünü daha büyük bir şekilde görmektesiniz, denklem $y = 0.015 * x + 19.9$ şeklinde açıklanmıştır.

Şimdi yazının ilk bölümlerinde açıkladığımız regresyon formülünü tekrar hatırlayalım. Y bağımlı değişkenini açıklamak için kullanacağımız regresyon denklemi $y = a + bx$ şeklinde ifade edilmektedir.

Y değişeni denklemde dönüşümleri temsil ederken X değişkeni ise maliyeti temsil eder. Herhangi bir X değeri verdiğinizde Y‘yi tahmin etmek için, formülde X‘i gerçek bir sayı ile değiştiririz.

2000 TL tutarında bir reklam harcaması yapacağımızda Y‘nin sonucunu bulmak için Y = 0.015 * x + 19.9 şeklinde bir denklem kurarız.

Bu denklemde $a$ sabiti 19.9 değerini alırken, $b$ çarpan katsayısı 0.015 değerini almıştır. $b$ sabiti aynı zamanda $x$’teki 1 birimlik değişimin $y$ üzerindeki etkisini göstermektedir. Bu durumda reklam maliyeti her 1 birim arttığında dönüşümlerde 0.015 birimlik bir artış olacağını söyleyebiliriz. Kaba bir hesapla her 70 TL‘lik reklam maliyeti artışının bize 1 dönüşüm getirebileceğini de düşünebiliriz.

Formülü bir hesap makinesinde hesaplarsak 3600 TL maliyet (cost) karşılığında günde 74 dönüşüm (conversion) almamız beklenmektedir.

Siz de bilimsel bir hesap makinesi kullanarak ya da formülü Google’da aratarak, arama sonuçlarındaki hesap makinesi ile sonucu hızlıca görüntüleyebilirsiniz.

R2 değerinin modelin güvenilirlik oranını temsil ettiğini düşünerek, gerçekleşecek sonuç ve tahminimiz arasında 86% doğruluk olacaktır.

Regresyonu kullanarak Google Ads hesabınızda campaign (kampanya), ad group (reklam grubu) ve keyword (anahtar kelime) bazında analiz gerçekleştirebilir, model tahminleri doğrultusunda maliyet optimizasyonu ve bütçe alokasyonu gerçekleştirebilirsiniz.

Regresyon Analizinin Kritiği

Regresyon analizinin geçmiş verilerinizi öğrenerek (train data) tahmin ürettiğini unutmamak gerekiyor, verilerinizdeki sapma miktarının hacmi doğru bir model oluşturmanızı etkileyecektir, dolayısıyla satışların beklenenden fazla ya da düşük gerçekleştiği özel günleri (tatil, black friday, rakip aksiyonları, büyük indirimler gibi) hazırladığınız veri setinden çıkarmak ya da ortalamalar ile adjust (manipüle) etmek, modelin güvenilirliğini artıracaktır.

Regresyon Analizinin Faydaları ve Örnek Uygulamalar

Yukarıdaki methodları kullanarak kendinizin ya da müşterilerinizin Google Ads hesaplarında 3 farklı türde pozitif sonuç elde edebilirsiniz.

Kapanış Notları

Dijital dünya üzerinden hedef kitlesine ulaşmaya çalışan büyük bir oyuncuysanız, görece basit bir makine öğrenmesi temelli analiz olan doğrusal regresyon problemlerinizi çözmekte yetersiz kalacaktır.

Büyük problemlerin çözümü ve yüksek performans gerektiren pazarlama hedefleri için Google Sheets ya da Excel’de gerçekleştiremeyeceğiniz kadar gelişmiş yöntemler olan; kümeleme (clustering), çoklu regresyon (multiple regression) ve sınıflandırma (classification) gibi derin analizleri gerçekleştirmelisiniz. Bu analizleri gerçek zamanlı (real time) olarak gerçekleştirerek ve sonuçlar üzerinden API‘lar ile pazarlama kanallarınızı yöneterek, bütçenizi optimal performansla kullanabilir ve yeni çağın prensipleriyle rekabet seviyesini yükseltebilirsiniz.

Yazı ile ilgili sorularınız veya danışmanlık talepleriniz için LinkedIn üzerinden iletişime geçebilirsiniz.

Sonraki yazıda görüşmek üzere.

Keep yourself poet.

Yorumlar1
  • Gokhan Reisoglu
    Posted on

    Gokhan Reisoglu Gokhan Reisoglu

    CevaplaAuthor

    Eline saglik Murat. Kisa bir yorum yapayim; keske R-Kare ya da p-value degeri her durumda bekledigimiz yuzdede gerceklesebilse. Bazen 0.5 (r-kare) bile gorsek kendimizi sansli hissediyoruz. Tahminleme modellerinde daha fazla degiskenin formulize edilmesi gerekmekte, ozellikle adwords icin. Her zaman olabildigince uzun bir tarih araliginda data indirmek en temizi. Tahminleme yapmadan once data setteki iki farkli degisken arasindaki korelasyonu bakiyorum her zaman, eger r yuksekse o zaman tahminlemeye guvenim artiyor. Tabi auction ve competition kontrol edemedigimiz degiskenler maalesef, ama yine de herkesin kullanmasi gereken equitation modelleri bunlar. Cok guzel, bravo.