Product Philosophy

Son Yazılar


Regresyon Analizi İle Google Ads Performansınızı Artırın

Basit bir makine öğrenmesi tekniği olan regresyon analizi ile dijital dünyadaki reklamlarınızdan daha fazla gelir elde etmek için basit bir rehber.

Murat OvaMurat Ova

Google reklamlarında akıllı teklif stratejileri ve otomasyonların pazarlama dünyasına hakim olmasından bu yana online reklam dünyasında başarılı olmak için, herkesin yaptıklarının bir adım ötesine geçmeniz ve sistemin işleyiş modellerine yeni açılardan yaklaşmanız gerekmektedir.

Arama moturu reklamcılığı (search engine marketing) performansınızı daha yukarı taşımanın yollarından birisi de gelişmiş bir istatistiki analiz olan regresyon yöntemidir. Regresyon temel bir makine öğrenmesi (machine learning) modeli ve görece basit bir matematiksel uygulamadır. Reklamlarınızı optimize ederken regresyon ve benzeri makine öğrenmesi temelli analizler yapmak; varsayımlar üzerinden öznel tahminlerde bulunmak ve karar almak yerine, verilerinizden daha bilimsel tahminler yapmaya ve gerçekçi sonuçlar üzerinden optimizasyonlar gerçekleştirmenizi sağlar.

Regresyon tanım itibariyle kulağınıza biraz zor gibi geliyor olabilir fakat matematik dünyasında o kadar da gelişmiş bir yöntem sayılmaz, gerçekleştirmesi görece kolay bu analiz için formülü ve yöntemi bilmek reklamcılar için yeterli olabilir.

Kampanya bütçelerini düzenleyerek elde edebileceğiniz dönüşüm hacmini tahmin etmek için google reklamlarınızda regresyon yöntemini inceleyeceğiz, modeli oluşturmak ve uygulamak sandığınız kadar zor değil.

Regresyon Nedir?

Regresyon analizi genel olarak iki değişken (variable) arasındaki ilişkiyi açıklamak (explanation) ve tahmin etmek (prediction) için kullanılmaktadır, regresyon analizi değişkenlerin geçmiş verilerini baz alarak gelecekte ne gibi sonuçlar elde edilebileceğini de tahmin ederek öngörüsel (predictive) analiz yapmamıza da yardımcı olmaktadır.

Dijital pazarlama dünyasındaki kullanım alanlarından yola çıkarak şu an için regresyonun iki farklı versiyonunu incelemek pazarlamacılar ve reklamcılar için yeterli olabilir.

Basit Regresyon Analizi (Simple Linear Regression Analysis)

Bağımlı bir değişken (dependent variable) ve bağımsız bir değişken (independent variable) arasındaki ilişkiyi inceler, ortaya çıkan ilişki doğrusal bir denklem ile tanımlanır.

Çoklu Regresyon Analizi (Multiple Regression Analysis)

Bağımlı bir değişken (dependent variable) ve birden fazla bağımsız değişken (independent variable) arasındaki ilişkiyi inceler.

Regresyon Formülü

Regresyon Formülü
Regresyon Formülü

Regresyon Doğrusu

Aşağıdaki grafikte (X ve Y eksenleri), bağımsız bir değişken olan “cost” (Google reklamlarının günlük harcaması) ve bağımlı bir değişken olan “conversions” (reklamların getirdiği günlük dönüşüm sayısı) arasındaki ilişki bir doğru ile gösterilmektedir. Regresyon doğrusunu iki değişken arasındaki ilişki üzerinden gözlemledik, şimdi doğru üzerinde 600 TL seviyesindeki maliyetin, çizgi üzerinde 100 dönüşümle kesiştiğini söyleyebiliriz.

Dolayısıyla veriler üzerinden elde ettiğimiz regresyon modeline dayanarak, eğer 600 TL harcama yaparsak 100 dönüşüm alabileceğimizle ilgili tahmin yürütebiliriz.

Scatter - Cost vs Conversions

Bu yazı hazırlanırken regresyon modellerinin çoğu test edilip karşılaştırıldı ve dijital reklamlar üzerine uygulayıp verim almak için gerekli en temel modeller kurgulandı.

Özellik / Değişken Seçimi (Feature Selection)

Çoklu regresyon; birden fazla bağımsız değişkenin bağımlı bir değişkene olan etkisini öngörmek için kullanıldığı yöntemdir. Google reklamlarında dönüşümlerin en güçlü etkileyicisi olan bağımsız değişkeni öngörmek zor değil, yapılan analizlerde cost (maliyet) değişkeni en yüksek etkiye sahip değişken olarak öne çıkmaktadır.

Regresyon dışındaki modellerde de, gün bazındaki maliyet ve dönüşüm verilerini geçmiş veri olarak (öğrenme verisi) sunup, değişkenler arasındaki ilişkiyi analiz etmek istediğimizde de maliyet hâlâ en önemli etken değişken olarak yer almaktadır, dolayısıyla analizimizi bu bağımsız değişkeni temel alarak gerçekleştireceğiz.

Root Mean Square Error (Kök Ortalama Kare Hatası)

Root Mean Square Error Formula

RMSE; çoklu regresyon mantığıyla çalışan makine öğrenmesi modellerinde, tahminleyicinin (predictor) tahmin ettiği değerler ile gerçek değerler (öğrenme verisi) arasındaki uzaklığın bulunmasında kullandığımız, modelin hata payının büyüklüğünü temsil eden ölçüttür.

Aşağıdaki tabloda, farklı machine learning (makine öğrenmesi) modellerinin “Root Mean Square Error” (Kök Ortalama Kare Hatası) ölçütü gösterilmektedir.

Türkçe Karar Ağacı K En Yakın Komşu Doğrusal Regresyon Rassal Orman Destek Vektör Regresyonu
İngilizce Decision Tree K Nearest Neighbours Linear Regression Random Forest Support Vector Regression
RMSE
(Tüm Değişkenler)
1.51 1.61 1.77 1.24 1.84
RMSE
(Maliyet Hariç)
2.98 1.50 3.12 2.18 1.83

RMSE metriği ne kadar düşükse modelimizin tahmin edeceği sonuçlar için o kadar iyi olur, hatanın düşüklüğü modelimizin verileri iyi öğrenebildiğini gösterir ve tahminleme için kullanacağımızda daha doğru sonuçlar vereceğini öngörür.

Tüm Özellikler (Google Ads Değişkenleri): Day of Week, Keyword, CTR, CPC, Device, Final URL (landing page), Ad Position ve Cost.

Cost değişkeninin conversion’ları tahmin etmek üzerindeki etkisini 5 farklı makine öğrenmesi modeli kullanarak test ettik, model oluştururken kullandığımız algoritmalarımız sırasıyla: Decision Tree, K Nearest Neighbours, Linear Regression, Random Forest ve Support Vector Regression şeklindedir.

Modellerin test edilmesi ve karşılaştırılması esnasında Cost değişkeninin hariç tutulması çoğunlukla hata değerini diğer özelliklerin hariç tutulmasına kıyasla daha fazla artırmıştır. Bu durum, reklam maliyeti değişkeninin modelin doğru sonucu tahmin etmesinde en önemli etken olduğunu ve kullanılmazsa modelin gerçekleşme ihtimali düşük tahminler üretmesine neden olacağını gösterir.

Yukarıdaki sonuçlara bakarak Random Forest algoritması ile oluşturduğumuz modelin, Conversions değişkeni dahil edilerek gerçekleştirilen model karşılaştırma testinde, RMSE metriğine göre en iyi performansı gösterdiğini söyleyebiliriz. Conversions değişkenine etki eden diğer (bağımsız) değişkenlerin önem derecesini de, en iyi performansı gösteren modelin bağımlı değişken (Conversions) üzerindeki etkisini gösteren Değişken Önem Analizi (Variable Importance Analysis) üzerinden incelemek mümkün.

Variable Importance Analysis

Değişken önem analizi sonrası bağımlı Conversions değişkenini etkileyen en önemli değişkeni bağımsız Cost değişkeni olduğunu görmekteyiz, bu bizler için pek sürpriz olmasa gerek, bu yüzden yazımızda dönüşüm hacmini tahminlemek için reklam maliyeti değişkenini kullanacağız.

Google Ads Verileriyle Doğrusal Regresyon Modeli Oluşturun

Şimdi ise bir maliyet belirterek, belirttiğimiz maliyete göre bu girdinin ne kadarlık dönüşüm getirebileceğini tahminlemek için kullanacağımız regresyon modelini oluşturmak için, bağımsız değişken olan “Daily Cost” (Günlük Maliyet) ve bağımlı değişken olan “Daily Conversions” (Günlük Dönüşümler) metriklerini içeren bir regresyon modelinin nasıl oluşturulacağını göreceğiz.

Regresyon modelimizi gerçekleştirmesi oldukça kolay 5 adımda tamamlayacağız.

Adım 1: Google Ads Raporu Oluşturma

Google Ads’e giriş yaptıktan sonra üst menü üzerinden sırasıyla aşağıdaki hiyerarşiyi takip ediniz.

Türkçe:
Raporlar >> Önceden Tanımlanmış Raporlar >> Saat >> Gün

İngilizce:
Reports >> Predefined Reports (Dimensions) >> Time >> Day

Google Ads Raporu

Adım 2: Raporu Hazırlayın ve İndirin

Aşağıdaki raporu görüntüledikten sonra, columns (sütunlar) butonuna tıklayın, ardından Cost ve Conversions (işaretli sütunlar) dışındaki tüm sütunları kaldırın. Daha sonra incelemek istediğiniz tarih aralığını seçin ve son olarak raporu “Excel .csv” formatında indirin.

Google Ads Rapor Sütunları

Adım 3: Excel’de Scatter Chart Oluşturun

Excel dosyasını açarak Costs ve Conversions sütunlarını seçin, daha sonra üst menüdeki ekle (insert) alanına tıklayarak dağılım grafiği (scatter graph) chart tipini seçin.

Excel Scatter Chart

Adım 4: Scatter Chart’ta Regresyon Doğrusu Oluşturun

Eklemiş olduğunuz scatter chart’ın üstüne tıklayarak üst menüdeki tasarım (design) sekmesine geçiş yapın, bu menüde grafik öğesi ekle (add chart element) alanı üzerine gelip, eğilim çizgisi (trend line) seçeneklerinden doğrusal (linear) çizgiyi seçiniz.

Excel Doğrusal Trend

Adım 5: R2 Kullanarak En İyi Regresyon Doğrusunu Çizin

R-kare (R-squared) Nedir?

R2; doğrusal regresyon modelleri için tahmin performansını temsil eden ölçüttür. Bu metrik, bağımsız değişkenin bağımlı değişkeni etkilediği durumların yüzdesel hacmini açıklar, bağımsız değişkenle bağımlı değişken arasındaki ilişkinin gücünü 0-100% aralığında gösterir.

R2 değeri 100%’e yaklaştıkça ilişkinin çok güçlü olduğunu söyleyebiliriz, bu durumda model üzerinden gerçekleştirilecek tahminlerin doğruluk oranı da iyi performans gösterecektir. Metriğin düşük değerlere sahip olduğu durumlar sapma miktarının (standard deviation) yüksek olduğunu gösterir.

Excel raporumuzdaki trend çizgisine iki kere tıklayarak doğru seçeneklerini görüntüleyebilirsiniz, bu menüden Logaritmik (logarithmic) seçeneğini işaretleyiniz, daha sonra seçenek menüsünün en altındaki “Grafik üzerinde denklemi görüntüle” (Display Equation on chart) ve “Grafik üzerinde R-kare değerini göster” (Display R-squared value on chart) onay kutularını da işaretleyiniz.

Excel Doğrusal Trend Seçenekleri

Tahminleme: Regresyon Denklemi İle Tahmin Yapın

Oluşturduğumuz regresyon doğrusu verileri yorumlamak için son derece kullanışlıdır. Görsel bir bakış açısıyla bile, beklenen günlük dönüşümlerin maliyetinin noktalar üzerinde hangi miktara geldiğini görebilmekteyiz.

Bu analiz işlemi görsel olarak yapılabilir olsa da, R2 değerini ve içerisinde barındırdığı sapmaların modelin güven aralığını etkilediğini düşünürsek, tahminlerimizi ortaya çıkan regresyon formülü üzerinden gerçekleştirmenin daha doğru olduğunu söyleyebiliriz.

Aşağıdaki görselde, regresyon formülünü daha büyük bir şekilde görmektesiniz, denklem y = 56.901 * ln (x) – 247.93 şeklinde açıklanmıştır.

Y değişeni denklemde dönüşümleri temsil ederken X değişkeni ise maliyeti temsil eder. Herhangi bir X değeri verdiğinizde Y‘yi tahmin etmek için, formülde X‘i gerçek bir sayı ile değiştiririz.

2000 TL tutarında bir reklam harcaması yapacağımızda Y’nin sonucunu bulmak için Y = 56,901 * ln(2000) – 247,93 şeklinde bir denklem kurarız.

Formülü bir hesap makinesinde hesaplarsak 2000 TL maliyet (cost) karşılığında günde 184 dönüşüm (conversion) almamız beklenmektedir.

Siz de bilimsel bir hesap makinesi kullanarak ya da formülü Google’da aratarak, arama sonuçlarındaki hesap makinesi ile sonucu hızlıca görüntüleyebilirsiniz.

Google Hesap Makinesi Regresyon Denklemi

R2 değerinin modelin güvenilirlik oranını temsil ettiğini düşünerek, gerçekleşecek sonuç ve tahminimiz arasında 70% doğruluk olacaktır.

Regresyonu kullanarak Google Ads hesabınızda campaign (kampanya), ad group (reklam grubu) ve keyword (anahtar kelime) bazında analiz gerçekleştirebilir, model tahminleri doğrultusunda maliyet optimizasyonu ve bütçe alokasyonu gerçekleştirebilirsiniz.

Regresyon Analizinin Kritiği

Regresyon analizinin geçmiş verilerinizi öğrenerek (train data) tahmin ürettiğini unutmamak gerekiyor, verilerinizdeki sapma miktarının hacmi doğru bir model oluşturmanızı etkileyecektir, dolayısıyla satışların beklenenden fazla ya da düşük gerçekleştiği özel günleri (tatil, black friday, rakip aksiyonları, büyük indirimler gibi) hazırladığınız veri setinden çıkarmak ya da ortalamalar ile adjust (manipüle) etmek, modelin güvenilirliğini artıracaktır.

Regresyon Analizinin Faydaları ve Örnek Uygulamalar

Yukarıdaki methodları kullanarak kendinizin ya da müşterilerinizin Google Ads hesaplarında 3 farklı türde pozitif sonuç elde edebilirsiniz.

Kapanış Notları

Dijital dünya üzerinden hedef kitlesine ulaşmaya çalışan büyük bir oyuncuysanız, görece basit bir makine öğrenmesi temelli analiz olan doğrusal regresyon problemlerinizi çözmekte yetersiz kalacaktır.

Büyük problemlerin çözümü ve yüksek performans gerektiren pazarlama hedefleri için Excel’de gerçekleştiremeyeceğiniz kadar gelişmiş yöntemler olan; kümeleme (clustering), çoklu regresyon (multiple regression) ve sınıflandırma (classification) gibi derin analizleri gerçekleştirmelisiniz. Bu analizleri gerçek zamanlı (real time) olarak gerçekleştirerek ve sonuçlar üzerinden API‘lar ile pazarlama kanallarınızı yöneterek, bütçenizi optimal performansla kullanabilir ve yeni çağın prensipleriyle rekabet seviyesini yükseltebilirsiniz.

Yazı ile ilgili sorularınız veya danışmanlık talepleriniz için LinkedIn üzerinden iletişime geçebilirsiniz.

Sonraki yazıda görüşmek üzere.

12+ yıl deneyimli full stack yazılım mühendisi, kantitatif analist ve dijital pazarlama uzmanı.

Büyük perakendecilerin dijital dünyadaki kompleks büyüme hedefleri için insan doğası ve kar maksimizasyonu odaklı müşteri deneyimi ile yapay zeka tabanlı karar destek sistemleri (Decision Support Systems) geliştirmektedir.

Apple / Tesco / L’oreal / Carrefour / Trendyol / Vestel / Boyner / Doğan Grubu / DeFacto / ETS Tur / Morhipo / Anadolu Sağlık / Pronet / Koçtaş ve daha birçok FMCG/Perakende/Hizmet/E-ticaret markasının, dijital kanalarında veri analisti ve full-stack performans danışmanı olarak yer almıştır.

Şu anda Digital Partners’da Data Science & Growth Analytics Director olarak görev almaktadır, aynı zamanda kendi danışmanlık şirketi olan Stochastic Minds ile, orta doğu menşeili firmalara stokastik veri modelleme danışmanlığı yapmaktadır.

Yorumlar1
  • Gokhan Reisoglu
    Posted on

    Gokhan Reisoglu Gokhan Reisoglu

    CevaplaAuthor

    Eline saglik Murat. Kisa bir yorum yapayim; keske R-Kare ya da p-value degeri her durumda bekledigimiz yuzdede gerceklesebilse. Bazen 0.5 (r-kare) bile gorsek kendimizi sansli hissediyoruz. Tahminleme modellerinde daha fazla degiskenin formulize edilmesi gerekmekte, ozellikle adwords icin. Her zaman olabildigince uzun bir tarih araliginda data indirmek en temizi. Tahminleme yapmadan once data setteki iki farkli degisken arasindaki korelasyonu bakiyorum her zaman, eger r yuksekse o zaman tahminlemeye guvenim artiyor. Tabi auction ve competition kontrol edemedigimiz degiskenler maalesef, ama yine de herkesin kullanmasi gereken equitation modelleri bunlar. Cok guzel, bravo.