Istatistikte ortalamalar kaça ayrılır?

İstatistikte Ortalamalar: Neye Göre Yargılayacağız?

Merhaba! İstatistikte ortalamaların aslında tek bir kalıba sığmadığını biliyor muydun? Bir veri setini anlamak için hangi "tip" ortalamayı kullanacağımız, elde edeceğimiz sonucun doğruluğunu doğrudan etkiliyor. Deneyimlerime göre, bu ayrımı iyi bilmek, veriye daha sağlam bakmamızı sağlıyor. Hadi gel, bu ortalamaların dünyasına bir dalalım.

Aritmetik Ortalama: En Bildiğimiz Dostumuz

Bu, hepimizin okul sıralarından tanıdığı, en yaygın kullanılan ortalama türü. Bir veri setindeki tüm değerleri toplayıp, veri sayısına bölerek bulunur. Örneğin, bir öğrencinin beş dersten aldığı notlar 70, 80, 90, 75, 85 ise; aritmetik ortalamayı şu şekilde hesaplarız: (70 + 80 + 90 + 75 + 85) / 5 =

  1. Yani öğrencinin genel not ortalaması 80.

Ne zaman kullanmalı? Veri setinde aşırı uç değerler (outlier) olmadığında ve her bir verinin eşit ağırlıkta olduğu durumlarda idealdir. Mesela bir grup insanın yıllık gelirini topladığımızda, birkaç milyarderin olması ortalamayı ciddi şekilde şişirebilir. İşte bu tür durumlar için başka ortalamalara bakmak daha mantıklı olabilir.

Medyan: Ortadaki Adam

Medyan, bir veri setini küçükten büyüğe doğru sıraladığında tam ortada kalan değerdir. Eğer veri setinde çift sayıda eleman varsa, ortadaki iki elemanın aritmetik ortalaması alınır. Yukarıdaki öğrenci notları örneğini ele alalım: 70, 75, 80, 85,

  1. Burada tam ortada kalan değer
  2. Yani medyan da 80.

Ne zaman kullanmalı? Aritmetik ortalamanın aksine, medyan aşırı uç değerlerden etkilenmez. Gelir dağılımı gibi çarpık dağılımlarda medyan, grubun "tipik" değerini daha iyi yansıtır. Diyelim ki bir mahallede 100 kişinin gelirine baktık. 99 kişi 10.000 TL kazanırken, bir kişi 1.000.000 TL kazanıyorsa, aritmetik ortalama yüksek çıkacaktır ama medyan, o mahalledeki insanların çoğunluğunun ne kadar kazandığına dair daha gerçekçi bir fikir verir.

Mod: En Çok Tekrarlanan

Mod, bir veri setinde en sık tekrarlanan değerdir. Bir veri setinin birden fazla modu olabilir (çok modlu) veya hiç modu olmayabilir. Örneğin, bir sınıftaki öğrencilerin en sevdiği renkler şöyle olsun: Kırmızı, Mavi, Yeşil, Kırmızı, Sarı, Mavi, Kırmızı. Burada en sık tekrar eden renk Kırmızı, bu yüzden mod Kırmızı'dır.

Ne zaman kullanmalı? Kategorik verilerde (renkler, cinsiyet, meslek gibi) veya hangi değerin en popüler olduğunu görmek istediğimiz durumlarda kullanılır. Bir ürünün en çok hangi bedende satıldığını anlamak için mod, harika bir başlangıç noktasıdır.

Hangisini Seçmeli? Pratik Bir Bakış

Deneyimlerime göre, hangi ortalamayı kullanacağın tamamen analiz etmek istediğin verinin türüne ve amacına bağlı.

  • Veri setin normal dağılıyorsa ve uç değerler yoksa: Aritmetik ortalama en iyi dostun olur.
  • Veri setinde uç değerler varsa veya çarpık bir dağılım söz konusuysa: Medyan, sana daha gerçekçi bir tablo çizecektir.
  • En yaygın veya en popüler değeri bulmak istiyorsan: Mod, işini görecektir.

Unutma, istatistik bir araçtır ve doğru aracı doğru yerde kullanmak, veriden sağlıklı sonuçlar çıkarmanın anahtarıdır. Verilerine bakarken bu ortalama türlerini aklında tut, farklı açılardan değerlendir.