Verilerin Özetlenmesi: Temel Kavramlar ve Örnekli Anlatım
- VestibuloCochlear
- 16 Şub
- 5 dakikada okunur
Bir araştırmada topladığımız verileri analiz etmeden önce, bu verilerin genel bir görünümünü elde etmek isteriz. İstatistiksel analizin ilk aşaması olan verilerin özetlenmesi, örneklemdeki değişken değerlerini tanıma ve anlamlandırma sürecidir. Bu yazıda, nitel ve nicel veri türlerinin nasıl özetleneceğini, hangi istatistiksel değerlerin kullanılacağını ve örneklerle nasıl raporlanabileceğini ele alacağız.

1. Nitel Verilerin Özetlenmesi
Nitel (kategorik) veriler, sınıflama (nominal) ve sıralama (ordinal) ölçeğindeki değişkenlerden oluşur.
Sınıflama ölçeğindeki değişkenler: Cinsiyet, medeni durum, şehir vb.
Sıralama ölçeğindeki değişkenler: Eğitim düzeyi (ilkokul, ortaokul, lise vb.), Likert tipi anket (1: Tamamen katılmıyorum – 5: Tamamen katılıyorum) vb.
Nitel veriler en temel biçimde, örneklemdeki her bir kategorinin sıklık (n) ve yüzde (%) değerleri üzerinden raporlanır. Eğer değişken sıralama ölçeğine sahipse, ek olarak ortanca (medyan) ve çeyrek değerler (özellikle %25 ve %75) ile de özetlenebilir.
1.1. Örnek 1: Çay Tercihleri
Değişken: “Gün içinde en sık tüketilen çay çeşidi”
Kategoriler: Siyah çay, yeşil çay, bitki çayı, diğer.
Diyelim ki, 100 katılımcıdan oluşan bir örneklemde katılımcılara “Hangi çay çeşidini daha sık tüketiyorsunuz?” diye soruldu ve sonuçlar şu şekilde toplandı:
Çay Çeşidi | Frekans (n) | Yüzde (%) |
Siyah Çay | 55 | 55,0 |
Yeşil Çay | 20 | 20,0 |
Bitki Çayı | 15 | 15,0 |
Diğer | 10 | 10,0 |
Toplam | 100 | 100,0 |
Yorum:
Örneklemde %55 oranıyla siyah çay en çok tercih edilen çay türüdür.
İkinci sırada yeşil çay (%20), ardından bitki çayı (%15) gelmektedir.
“Diğer” seçeneğine verilen yanıt oranı %10’dur.
Bu tablo sayesinde, nitel bir değişkene ait kategori dağılımını hızlıca görebilir ve örneklemdeki genel eğilimi anlayabiliriz.
1.2. Örnek 2: Memnuniyet Anketi (Sıralama Ölçeği)
Değişken: “Müşteri memnuniyeti” (1: Çok memnun değilim, 2: Memnun değilim, 3: Kararsızım, 4: Memnunum, 5: Çok memnunum)
Diyelim ki bir mağazada 60 müşteriye, alışveriş deneyimleri hakkındaki memnuniyet seviyeleri soruldu. 60 katılımcının dağılımı şöyle olsun:
Seviye | Frekans (n) | Yüzde (%) |
1 (Çok memnun değilim) | 5 | 8,3 |
2 (Memnun değilim) | 8 | 13,3 |
3 (Kararsızım) | 12 | 20,0 |
4 (Memnunum) | 20 | 33,3 |
5 (Çok memnunum) | 15 | 25,0 |
Toplam | 60 | 100,0 |
Ek Özet Değerleri (Sıralama Ölçeği için):
Ortanca (Medyan): 4 (Memnunum)
1. Çeyrek (%25 Değer): 3 (Kararsızım)
3. Çeyrek (%75 Değer): 4 (Memnunum)
Yorum:
Örneklemde ortalama bir müşteri memnuniyeti değerlendirmesi yapmak için ortanca (4) değeri kullanılabilir.
Katılımcıların %25’i “Kararsızım”ın altında veya ona eşit cevaba sahiptir, %75’i ise “Memnunum” ve üzerine yakın bir memnuniyet göstermiştir.
Bu şekilde, sıralama ölçeğindeki nitel bir değişkenin dağılımını hem sıklık-yüzde hem de ortanca-çeyrek değerler ile zenginleştirerek sunabiliriz.
2. Nicel Verilerin Özetlenmesi
Nicel veriler (yaş, ağırlık, gelir, puan vb.), merkezi eğilim ve yayılım ölçüleriyle birlikte özetlenir. Bunun amacı, verilerin “ortalama” bir değer etrafında nasıl dağıldığını görmektir.
Merkezi eğilim ölçüleri: Aritmetik ortalama, ortanca (medyan) ve mod (tepe değer).
Yayılım ölçüleri: Standart sapma, varyans, çeyrek değerler, minimum, maksimum, ranj (değişim genişliği).
Normal dağılım gösteren nicel veri ile normal dağılım göstermeyen nicel veri, farklı biçimlerde özetlenir:
Normal dağılan veri: Aritmetik ortalama ve standart sapma temel özet değerlerdir. Ayrıca minimum ve maksimum değerler de tabloya eklenir.
Normal dağılmayan veri: Ortanca (medyan), 1. ve 3. çeyrek değer (%25 ve %75), minimum ve maksimum özetlenir.
2.1. Örnek 1: Öğrencilerin Okuma Hızı (Normal Dağılım)
Diyelim ki 10 öğrencinin (her biri için okuma hızı kelime/dakika cinsinden) değerlerini ölçtük ve elde ettiğimiz verilerin normal dağılıma uygun olduğunu kabul ediyoruz. Veriler şöyle olsun:
75, 80, 78, 82, 90, 85, 76, 84, 88, 81
Aritmetik Ortalama (Mean):(75+80+78+82+90+85+76+84+88+81) / 10 = 81,9
Standart Sapma (SD):Verilerin ortalamadan sapma miktarını gösterir. Hesaplandığında (örneğin SPSS ile) yaklaşık 4,94 çıkabilir.
Minimum – Maksimum:
Minimum: 75
Maksimum: 90
Tablolu Özet:
Değişken | n | Ortalama | Standart Sapma | Min | Max |
Okuma Hızı (K/Dk) | 10 | 81,9 | 4,94 | 75 | 90 |
Yorum:
Ortalama 81,9 kelime/dakikadır.
Standart sapma 4,94 olup, öğrencilerin okuma hızlarının ortalamadan ±5 kelime civarı bir yayılım sergilediği söylenebilir.
2.2. Örnek 2: Çalışanların Aylık Geliri (Normal Dağılım Göstermeyen)
Bir şirketteki 12 çalışanın aylık net gelirlerinin büyük bir kısmının düşük/orta aralıklarda yoğunlaştığını ve birkaç çalışanın çok yüksek maaş aldığını düşünelim. Bu yüzden dağılımın normal olmama ihtimali yüksektir. Örneğin veriler şu şekilde olsun (TL cinsinden):
3500, 3600, 4000, 4200, 4200, 8000, 8400, 8500, 9000, 15000, 16000, 16000
Burada, iki kişi oldukça yüksek maaş almaktadır. Bu tür “uç değerler” verinin normal dağılımdan sapmasına sebep olabilir. Bu durumda merkezi eğilim olarak ortanca (medyan) ve yayılım ölçümü olarak çeyrek değerler kullanmak daha açıklayıcı olacaktır.
Ortanca (Medyan):Veriler küçükten büyüğe sıralanır:
3500, 3600, 4000, 4200, 4200, 8000, 8400, 8500, 9000, 15000, 16000, 16000
12 kişi olduğu için ortadaki 2 değerin (6. ve 7. değer) ortalaması alınır: (8000 + 8400)/2 = 8200 TL
1. Çeyrek (%25. Değer):12 verinin %25’i, 3. sıradaki değer ile 4. sıradaki değerin ortalamasına denk gelecektir. 3. sıradaki değer = 4000, 4. sıradaki değer = 4200. Dolayısıyla 1. çeyrek = (4000 + 4200)/2 = 4100 TL.
3. Çeyrek (%75. Değer):12 verinin %75’i, 9. sıradaki değer ile 10. sıradaki değerin ortalamasına denk gelir. 9. değer = 9000, 10. değer = 15000. Dolayısıyla 3. çeyrek = (9000 + 15000)/2 = 12000 TL.
Minimum – Maksimum:
Min = 3500 TL
Max = 16000 TL
Değişken | n | Ortanca (Medyan) | 1.Çeyrek | 3.Çeyrek | Min | Max |
Aylık Gelir (TL) | 12 | 8200 | 4100 | 12000 | 3500 | 16000 |
Yorum:
Aylık gelirin ortancası 8200 TL’dir; veri setinin yarısı 8200 TL ve altında, diğer yarısı 8200 TL ve üstünde maaş almaktadır.
çeyrek (4100 TL) ve 3. çeyrek (12000 TL), çalışan maaşlarının grup içinde geniş bir aralığa yayıldığını gösterir.
Uç değerlerin etkisiyle ortalama tek başına yeterli bilgi vermeyecektir; bu nedenle ortanca ve çeyrek değerler daha anlamlıdır.
3. Merkezi Eğilim ve Yayılım Ölçüleri
3.1. Merkezi Eğilim Ölçüleri
Aritmetik Ortalama (Mean): Tüm değerlerin toplanıp gözlem sayısına bölünmesi. Normal dağılımlı verilerde kullanılması idealdir.
Ortanca (Medyan): Küçükten büyüğe sıralanan değerlerin ortada kalanı. Normal dağılmayan verilerde daha sağlıklı bir “merkezi eğilim” göstergesidir.
Mod (Tepe Değer): En çok tekrar eden değerdir. Özellikle kategori ve sınırlı sayıda değer alan nicel verilerde yararlı olabilir.
3.2. Yayılım/Dağılım Ölçüleri
Standart Sapma: Verilerin ortalamadan ne kadar uzaklaştığını gösterir. Normal dağılımlı verilerde sıklıkla kullanılır.
Varyans: Standart sapmanın karesidir.
Çeyrek Değerler (Q1, Q3): %25 ve %75 noktalarını ifade eder, özellikle normal dağılmayan verilerde önemlidir.
Minimum ve Maksimum: En düşük ve en yüksek gözlenen değerler.
Ranj (Değişim Aralığı): Maksimum – Minimum farkı.
4. SPSS ile Verilerin Özetlenmesi
Nitel veriler için:
Analyze > Descriptive Statistics > Frequencies
Özetlenecek kategorik değişkenleri seçin.
OK butonu ile çıktıyı görüntüleyin.
Çıktıda “Frequency (n)” ve “Percent (%)” en önemli özetlerdir.
Nicel veriler için:
Analyze > Descriptive Statistics > Frequencies
İlgili nicel değişkenleri seçin.
Statistics butonu ile (Mean, Median, Std. Deviation, Minimum, Maximum, Quartiles) gibi seçenekleri işaretleyin.
OK ile tablo çıktısı elde edin.
Verinizin normal dağılım gösterme durumuna göre ortalama veya ortanca gibi değerleri kullanarak raporlamayı özelleştirin.
Sonuç: Doğru Özetleme, Sağlıklı Analizin Anahtarı
Nitel Veriler:
Mutlaka sıklık (n) ve yüzde (%) değerleri raporlayın.
Sıralama ölçeğindeki değişkenler için ortanca ve çeyrek değerler de kullanarak dağılımı daha iyi gösterin.
Nicel Veriler:
Normal dağılım söz konusuysa: Aritmetik ortalama ve standart sapma temeldir. Minimum–maksimum değerlerini de ekleyerek verilerin genişlik aralığını gösterin.
Normal dağılım yoksa: Ortanca, 1. ve 3. çeyrek değerler, minimum–maksimum değerleri ile tabloyu zenginleştirin.
SPSS Kullanımı:
Doğru menü adımlarını izleyerek tablo ve grafik çıktılarınızı hızlıca oluşturun.
Sonuçları akademik veya profesyonel raporlara uygun formatta sunun.
Verilerin özetlenmesi, araştırmanın ilk fakat en önemli aşamalarından biridir. Hem nitel hem de nicel değişkenlerinizi doğru özetlemek, ileri düzey analizlerde yanlış yorumları önler ve bulgularınıza daha yüksek güvenilirlik kazandırır.
Unutmayın, hangi özet değerleri sunacağınızı belirlerken, her zaman verinin dağılım özelliklerini göz önünde bulundurmak gerekir. Böylece, araştırma çıktılarınız herkes için anlaşılır ve ikna edici bir temele oturmuş olur.
Yorumlar