Title: Ileri Istatistik Teknikleri
1Ileri Istatistik Teknikleri
- Üç tür yalan vardir
- Yalan,
- Kuyruklu Yalan,
- Istatistik
- Benjamin Disraeli
- Dördüncü tür yalan Ileri Istatistiktir, Emre
- Yeterince döndürürseniz veriye her türlü bulguyu
itiraf ettirtebilirsiniz.... Anonim - Hayat fena halde futbola benzer dört dogru pas
yüzde 90 gol demektir Bir filmden
2Ileri Istatistik Teknikleri
- ? Neden ileri teknikler?
- Amaç Eldeki veriyi bilgiye dönüstürebilmek
- - Veri vs. Bilgi
3Istatistiksel Yöntemler
- Betimleyici (Descriptive) Yöntemler
- Verili herhangi bir dagilimi bir ya da birden çok
katsayida anlatabilmek - - Örn sirkettekilerin yas ortalamasi
- Açiklayici (Explanatory) Yöntemler
- Bir veri setinde olasi iliskileri sergilemek
- - Örn Sirkettekilerin ayakkabi numaralariyla
aldiklari maas arasindaki iliski
4Betimleyici Yöntemler
- Amaç Eldeki dagilimi en iyi sekilde temsil etmek
- Araçlar
- Ortalama
- Medyan
- Mod
5Betimleyici Yöntemler
- Veeee....
- Varyans/Standart Sapma
6Iki Dagilimin Hikayesi
- Dagilim
- 6,6,6
- Ortalama 6
- Medyan 6
- Mod 6
- Std. Sapma 0
- Dagilim
- 0,6,12
- Ortalama 6
- Medyan 6
- Mod 6
- Std Sapma 6
Amaç Görünenin Ötesine Bakabilmek
7Açiklayici Analizler
- Amaç Verili bir sette olasi iliskileri kesfetmek
ya da öngörülen hipotezleri test etmek
8Görünen....
9Görünenin Arkasi....
Genel Ortalama 51, Std. Sapma
22 Kadinlar Ortalama 46, Std. Sapma
23 Erkekler Ortalama 46, Std. Sapma 21
10Örnek Internet Kullanimi
11Ve Görünenin Arkasi...
Erkekler
Kadinlar
12Açiklayici Analizler
- Amaç Ilk bakista görül(e)meyen iliskileri
sergileyip iliskisel açiklamalar getirmek - Y f(x)
- ie Internet kullanimi f(cinsiyet)
- ie Yasam biçimi f(gelir)
- ie Tüketim kaliplari f(yasam biçimi)
13Örnek Gelismislik ve Yasam Kalitesi
- BM verilerinden elde edilen bir tablo...
- Arastirma sorusu Gelismislik ve Yasam Kalitesi
arasindaki iliski - Islemlestirme
- Gelismislik Kisi Basina Düsen GSMH
- Yasam Kalitesi Çocuk ölümleri
14Gruplanmis Veri
15Scatterplot
16Sorular
- Grafigi ne kadar temsil ediyor?
- Ne gibi çikarimlar yapabiliyoruz?
- Forecasting yapilabiliyor mu?
- Iliskinin boyutu ve yönü ölçülebiliyor mu?
Ne Kadar Yeterli?
17Amaç Daha iyi analiz, daha iyi veri
- Correlation Coefficient (korelasyon)
18Sonuçlar
- Covariance
- 2115,318
- Correlation
- -0,60165
- Çikarilacak Sonuç Ne?
19Amaç Nedensel Iliskileri Göstermek
- Y f(x)
- X, Ynin belirleyicisi mi?
- X, Yyi ne kadar belirliyor?
- X, Yyi ne yönde belirliyor?
20Regresyon Analizi
- Y f(x)
- Y abx
- Regresyon Denklemi
21Scatterplot
22Regresyon Katsayilarinin Hesaplanmasi
23Regresyon Analizi Sonuçlari
24Regresyon Analizinin Açilimlari
- Kukla Degiskenli Regresyon (Dummy Variable)
- Binomial/Multinomial Regression
25Regresyon Analizinin ciz-kakalari
- Arkasinda çok ciddi üç varsayim vardir.
- Regresyon analizi sadece interval ya da ratio
ölçümleme düzeyinde yapilir - Do not use any mathematical model without
understanding it
26Kümeleme ve Birlestirme Analizleri
- Bütün olgular birbiriyle iliskilidir. Aradaki
iliskinin 0 oldugu yerde bile... - Birlestirme analizlerinin amaci olgularin
birbirleriyle olan iliskilerinden yola çikarak
isimizi kolaylastirmaktir - 1. Degisken sayisini azaltabilirler
- 2. Vaka sayisini azaltabilirler
- 3. Boyut sayisini azaltabilirler
27Faktör Analizi Degisken Sayisini Azaltmak
- Analize tabi bütün degiskenler birbiriyle
iliskili. - Bu degiskenlerin bazilari birbirleriyle daha
kuvvetli iliski sahibi. - Kuvvetli iliski sahibi degiskenleri birlestirerek
aza indirmek mümkün. - Degiskenlerarasi korelasyon matrisi kullanilarak
faktörler insa ediliyor
28Faktör Analizi
29Case Sayisi Azaltmak Clustering
- Verili degiskenler bazinda analize alinan
caseler birbirlerine benzerler - Bu benzerlik bir ya da daha fazla boyutta
olabilir - Benzerliklerden yola çikarak clusters
olusturmak mümkün - Benzerlikler metric mesafelerle ölçülüyor
30Cluster Analysis I
31Cluster Analysis II
32Cluster Analysis III
33Boyut Sayisini Azaltmak MDS
- Analizde gözönünde tuttugumuz her degisken bir
boyut sayilabilir. - Iki-üç boyuttan fazlasini visualize etmek kolay
degil. - Degiskenler arasindaki uzakliktan yola çikilarak
bu boyut sayisi azaltilabilir. - Degiskenler arasindaki uzakliklar metric olarak
ölçülebilir
34MDS
35Ve mutlu son....
- Istatistiksel araçlariniz ne kadar güçlü, ne
kadar gelismis olursa olsun, unutmamaniz gereken
tek sey var - Bu verileri okuma yazmasi olmayan demiryolu
bekçileri topladi - Sir John Maynard Keynes