Tekrarlama sınaması

İstatistik bilim dalı içinde tekrarlama sınaması iki değer (0-1) alan veya iki değer alma şekline dönüştürülmüş bir kategorik değişken için örneklem veri serisinin ardı ardına bir rastgele sıralama ile gelip gelmediğini sınamak için kullanılan bir parametrik olmayan istatistik yöntemidir.

Veriler

Bu sınama icin, iki turlu veri kullanilabilir:

  • Eğer örneklem verisi iki değerli kategorik veri ise, hemen birbiri ile arka arkaya gelen örneklem veri değerleri veri geliş sırasıyla ikinci veriden itibaren incelenir ve +, - ve 0 dan oluşan bir gösterge veri serisi hazırlanır . Yani incelenen veri değeri bir önceki veriden çıkartılır ve bu işlemin işareti gösterge verisi olur; yani Xi-Xi-1 işareti Di işaret verisi olur.
  • Eğer örneklem verisi iki değerli değilse veri ise bu verilerden ya ortalama veya medyan değeri çıkartılır ve hemen birbirini takip eden arkaarkaya gelen fark veri değerleri incelenir. Birbirini takip eden ortalama veya medyandan farklar arasındaki fark bulma sonuçları ortaya çıkan sonucun işaretlerinden yani +, - ve 0 dan oluşan bir gösterge veri serisi hazırlanır . Eğer incelenen veri değerinden ya ortalama veya medyan çıkartılır ve bulunan fark değerleri için bir fark bir önceki farkdan çıkartılır ve bu işlemin işareti gösterge verisi olur; yani Xi-Xi-1=Fi bulunup Fi-Fi-1'in işareti Di için veri olur. Dikkat edilirse veriler çokluluğa değil sıralamalara ve sıralama içindeki farklara dayanır.

Yöntem

Bu sınamanın amacı örneklem verilerinin ardı ardına rastgele olarak ortaya çıkıp çıkmadıklarını incelemektir. Dikkat edilirse bu sınama anakütle çokluğu veya rastgeleliği hakkında değil, örneklem verileri ile ilgilidir. Daha matematiksel biçimli bir ifade ile sıfır hipotez örneklem verilerinin birbirini takip eden işaretli gösterge elemanlarinin birbirlerine karşılıklı olarak bağımsız olduğudur.

Sınama istatistiğini elde etmek için örneklem verisinden elde edilmiş olan gostergeler serisinde Di değişmesi için tekrarlamalar (en. runs) incelenir Eğer gösterge işaret degişikligi gösterirse bu bir tekrarlamadir; yani Di=- ve Di+1=+ ise bir pozitif artış tekrarı ve Di=+ Di+1=- ise negatif azalış tekrarı olur. Bunlar sayılır: Np toplam pozitif artış tekrarı ve Nn toplam negatif azalış tekrarı olur ve bu ikisinin toplamı (R=Np+Nn) ise toplam tekrarlama sayısı olur.

Örneğin: Bir D(i) serisi şöyle gösterilsin: "----+++---+++--++++++" . Burada Np=3; Nn=2 ve toplam tekrarlama sayısı R=3+2=5 olur.

Toplam tekrarlama sayısı R için örneklem dağılımının yaklaşık olarak normal olduğu bilinmektedir ve bu dağılımın parametreleri şöyle verilir:

  • Ortalama
  • Varyans

Sınamaya devam bu değerler için bir standart normal puan (z-değeri) hesaplamak ile devam edilir.

Eğer toplam artış tekrarı veya toplam azalış tekrarı 20'den azsa (yani veya ) anlamlılık düzeyi olan 0,05 için hazırlanmış özel bir tablo kullanılıp tablo z-değeri bulunur.[1]. Eğer ve ise genel standart normal tablolarından 0,05 veya 0,01 için anlamlılık düzeyi tablo z-değerleri bulunup kullanılır. Hesaplanan standart normal puanı tablodan bulunan z-değerin altında ise sıfır hipotez kabul edilir. Eğer komputer için standart normal simulasyon programı veya istatistik paketi varsa, hesaplanan z-değer karşıtı olan p-değer bulunup %1 veya %5 anlamlılık duzeyi ile karşılaştırılır ve p-değeri daha büyük ise sıfır hipotez kabul edilir.

Ek açıklama

Tekrarlama sınaması için, örneklem verilerinin birbirini takip etme sürecinde eşitlik veya adaletli oluş (yani yarıyarıya - ve + oluŞu) ele alınan konu değildir; incelenen ardı ardına gelen veri elemanlarının istatistiksel olarak bağımsız olup olmamasıdır.

Tekrarlama sınaması, ortalama ve varyans alınmadan, biraz subjektif olarak hemen kullanılabilen bir rastgellelik sınaması olarak pratikte rağbet görmüştür. Özellikle birbirini zaman içinde takip eden zaman serisi verilerinde rastgele değişme ile sistematik değişme arasında hemen ayrım yapmak için pratikte kullanılabilir.

Tekrarlama istatistiği için örneklem dağıması parametreleri bir parametrik sınama içinde tekrarlama sınamasının etkinlik gücünü bulmak için kullanılamazlar; bu nedenle bu sınamanın gücü için çıkartımsal istatistik bulunamaz. Eğer uygulama mümkün ise, etkinlik gücünün sınanması imkânını temin eden Kolmogorov-Smirnov sınamasının kullanılması tercih edilmelidir.

İçsel kaynaklar

Kaynakça

  1. Siegel,S. ve Castellan,N.J. (1988) Nonparametric Statistics for Behavioural Science (2. rev.ed.) New York: McGraw Hill Tablo F
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.