Örneklem Sayısı Belirleme ve Güç Analizinde Temel Kavramlar
Güç analizinde literatür ve uzman bilgisine dayalı bazı bilgilere ihtiyaç duyulmaktadır. Bunlardan en önemlisi etki büyüklüğüdür (effect size). Ortaya çıkarmak istediğiniz Minimum Klinik Önemli Fark/İlişkinin düzeyini belirlemelisiniz.
BLOG


Sizce bilim üretenler, neden çalışmaya başlamadan önce uygun örneklem sayısı belirlemeye ihtiyaç duyar? Yıllar önce böyle bir ihtiyaç bu kadar gündemde değildi. Dergiler ve hakemlerin çoğu bu konuda istek veya öneride bulunmuyordu. Son 5-10 yıldır özellikle kaliteli akademik dergiler bu konuda araştırmacıları tabir-i caizse sıkıştırmaya başladılar. Bilimsel ve istatistiksel yöntemler geliştikçe yayın yapma şartları daha zorlu hale geliyor. Bu gelişmeye paralel olarak uygun örneklem sayısının belirlenmesi ya da daha doğru bir ifadeyle tahminlenmesi de artık pek çok akademik çalışmada elzem hale geldi diyebiliriz. Bilimsel dergilerle beraber araştırmaların etik kurul başvuru formlarında ve tez öneri formlarında da artık standart bir şablonda “örneklem sayısının ne şekilde belirlendiği” nin açıklanması gerekmekte. Fakat maalesef çoğunlukla bu konu layıkıyla anlaşılmadığı için araştırmacılar bu işlemi angarya olarak görmektedir. Oysaki yeterli sayıda örneklem seçilmesi, araştırmacının beklediği farkı veya ilişkiyi istatistiksel olarak anlamlı göstermesi için bir fırsattır. Yani bu işi hakemler, etik kurul veya fon sağlayıcılar için değil kendimiz için yapmalıyız. Bu farkındalığın araştırmacılar tarafından yeterince oluşmamış olmasının bir nedeni, konunun belirli eğitimlerle anlatılmaması, araştırmacıların bu konuyu zor olarak görmesi ve bu nedenle çalışma motivasyonlarının düşük olmasıdır. Belki de bu konunun mantığını anlayan ve anlatan akademisyen sayısının azlığı nedeniyle “güç analizi” konusu lisans ve lisans üstü müfredatta yeterli ilgiyi görememektedir.
Güç analizine adını veren güç kavramına değinerek konuya derinleşelim. Sizce hangi çalışmalara “güçlü” deriz? Sonuçları tutarlı, güvenilir, genellenebilir olan çalışmalar güçlüdür gibi yanıtlar aklımıza gelebilir. Fakat buradaki güçten kasıt istatistiksel güç…İstatistiksel güç şu anlamlara gelmektedir:
Araştırılan evrende, araştırmacının bulmak istediği veya bulmayı umduğu “gerçek etkiyi” ortaya çıkarabilme ihtimalidir.
Gerçek etki, şansa bağlı olarak elde edilmeyen bir değerdir.
Güç, popülasyonda belirli bir etki büyüklüğü veya daha fazlası varken, örnekte mevcut olan bu etkiyi gözlemleme olasılığıdır.
Tip 2 hata yapmama olasılığı (1-β) > %80 olması iyidir.
Özet olarak aşağıdaki tablodaki gibi gerçek durum ile çalışmanın sonucu karşılaştırılmaktadır.
Tablo 1. İstatistiksel hata türleri
Tabloda yer alan α (alfa) değeri yani 1. Tip hata da meşhur p değeri ile karşılaştırdığımız değer olan çoğunlukla 0,05 olarak belirlenen değerdir. Buradan da yola çıkarak hem α hem de β değerlerinin birer koşullu olasılık olduklarını belirtelim. Lise matematiğinden bildiğimiz koşullu olasılığa geçmeden önce araştırmalarda kurulan iki hipotez türünden, etkinin/farkın olmadığı H0 yani yokluk ve etkinin/farkın bulunduğu ve araştırmacının savunduğu alternatif hipotez H1den bahsedelim.
Hipotezi olan her araştırmada yokluk hipotezi ve alternatif hipotez olmak üzere iki türlü hipotez kurulur. Bu hipotezler (non-inferiority, equivalence, superiority türleri dışında) genellikle aşağıdaki tablodaki gibi karşılıkları olacak şekilde kurulur.
Tablo 2. Yokluk ve alternatif hipotez örnekleri
Tip 1 hata yani α değeri (H1 | H0) olarak ifade edilen, H0’ın doğru kabul edilmesi gereken durumda H1’in doğru olma olasılığıdır. β değeri ise bunun tam tersi, H1’in doğru kabul edilmesi gereken durumda H0’ın doğru olma olasılığıdır. Bu noktada karşımıza yeni bir soru daha çıkıyor: Neden 1. tip hatanın genellikle 0,05’i geçmesi istenmezken 2. tip hatanın limiti 0,20’ye kadar çıkabilmektedir. Bu konuda fikir üretenlerin başında gelen bilim insanı Psikolog Jocob Cohen’in önermiş olduğu 4:1 beta/alfa oranı aslında şu anlama geliyor:
“Elde edilen sonuçlarla kişileri kandırmanın riski, var olan bir etkiyi ortaya çıkaramamaktan dört kat daha ciddidir.”
İşte bilim dünyasını ayakta tutan iki oran! Okuduğumuz neredeyse tüm yayınlarda sunulan sonuçları etkileyen bir durum. Umarım bu konu sizi de en az benim kadar heyecanlandırıyordur 😊
Şekil 1. Güç analizinin bahsedilmeye başlandığı dönemlerde yayımlanan önemli bir eser
Bu iki hatayı aynı anda azaltmak istemek çok doğal fakat başarmak çok zordur. Çünkü:
Bilim ve istatistik dünyasında bu kadar fazla kullanılan fakat yanlış yorumlanan konulardan bir de p değeridir. Bu konudaki bilginizi sınamak ister misiniz?
Sizce p değerini en iyi hangisi anlatır?
a) Sıfır hipotezinin doğru olma olasılığıdır.
b) Alternatif hipotezin doğru olma olasılığıdır.
c) Araştırma yapılan gruplar arasında fark olmadığı sürece sonlanım ölçütünde gözlenen fark ya da daha fazlasını elde etme ihtimalidir.
d) Gözlenen fark ya da daha fazlasının şans eseri olma ihtimalidir.
Cevap c seçeneğidir çünkü p değeri de tıpkı alfa gibi bir koşullu olasılıktır. Konu size oldukça karışık gelmiş olabilir. Zor kavranan bir durum ancak konuyu ne kadar anlarsa istatistik okuryazarlığımız o kadar yükselir. Güç analizinin amacı özetle p değerini anlamlı bulabilmek için ihtiyaç duyduğumuz örneklem sayısını belirlemek. Klinik anlamlılıkla istatistiksel anlamlılığı paralel hale getirmek…Çünkü gereğinden fazla örneklemde klinik anlamlılığın olmadığı sonuçta istatistiksel anlamlılık çıkabilir, gereğinden az örneklemde de klinik anlamlılık varken istatistikte bunu gösteremeyebiliriz. Bizim istediğimiz ideal olan durum, klinik olarak anlamlı olduğunu düşündüğümüz sonucu istatistiksel olarak da anlamlı bulabilecek sayıda örneklem toplamaktır. p değeri konusu istatistiğin en temeli, alfabesi. Alfabesi buysa kelimesi, cümlesi nasıldır dediğinizi duyar gibiyim. 😊 Lütfen korkmayın, amacım sizi istatistikten soğutmak değil, sadece doğru bir başlangıç yapmanızı, yanlış bildiklerinizi düzeltmenizi sağlamak…
Tekrar dönelim güç analizi konusuna… Güç analizi her çalışmada uygulanmak zorunda mı? Aslında değil. Güç analizi, gücün söz konusu olduğu durumlarda yani elimizde bir hipotez varken kullanılmaktadır. Çünkü güçten bahsedebilmemiz için gerçek etkiyi ve hipotezimizin sonucunda elde ettiğimiz etkiyi karşılaştırmamız gerekmektedir. Yani ortada bir hipotezimiz olmalıdır. Tanımlayıcı araştırmalarda bir hipotez olmadığı için güç analizi terimini kullanmak yerine örneklem sayısı tahmini ifadesinden faydalanmaktayız.
Örneklem sayısı tahminlemesi İçin Hangi bilgilere ihtiyaç duymaktayız?
Örneklem sayısı tahmini iki şekilde yapılmaktadır. Her iki yöntemde de hesaplama yapılabilmesi için öncelikle çalışmamızın primer çıktısını (primary outcome) belirlemiş olmanız gerekmektedir. Primer çıktı, çalışmanın en can alıcı, literatüre en çok katkı yapacağını düşündüğünüz, çalışmayı yapmadaki en çok heves ettiğiniz sorudur. Primer çıktınızı henüz belirlemediyseniz veya ne olduğunu bilmiyorsanız bu konuyu netleştirdikten sonra uygun örneklem sayısı belirleme aşamasına geçmelisiniz.
1. Tanımlayıcı araştırmalar için uygun örneklem sayısı belirleme:
Bu tür araştırmalar, sonunda herhangi bir çıkarıma sahip olmayan, sadece mevcut durumu tespit etmeye çalışan çalışmalardır. Bu yöntemde formüllerden ve hesaplayıcılardan faydalanıyoruz. Bu hesabın yapılabilmesi için çalışmanın primer çıktısına ait TAHMİNİ bir parametre değeri sunmalısınız. Örneğin çocuklarda idrar yolu enfeksiyonu geçirme prevalansını tahminlemeye çalışacaksanız, geçmiş çalışmalara bakarak tahmini bir oran (p) değeri belirlenmelidir. Eğer primer çıktınız örneğin bir ölçeğin ortalama değeri ise tahmini ortalama ve standart sapma değeri belirlemelisiniz. Bu değerlerle birlikte öngörülen parametreye ait (oran ise orana ait, ortalama ise ortalamaya ait) tahmini örnekleme hatası (margin of error yani d değeri) ile ilgili de yine bir tahmini değer belirlemelisiniz.
Tanımlayıcı (descriptive) çalışmalar için örneklem hesaplaması için önerdiğimiz başlıca web hesaplayıcıları:
http://homepage.stat.uiowa.edu/~rlenth/Power/oldversion.html—> Programı bilgisayarınıza yükledikten sonra zip klasörünü sağ tıklayıp birlikte aç diyerek JAVA seçilmesi gerekmektedir.
https://www.calculator.net/sample-size-calculator.html
2. Hipotezi olan çıkarımsal araştırmalar için güç analizi:
Güç analizi yapabilmek için literatür ve uzman bilgisine dayalı bazı bilgilere ihtiyaç duyulmaktadır. Bunlardan en önemlisi etki büyüklüğüdür (effect size). Etki büyüklüğünü hesaplama nedenimiz, çalışmanızda primer çıktınız için ortaya çıkarmak istediğiniz Minimum Klinik Önemli Fark/İlişkinin düzeyini belirlemek. Mesela iki grup arasındaki minimum fark kaç olursa siz bunu klinik olarak anlamlı görürsünüz? Gibi… Örneğin Sistolik Arter Basınç değeri için ilaç verilmeden önce hesaplanan 140 mm/Hg değeri, ilaç verildikten sonra kaça düşerse ilaç etkili diyebilirsiniz? 135 mi? 130 mu? Yoksa 120 mi? Bu örneğimizden yola çıkarak kendi çalışmanız için uyarlama yapabilirsiniz. Amacımız çalışmanızın ana hipotezi yani en önemli araştırma sorusundan yola çıkarak ortaya çıkarmaya çalıştığınız etkinin minimum değerini saptayarak 0,05 hata payı ve %80-90 güç ile çalışmaya dahil edilmesi gereken minimum örneklem sayısını tahminlemek. Minimum önemli farkı belirlemek için alana özgü rehberlerden (guideline) faydalanabilirsiniz.
Eğer bu farkı belirlemekte zorlanıyorsanız literatürdeki benzer çalışmalardan faydalanabilirsiniz. Çalışmanızdaki primer çıktınıza göre benzer bulunan sonucu işaretleyerek bir istatistik uzmanından yardım alabilir veya kendiniz hesaplama yapabilirsiniz. Yani en önemli bulgunuz ne olacaksa benzer çalışmada da o bulguyu işaretlemeniz gerekmektedir. Bunu seçerken ana hipoteziniz yani çalışma konusunda motivasyonunuzu oluşturan öncelikli soruya göre seçim yapmanız önerilir. Mesela gruplar arası farka ait ortalama ve standart sapma değerleri olabilir, ilişki katsayıları olabilir veya iki grubun oran değerleri olabilir. İki veya en fazla üç sonucu işaretleyebilirsiniz. Bu gibi durumlarda da her bulguya göre ayrı ayrı örneklem sayısı tahminlenir ve en yüksek sayıda elde edilen örneklem sayısı uygun olarak görülür.
Seçtiğiniz 1-2 veya 3 bulguyu, ücretsiz olarak indirebileceğiniz G*Power programına giriş yaptığınız takdirde sonuca ulaşabilirsiniz. En yüksek çıkan örneklem sayısına, öngörülen drop-out sayısı oranında ekleme yaparak çalışmaya başlanır.
Benzer yayınların metot kısmında yer alan (genelde iyi dergilerde bulunur) “sample size” bölümlerini inceleyerek power analizinin nasıl yazıldığı ve hangi bilgilerin sunulduğu hakkında fikir sahibi olursanız işiniz daha kolaylaşacaktır.
Aşağıdaki görselde örneklem sayısı tahmini için geliştirilen hesaplayıcılara ve programlara erişebilirsiniz.
GPower programını ücretsiz indirmek için: https://www.psychologie.hhu.de/arbeitsgruppen/allgemeine-psychologie-und-arbeitspsychologie/gpower.html
Şekil 2. Çevrim içi erişilen ücretsiz örneklem sayısı tahminleme yapan yazılım ve hesaplayıcılar*
* Charan, J., & Biswas, T. (2013). How to calculate sample size for different study designs in medical research?. Indian journal of psychological medicine, 35(2), 121.







