Sekiz yıl önce sosyal medyada şu manşetler dönüyordu: «Gülümseyen insanlar daha uzun yaşar», «Arkadaşınızın arkadaşınız mutsuz edebilir». O yıllarda psikoloji çalışmaları internette yayıldıkça yayılıyordu. Bugün ise o çok paylaşılan araştırmaların önemli bir kısmının aslında tutarsız çıktığı ortaya çıkıyor. Popülarite ile bilimsel doğruluk arasındaki bu çelişki, modern bilimin en çarpıcı krizlerinden birine işaret ediyor.
Psikolojide Replikasyon Krizi ve Viralleşme Kültürü
Psikoloji bilimi 2010'lu yılların başında sarsıcı bir gerçekle yüzleşti. Araştırmacılar, önceden yayımlanmış çalışmaları aynı koşullarda tekrar denediğinde sonuçların uyuşmadığını fark etti. Bu duruma literatürde «replikasyon krizi» adı veriliyor. Krizin boyutları o kadar ciddiydi ki, bazı alanlarda yayınlanan çalışmaların yarıdan fazlası ikinci kez yapıldığında aynı sonucu vermiyordu.
Sosyal medyanın yükselişi bu krizi daha da derinleştirdi. İnsanlar şaşırtıcı, sıra dışı bulguları paylaşmayı seviyor. «Sadece yedi saniyede birini aşık etmek mümkün» gibi iddialar kısa sürede milyonlarca etkileşim alıyor. Buna karşın «çalışma koşulları ve tükenmişlik arasındaki ilişki üç yıl boyunca incelendi ve şu değişkenler belirlendi» başlıklı bir makale kimsenin dikkatini çekmiyor.
Bu durum araştırmacıları da etkiliyor. Dikkat çeken, medyanın ilgisini gören çalışmalar daha çok atıf alıyor. Atıflar ise akademik kariyer için hayati önem taşıyor. Dolayısıyla araştırmacılar bilinçli ya da bilinçsiz olarak daha çarpıcı sonuçlar üreten çalışmalara yöneliyor. Sistem ödüllendiriyorsa, sistemin istediğini yapma eğiliminde oluyoruz.
Popüler Çalışmalar Neden Daha Çok Hata İçeriyor?
Big Think'ün derlediği analize göre, internette viral olan psikoloji çalışmaları sahte olma olasılığı en yüksek araştırmalar arasında yer alıyor. Bu tesadüf değil. Viral olmanın kendisi, araştırmanın yapısında belli özelliklerin bulunmasını gerektiriyor. Bu özellikler ise genellikle kötü metodolojiyle doğrudan bağlantılı.
Psience Quest forumlarında paylaşılan detaylara göre, 14 binden fazla psikoloji çalışmasını kapsayan yirmi yıllık bir analiz yapılmış. Araştırmacılar, 2000 ile 2019 yılları arasında prestijli dergilerde yayımlanan makaleleri bir makine öğrenmesi modeliyle incelemiş ve her birinin replike edilebilirlik puanını hesaplamış. Sonuç çarpıcı: Çok atıf alan çalışmaların tekrar edilebilme ihtimali diğerlerinden fark etmiyor. Üstelik medyada daha çok yer bulan araştırmaların tekrar edilememe riski ölçüde daha yüksek çıkıyor.
Küçük Örneklem, Büyük İddia
Sahte çıkan çalışmaların ortak özelliği küçük örneklem büyüklüğü. 30 üniversiteli öğrenciyle yapılan bir deney, tüm insanlık için geçerli bir genelleme haline getirilemez. Ancak viral çalışmalarda bu sıkça yapılıyor. Az sayıda katılımcıyla çalışan araştırmacılar, istatistiksel bir anlamlılık yakalamak için verileri çarpıtıyor ya da analiz yöntemlerini sonradan değiştiriyor.
Psience Quest'te tartışılan örnekte, viral olan bir çalışmada araştırmacıların 20 katılımcı üzerinde dört farklı ölçüm almış ve ardından en «ilginç» sonucu seçerek yayımladığı belirtiliyor. Bu yaklaşım bilimsel yöntemin temel mantığına aykırı. Çünkü hipotezi verilerden sonra oluşturuyorsanız, test etmiş olmuyorsunuz; sadece uydurmuş oluyorsunuz.
«Yayımlanmak İçin Çarpıcı Olmak» Baskısı
Akademik yayıncılık sistemi de soruna katkı sağlıyor. Prestijli dergiler sıradan, tekrarlanabilir sonuçları yayımlamak istemiyor. Editörler okuyucuyu şaşırtacak, medyanın ilgisini çekecek çalışmaları tercih ediyor. Frank Gilbert, LinkedIn paylaşımında bu durumu psikolojinin bir özgüven sorunu olarak tanımlıyor. Gilbert'e göre alan ciddiye alınmak için gösterişe kaçıyor ve bunun bedelini güvenilirlik ödüyor.
Araştırmacılar da bu baskıyı hissediyor. Negatif sonuç, yani «hipotezimiz doğrulanmadı» çıktısı veren bir çalışmayı yayımlatmak neredeyse imkansız. Bu durum «yayımlama önyargısı» olarak adlandırılan ciddi bir soruna yol açıyor. Sadece olumlu çıkan, çarpıcı sonuçlar literatüre giriyor. Başarısız olan deneyler ise çekmecede kalıyor. Başka biri o çalışmayı tekrar yaptığında, orijinal sonuçla karşılaşamıyor çünkü o sonuç şans eseri elde edilmiş ve diğer deneyler görünmez kılınmış.
İstatistiksel Manipülasyon Araçları
P-değeri manipülasyonu bu oyunun en yaygın aracı. Araştırmacılar, sonuç 0.05 sınırının altına düşene kadar farklı değişkenleri, farklı alt grupları deniyor. Bu sınır, psikolojide «anlamlı» sayılmanın geleneksel eşik değeri. Ancak sınırın hemen altındaki bir sonuç, gerçek bir etkiyi göstermek yerine araştırmacının ısrarını yansıtıyor olabilir.
Bağımsız bir veri setinde aynı analizi yaptığınızda o anlamlılık kaybolup gidiyor. İşte viral çalışmaların tekrar edilememesinin en temel nedeni bu. İlk çalışmada şans araştırmacının yanındaymış, ikincisinde değilmiş.
Bilim Topluluğu Bu Sorunu Çözüyor mu?
Olumlu gelişmeler de var. Science dergisinde yayımlanan bir analiz, psikolojide şüpheli istatistiksel sonuçların azalma eğiliminde olduğunu gösteriyor. Psience Quest'te paylaşılan aynı araştırmanın bir başka bulgusu da umut verici: 2010 ile 2019 yılları arasında ortalama replikasyon puanları artış eğiliminde. Bu, psikolojinin bir alan olarak daha sıkı yöntemler benimsediğine işaret ediyor.
Araştırmacılar artık çalışmalarını yayımlamadan önce kaydediyor. Bu yöntem «ön kayıt» olarak adlandırılıyor ve araştırmacının hipotezini ile analiz planını verileri görmeden önce belirtmesini şart koşuyor. Buna ek olarak, büyük ölçekli işbirlikleri ortaya çıktı. Birden fazla laboratuvarın aynı anda aynı deneyi yaptığı projeler yürütülüyor. Bu yaklaşım, tek bir laboratuvarın özel koşullarından kaynaklanan önyargıları ortadan kaldırıyor. Sonuçlar daha güvenilir çünkü farklı ülkelerde, farklı kültürlerde, farklı araştırmacılar tarafından test ediliyor.
Ancak bu değişim yavaş işliyor. Ön kayıt sistemi gönüllü ve yaygınlaşması yıllar alacak. Büyük işbirlikleri ise pahalı ve zaman alıcı. Öte yandan sosyal medya hızını hiç düşürmüyor. İnsanlar hâlâ çarpıcı psikoloji haberlerini paylaşmaya devam ediyor. Bu hız farkı, doğru bilginin yanlış bilgiyi yakalamasını zorlaştırıyor.
Okuyucu tarafında da bir farkındalık sorunu var. Çoğu kişi «bir üniversitede yapıldı» ibaresini gördüğünde çalışmanın otomatik olarak güvenilir olduğunu düşünüyor. Psikoloji herkesi ilgilendiren bir alan çünkü insanlar kendilerini anlamak istiyor. Bu haklı merak, maalesef düzensiz ya da kötü niyetli araştırmalar için bereketli bir zemin oluşturuyor.
Sosyal medya içerik üreticileri de bu noktada kritik bir rol oynuyor. Dikkat çekici başlıkların, çarpıcı görsellerin önemi her geçen gün artıyor. İçerik üreticisi bir psikoloji çalışmasını paylaşırken o çalışmanın metodolojisini incelemek yerine başlığına bakıp paylaşıyor. «Ne kadar çarpıcı olursa o kadar paylaşılır» mantığı hâkim. Bu zincirleme bir sorumsuzluk: araştırmacı abartıyor, dergi seçici davranmıyor, medya çarpıtıyor, kullanıcı paylaşıyor.
Okuyucu Ne Yapmalı?
Gelecekte bu dengenin değişmesi mümkün mü? Belki de çözüm okuyucuda başlıyor. Bir psikoloji haberi gördüğünüzde «kaç kişiyle yapıldı», «tekrarlandı mı», «hangi dergide yayımlandı» sorularını sormayı alışkanlık haline getirmek gerekiyor. Çarpıcı olan her zaman doğru değildir. Doğru olan ise çoğu zaman sıradandır.
Siz en son paylaştığınız psikoloji haberinin örnekleme büyüklüğünü hatırlıyor musunuz?
yorumlar