Bibliyometrik Analiz Çalışmalarında Karşılaşılan Zorluklar ve Çözümleri (Detaylı)
Bibliyometrik analiz, bilimsel literatürün nicel olarak incelenmesini sağlayan güçlü bir yöntemdir. Ancak, bu yöntem birçok zorluğu da beraberinde getirmektedir. Bu zorluklar, verinin toplanmasından yorumlanmasına kadar geniş bir yelpazede ortaya çıkar. Aşağıda, bibliyometrik analiz çalışmalarında karşılaşılan temel zorluklar ve bunlara yönelik çözümler detaylı bir şekilde ele alınmıştır.
Dr. Deniz Özel
3/31/20255 min read


Bibliyometrik analiz, bilimsel literatürün nicel olarak incelenmesini sağlayan güçlü bir yöntemdir. Ancak, bu yöntem birçok zorluğu da beraberinde getirmektedir. Bu zorluklar, verinin toplanmasından yorumlanmasına kadar geniş bir yelpazede ortaya çıkar. Aşağıda, bibliyometrik analiz çalışmalarında karşılaşılan temel zorluklar ve bunlara yönelik çözümler detaylı bir şekilde ele alınmıştır.
1. Veri Kaynağı Seçimi
Zorluk: Web of Science (WoS), Scopus ve Google Scholar gibi farklı veritabanları, kapsam ve indeksleme politikaları açısından önemli ölçüde farklılık gösterir. Bu durum, hangi kaynağın seçileceği konusunda kararsızlığa yol açabilir (Falagas vd., 2008).
Çözüm:
- Her veritabanının güçlü ve zayıf yönlerini değerlendirin. Örneğin, WoS seçkin dergilere odaklanırken, Scopus daha geniş bir kapsama sahiptir.
- Araştırma alanınıza en uygun veritabanını seçin. Örneğin, sosyal bilimler için WoS, mühendislik için Scopus tercih edilebilir.
- İdeal olarak, karşılaştırmalı bir analiz için birden fazla veritabanı kullanın (Martín-Martín vd., 2021).
2. Yazar Adı Belirsizliği
Zorluk: Aynı yazar için "J. Smith", "John Smith", "Smith, J.A." gibi farklı varyasyonlar, hatalı yazar atıf sayılarına ve ağ analizlerinde yanlış bağlantılara neden olabilir (Ferreira vd., 2019).
Çözüm:
- ORCID ve ResearcherID gibi benzersiz kimlik sistemlerini kullanın.
- OpenRefine'ın "cluster" özelliğiyle benzer adları gruplandırın.
- Ek olarak R'daki `stringdist` paketi veya Python'daki `fuzzywuzzy` ile bulanık eşleştirme algoritmaları kullanın (van der Loo, 2014).
- Son olarak, özellikle yaygın soyadları için manuel doğrulama yapın.
3. Kurum ve Ülke Adı Tutarsızlıkları
Zorluk: "University of California" ve "UC Berkeley" gibi varyasyonlar veya ülke adlarının farklı dillerde yazılması, kurumsal ve ulusal katkıların yanlış değerlendirilmesine yol açabilir.
Çözüm:
- Global Araştırma Tanımlayıcı (GRID) veya ROR (Research Organization Registry) kullanın.
- R'daki `institutionsaov` paketi, kurum adlarını standartlaştırmak için geliştiriş özel bir araçtır (Baruffaldi & Raffo, 2017).
- ISO 3166 ülke kodlarını kullanarak ülke adlarını uyumlu hale getirin.
4. Çok Dilli Yayınlar
Zorluk: İngilizce dışındaki dillerde yazılmış makaleler, özellikle başlıkları ve anahtar kelimeleri çevirilmediğinde, gözden kaçabilir (Liu, 2017).
Çözüm:
- Google Translate API veya DeepL API'yi R veya Python'a entegre ederek otomatik çeviri yapın.
- İki dilli uzmanlardan manuel çeviri ve doğrulama isteyin.
- Çok dilli tesaurus dosyaları oluşturun ve VOSviewer veya Biblioshiny ile kullanın.
5. Atıf ve Bibliyografik Eşleştirme
Zorluk: Atıf verileri genellikle yapılandırılmamıştır ve "et al." gibi kısaltmalar içerir. Bu, ortak atıf ve bibliyografik eşleştirme analizlerini zorlaştırır (Visser vd., 2021).
Çözüm:
- GROBID veya CERMINE gibi açık kaynaklı araçları kullanarak atıf dizelerini ayrıştırın.
- CrossRef API ile DOI tabanlı atıf eşleştirme yapın.
- CiteSpace veya CitNetExplorer gibi özel atıf analizi araçlarını kullanın.
6. Açık Erişim ve Preprint'ler
Zorluk: arXiv veya bioRxiv gibi preprint sunucularındaki makaleler ve ResearchGate'deki sürümler, geleneksel veritabanlarında eksik olabilir (Larivière vd., 2021).
Çözüm:
- Dimensions veya Lens.org gibi preprint'leri kapsayan veritabanlarını kullanın.
- oaDOI API ile makalelerin açık erişim durumunu kontrol edin.
- Scopus'un "Secondary Documents" özelliğiyle preprint'leri dahil edin.
7. Konu Kategorizasyonu ve Anahtar Kelime Tutarsızlığı
Zorluk: WoS kategorileri genellikle geniştir ve anahtar kelimeler yazarlar tarafından tutarsız şekillerde atanır (Leydesdorff vd., 2013).
Çözüm:
- MeSH veya Emtree gibi kontrollü sözlükleri kullanın.
- LDA (Latent Dirichlet Allocation) veya Word2Vec gibi doğal dil işleme tekniklerini uygulayın.
- CiteSpace'in "burst detection" özelliğiyle yükselen terimleri belirleyin.
- VOSviewer'ın "binary counting" özelliğini kullanarak terim varyasyonlarını azaltın.
8. Veri Manipülasyonu ve Yorumlama Hataları
Zorluk: Büyük veri setleriyle çalışmak, özellikle R veya Python'da, kodlama hatalarına ve yanlış yorumlamalara neden olabilir (Wallach vd., 2018).
Çözüm:
- Jupyter Notebook veya RMarkdown kullanarak kodunuzu belgelendirin.
- Veri işleme adımlarını modüler fonksiyonlara bölün ve birim testleri yazın.
- Git gibi sürüm kontrol sistemleri kullanın.
- Sonuçları alan uzmanlarıyla doğrulayın ve nitel yaklaşımlarla üçgenleyin.
9. Önyargı ve Temsil Sorunları
Zorluk: Ana akım veritabanları, belirli bölgeleri (örn., Küresel Güney) veya disiplinleri (örn., yerel dilde yayınlanan makaleler) yetersiz temsil edebilir (Rafols vd., 2015).
Çözüm:
- SciELO, AfricArXiv gibi bölgesel veritabanlarını dahil edin.
- DOAJ (Directory of Open Access Journals) ile açık erişimli dergileri keşfedin.
- Bibliyometrik bulguları, anketler veya odak grup görüşmeleriyle destekleyin.
- Sonuçları raporlarken sınırlamaları açıkça belirtin.
10. Zaman Gecikmesi ve Güncellik
Zorluk: Atıf sayıları ve etki faktörleri, genellikle bir makalenin yayınlanmasından sonra zaman alır. Bu, son trendleri yansıtmada gecikmeler yaratır (Wang, 2013).
Çözüm:
- Altmetrik skorları (sosyal medya, blog, haber sitesi etkisi) kullanın.
- Preprint sunucularındaki indirme sayılarını ve yorumları analiz edin.
- "Usage" veya "CiteScore" gibi erken etki ölçümlerini tercih edin.
- VOSviewer'ın "overlay visualization" özelliğiyle zamana bağlı değişimleri gösterin.
11. Etik ve Veri Gizliliği Endişeleri
Zorluk: Yazar profilleri ve işbirliği ağları, potansiyel olarak hassas bilgiler içerebilir. Ayrıca, bazı araştırmacılar veri madenciliğine karşı çıkabilir (Borgman, 2016).
Çözüm:
- Araştırmacıları bilgilendirin ve mümkünse onay alın.
- Verileri anonim hale getirin veya toplu düzeyde raporlayın.
- API kullanım koşullarına ve "robots.txt" dosyalarına saygı gösterin.
- Kurumsal Etik Kurullardan (IRB) onay alın.
Sonuç
Bibliyometrik analiz, DDY araştırmalarının kapsamlı bir resmini sunarak, alanın ilerlemesini hızlandırma potansiyeline sahiptir. Bununla birlikte, bu yöntem bir dizi teknik, metodolojik ve etik zorlukla karşı karşıyadır. Bu zorluklar, veri toplama ve temizleme aşamasından, bulguların yorumlanması ve sunulmasına kadar her adımda kendini gösterir.
Bu engelleri aşmak için, araştırmacılar çok çeşitli araçlar ve stratejiler kullanmalıdır. ORCID ve GRID gibi benzersiz tanımlayıcılar, yazar ve kurum adı belirsizliklerini azaltırken, NLP teknikleri ve kontrollü sözlükler, konu kategorizasyonunu iyileştirir. Preprint'leri ve bölgesel veritabanlarını dahil etmek, analizin kapsamını genişletir. Kodlama hatalarını önlemek ve etik standartları korumak için yazılım mühendisliği pratikleri ve şeffaf raporlama esastır.
Önemli olan, bu zorlukların farkında olmak ve bunları proaktif bir şekilde ele almaktır. Her bir çözüm, bibliyometrik analizin doğruluğunu, güvenilirliğini ve etik bütünlüğünü artırır. Bu çabaların sonucu olarak, DDY araştırmaları hakkında elde edilen içgörüler, sadece akademik anlayışı derinleştirmekle kalmaz, aynı zamanda klinik uygulamayı iyileştirir ve en önemlisi, etkilenen bireylerin ve ailelerin yaşam kalitesini yükseltir.