A key issue in cluster analysis is the choice of an appropriate clustering method and the determination of the best number of clusters. Different clusterings are optimal on the same data set according to different criteria, and the choice of such criteria depends on the context and aim of clustering. Therefore, researchers need to consider what data analytic characteristics the clusters they are aiming at are supposed to have, among others within-cluster homogeneity, betweenclusters separation, and stability. Here, a set of internal clustering validity indexes measuring different aspects of clustering quality is proposed, including some indexes from the literature. Users can choose the indexes that are relevant in the application at hand. In order to measure the overall quality of a clustering (for comparing clusterings from different methods and/or different numbers of clusters), the index values are calibrated for aggregation. Calibration is relative to a set of random clusterings on the same data. Two specific aggregated indexes are proposed and compared with existing indexes on simulated 1 and real data.
Güç analizi ile örneklem büyüklüğü tahmini tıbbi araştırmacılar ve etik kurulu üyeleri tarafından çoğu zaman yanlış yorumlanan bir konudur. Bu çalışmada, istatistik alanı dışından olan araştırmacıların, örneklem büyüklüğü, etki büyüklüğü ve istatistiksel güç ile ilgili sorularının cevaplanması amaçlanmıştır. Yöntem: Bu kapsamda, farklı tıbbi araştırma düzenlerinde güç analizi gerçekleştirmek için kullanılacak etki büyüklüklerinin ne anlama geldiği ve nasıl hesaplandığı anlatılmıştır. Farklı etki büyüklüklerinde, farklı istatistiksel güç düzeylerinde ve %5 istatistiksel anlamlılık seviyesinde bağımsız gruplar için t-testi, tek yönlü ANOVA ve Ki-kare testleri için gerekli olan örneklem büyüklükleri GPower 3.1 programı kullanılarak hesaplanmıştır. Bulgular: Farklı istatistiksel testler için gerçekleştirilen güç analizleri, etki büyüklüğünün örneklem sayısı belirlemede ne derecede önemli rol oynadığını göstermiştir. Gereğinden az sayıda birim üzerinde deney yapılması gerçekte var olan önemli bir etkinin tespit edilememesine neden olabilirken, çok fazla sayıda örnek üzerinde test yapılması istatistiksel olarak anlamlı fakat gerçekte klinik olarak önemsiz bir etkinin tespit edilmesine yol açabilir. Sonuç: Sonuç olarak, bir araştırma kapsamında beklenen klinik anlamlılığı ortaya çıkarmak için alınması gereken etki büyüklüğü, araştırma hipotezi ile uyumlu belirlenmelidir. Çünkü araştırma sonucunda verilecek kararların niteliği ve klinik anlamlılığı örneklemin hangi etki büyüklüğüne dayanarak seçildiğine bağlıdır.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.