ÖzetçeBu çalışmada UCI(University of California-Irvine) Machine Learning Laboratuvarından alınan göğüs kanseri dataları kullanılarak, makine öğrenmesi teknikleri ile göğüs kanserinin sınıflandırılmasına çalışılmıştır. Bu amaçla, göğüs kanseri dataları kullanılarak, K-means kümeleme uzaklık ölçümlerinin kümeleme başarısı Matlab©'da analiz edilmiştir. Daha sonra, hiçbir ön işleme yapmadan, Weka© Veri Madenciliği yazılımı kullanılarak, UCI'den alınan göğüs kanseri dataları, çeşitli makine öğrenme teknikleri ile WEKA'da sınıflandırılmıştır. Sonuç olarak kümeleme uzaklık ölçütlerinin başarıyı yaklaşık olarak %12 değiştirdiği ve sınıflandırma başarısının yöntemlere göre %45-%79 arasında değiştiği görülmüştür.
AbstractIn this study, it is aimed to classify breast cancer data attained from UCI(University of California-Irvine), Machine Learning Laboratory with some Machine Learning Techniques. With this aim, clustering performance of some distance measures in Matlab© has been compared, using breast cancer data. Later without using any pre-processing, some of the machine learning techniques are used for the clustering breast cancer data, using WEKA data mining software©. As a result, it has been seen that distance measures effects the clustering performance nearly 12 percentage and the succes of the classification varies from %45 to %79, according to the methods.