CẢI TIẾN THUẬT TOÁN PHÂN CỤM MỜ DỰA TRÊN ĐỘ ĐO TRỌNG SỐ ENTROPY VÀ CHỈ SỐ CALINSKI-HARABASZ

Nguyễn Như Đồng, Phan Thành Huấn

Tóm tắt


Phân cụm là kỹ thuật quan trọng trong khai thác dữ liệu và được ứng dụng rộng rãi trong các lĩnh vực như nhận dạng mẫu, thị giác máy tính và điều khiển mờ. Trong bài viết này, chúng tôi trình bày thuật toán cải tiến phân cụm mờ dựa vào sự kết hợp thuật toán phân cụm mờ dựa trên độ đo trọng số Entropy và chỉ số Calinski-Harabasz. Ưu điểm của phương pháp này là không những phân chia cụm hiệu quả, có độ chính xác cao mà còn có khả năng đo lường cụm, đánh giá cụm nhằm tìm ra được số cụm tối ưu đủ đáp ứng cho các nhu cầu thực tiễn. Sau cùng, chúng tôi trình bày kết quả thực nghiệm trên dữ liệu thực, cho thấy thuật toán cải tiến phân cụm hiệu quả và chính xác hơn.

Từ khóa


Chỉ số Calinski-Harabasz; Phân cụm mờ; Trọng số Entropy.

Toàn văn:

PDF

Các tài liệu tham khảo


Chan, Y., Ching, W., Ng, M. K., & Huang, J. Z. (2004). An optimization algorithm for clustering using weighted dissimilarity measures. Pattern Recognition, 37(5), 943-952.

Friguiand, H., & Nasraoui, O. (2004). Unsupervised learning of prototypes and attribute weights. Pattern Recognition, 37(3), 567-581.

Hoàng, X. H., & Nguyễn, T. X. H. (2006). Mở rộng thuật toán gom cụm K-means cho dữ liệu hỗn hợp. Tạp chí Tin học và Điều khiển học, 22(3), 267-274.

Huang, J. Z., Ng, M. K., Rong, H., & Li, Z. (2005). Automated variable weighting in K-Means type clustering. IEEE Transactions on Pattern Analysis, 27(5), 657-668.

Jing, L., Ng, M. K., & Huang, J. Z. (2007). An entropy weighting K-Means algorithm for subspace clustering of high dimensional sparse data. IEEE Transactions on Knowledge and Data Engineering, 19(8), 1026-1041.

Li, T., & Chen, Y. (2008). An improved K-means algorithm for clustering using Entropy weighting measures. Paper presented at The 7th World Congress on Intelligent Control and Automation, China.

Li, T., & Chen, Y. (2010). Fuzzy K-Means incremental clustering based on K-Center and vector quantization. Journal of Computer, 5(11), 1670-1677.

Lichman, M. (2013). UCI machine learning repository. California, USA: University of California. Retrieved from http://archive.ics.uci.edu/ml.




DOI: http://dx.doi.org/10.37569/DalatUniversity.8.2.408(2018)

Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu.


Copyright (c) 2018 Nguyễn Như Đồng, Phan Thành Huấn

Creative Commons License
Công trình này được cấp phép theo Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Văn phòng Tạp chí Đại học Đà Lạt
Nhà A25 - Số 1 Phù Đổng Thiên Vương, Đà Lạt, Lâm Đồng
Email: tapchikhoahoc@dlu.edu.vn - Điện thoại: (+84) 263 3 555 131

Creative Commons License
Trên nền tảng Open Journal Systems
Thực hiện bởi Khoa Công nghệ Thông tin