14
th
ể vừa thuộc nhóm khác. Không giống như phân lớp dữ liệu, phân nhóm dữ liệu
không đòi hỏi phải định nghĩa trước các
mẫu dữ liệu huấn luyện. Vì thế, có thể coi
phân nhóm d
ữ liệu là một cách học bằng quan sát (
learning by observation), trong khi
phân l
ớp dữ liệu là học bằng ví dụ (
learning by example). Trong phương pháp này bạn
s
ẽ không thể biết kết quả các nhóm thu được sẽ như thế nào khi bắt đầu quá trình. Vì
v
ậy, thông thường cần có một chuyên gia về lĩnh vực đó để đánh giá các nhóm thu
được. Phân nhóm còn được gọi là học không có giám sát (unsupervised learning). Phân
nhóm d
ữ liệu được sử dụng nhiều trong các ứng dụng về phân đoạn thị trường, phân
đoạn khách hàng, nhận dạng mẫu, phân loại trang Web, … Ngoài ra phân nhóm dữ liệu
còn có th
ể được sử dụng như một bước tiền xử lý cho các thuật toán KPDL khác.
Chia sẻ với bạn bè của bạn: