Chương 1: t ổng quan về kỹ thuật khám phá tri thức và khai phá d ữ liệu



tải về 235.12 Kb.
Chế độ xem pdf
trang7/9
Chuyển đổi dữ liệu24.05.2022
Kích235.12 Kb.
#52091
1   2   3   4   5   6   7   8   9
Chuong 1 Tong quandata mining

1.4.5.
 
H
ồi quy (Regression) 
H
ồi quy là việc học một hàm ánh xạ từ một mẫu dữ liệu thành một biến dự đoán 
có giá tr
ị thực. Nhiệm vụ của hồi quy tương tự như phân lớp, điểm khác nhau chính là 
ở chỗ thuộc tính để dự báo là liên tục chứ không rời rạc. Việc dự báo các giá trị số 
thường được làm bởi các phương pháp thống kê cổ điển chẳng hạn như hồi quy tuyến 
tính. Tuy nhiên phương pháp mô hình hóa cũng có thể được sử dụng như cây quyết 
định. 
1.4.6.
 
T
ổng hợp hóa (Summarization) 
Là công vi
ệc liên quan đến các phương pháp tìm kiếm một mô tả tập con dữ liệu. 
K
ỹ thuật mô tả khái niệm và tổng hợp hóa thường áp dụng trong việc phân tích dữ liệu 
có tính thăm dò và báo cáo tự động. Nhiệm vụ chính là sản sinh ra các mô tả đặc trưng 
cho m
ột lớp. Mô tả loại này là một kiểu tổng hợp, tóm tắt các đặc tính chung của tất cả 
hay h
ầu hết các mục của một lớp. Các mô tả đặc trưng thể hiện theo luật có dạng sau: 
“N
ếu một mục thuộc về lớp đã chỉ trong tiền đề thì mục đó có tất cả các thuộc tính đã 
nêu trong k
ết luận”.


15 
1.4.7.
 
Mô hình hóa s
ự phụ thuộc (dependency modeling) 
Là vi
ệc tìm kiếm một mô hình mô tả sự phụ thuộc giữa các biến, thuộc tính theo 
hai m
ức. Mức cấu trúc của mô hình mô tả (thường dưới dạng đồ thị), trong đó, các biến 
ph
ụ thuộc bộ phận vào các biến khác. Và mức định lượng mô hình mô tả mức độ phụ 
thu
ộc. Những phụ thuộc này thường được biểu thị dưới dạng theo luật “nếu - thì” - nếu 
ti
ền đề đúng thì kết luận đúng. Về nguyên tắc, cả tiền đề và kết luận đều có thể là sự 
k
ết hợp logic của các giá trị thuộc tính. Trên thực tế, tiền đề thường là nhóm các giá trị 
thu
ộc tính và kết luận chỉ là một thuộc tính. Hơn nữa, hệ thống có thể phát hiện các 
lu
ật phân lớp trong đó tất cả các luật cần phải có cùng một thuộc tính do người dùng 
ch
ỉ ra trong kết luận.
Quan h
ệ phụ thuộc cũng có thể biểu diễn dưới dạng mạng tin cậy Bayes. Đó là đồ 
th
ị có hướng, không chu trình. Các nút biểu diễn thuộc tính và trọng số của liên kết phụ 
thu
ộc giữa các nút đó. 

tải về 235.12 Kb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7   8   9




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương