Chương 1: t ổng quan về kỹ thuật khám phá tri thức và khai phá d ữ liệu



tải về 235.12 Kb.
Chế độ xem pdf
trang2/9
Chuyển đổi dữ liệu24.05.2022
Kích235.12 Kb.
#52091
1   2   3   4   5   6   7   8   9
Chuong 1 Tong quandata mining

1.2.
 
Quá trình khám phá tri th
ức 
Hình 1.1. Quá trình khám phá tri th
ức 
Quá trình khám phá tri th
ức từ CSDL là một quá trình có sử dụng nhiều phương 
pháp và công c
ụ tin học nhưng vẫn là một quá trình mà trong đó con người là trung 
tâm. Do đó, nó không phải là một hệ thống phân tích tự động mà là một hệ thống bao 
g
ồm nhiều hoạt động tương tác thường xuyên giữa con người và CSDL, tất nhiên là 
v
ới sự hỗ trợ của các công cụ tin học. Người sử dụng hệ thống ở đây phải là người có 
ki
ến thức cơ bản về lĩnh vực cần phát hiện tri thức để có thể chọn được đúng các tập 
con d
ữ liệu, các lớp mẫu phù hợp và đạt tiêu chuẩn quan tâm so với mục đích. Tri thức 
mà ta nói 
ở đây là các tri thức rút ra từ các CSDL, thường để phục vụ cho việc giải 
quy
ết một loạt nhiệm vụ nhất định trong một lĩnh vực nhất định. Do đó, quá trình phát 
Knowledge
Pattern 
Discovery 
Transformed 
Data
Cleansed 
Preprocessed
Preparated 
Data
Target 
Data
Gathering
Data Mining
Selection
Transformati
Cleansing Pre-
processing
Envalution of 
Internet,..




hi
ện tri thức cũng mang tính chất hướng nhiệm vụ, không phải là phát hiện mọi tri thức 
b
ất kỳ mà là phát hiện tri thức nhằm giải quyết tốt nhiệm vụ đề ra.
1.2.1.
 
Gom d
ữ liệu (Gathering) 
T
ập hợp dữ liệu là bước đầu tiên trong quá trình khai phá dữ liệu. Đây là bước được 
khai thác trong m
ột CSDL, một kho dữ liệu và thậm chí các dữ liệu từ các nguồn ứng 
d
ụng Web. 
1.2.2.
 
Trích l
ọc dữ liệu (Selection) 
Ở giai đoạn này lựa chọn những dữ liệu phù hợp với nhiệm vụ phân tích trích rút từ 
CSDL. 

tải về 235.12 Kb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7   8   9




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương