PhầN 1: thông tin, DỮ liệu và phưƠng thức tổ chức quản lý, khai tháC, chia sẻ thông tin



tải về 3.95 Mb.
trang11/19
Chuyển đổi dữ liệu27.02.2022
Kích3.95 Mb.
#50896
1   ...   7   8   9   10   11   12   13   14   ...   19
BIM-cho-EVN (1)
Sachvui.Com-cong-nghe-blockchain-nhieu-tac-gia, Tam @ Quoc, Hinh ve trong PAS
Cấu trúc

  • Kiến trúc cơ bản của Data Warehouse (Nguồn: Internet)



  • Data Warehouse có kiến trúc cơ bản dựa trên nguyên tắc là xây dựng một kho dữ liệu thống nhất từ nhiều nguồn dữ liệu khác nhau để phục vụ truy vấn gồm 3 lớp chính:

    • Lớp dữ liệu nguồn (Data Sources): Data Warehouse tổng hợp dữ liệu từ rất nhiều nguồn khác nhau. Điều này thể hiện đặc tính tích hợp của Data Warehouse. Dữ liệu nguồn có thể là dữ liệu có sẵn trong hệ thống tác nghiệp của doanh nghiệp và cũng có thể là dữ liệu lấy từ nguồn bên ngoài doanh nghiệp. Dữ liệu có thể là loại có cấu trúc chặt chẽ như dữ liệu quan hệ đã được chuẩn hoá hay có thể là loại phi cấu trúc như các văn bản thông thường.

    • Lớp Warehouse: Lớp này chứa đựng dữ liệu đã được tổng hợp cùng siêu dữ liệu mô tả chúng cũng như các tiến trình tổng hợp, phân bổ dữ liệu. Hai thành phần quan trọng nhất của lớp Warehouse là dữ liệu và siêu dữ liệu. Chúng phải được lưu giữ và mô tả nhất quán về nội dung (ý nghĩa dữ liệu) cũng như hình thức (khuôn dạng dữ liệu). Để tăng tốc cho việc đáp ứng trả lời truy vấn thì dữ liệu trong Data Warehouse thường được để sẵn dưới dạng tổng kết.

    • Lớp Users: có nhiệm vụ tương tác với người dùng cuối. Data Warehouse có đặc điểm quan trọng là cung cấp thông tin cho rất nhiều người sử dụng với những yêu cầu không thể dự đoán trước, vì vậy nhìn chung lớp người dùng có cấu trúc phức tạp. Hơn nữa, người dùng ở đây có thể sử dụng nhiều công cụ khai thác và truy xuất dữ liệu khác nhau nên giao diện giữa lớp Warehouse và người dùng cũng đa dạng.

  • Do tính đa dạng của lớp ứng dụng và lớp người dùng nên chúng không thể giao tiếp với Data Warehouse theo các giao diện chuẩn mà thường cần phải có những công cụ được thiết kế đặc biệt chuyên thực hiện công việc này. Dữ liệu khi được đưa vào hoặc đưa ra đòi hỏi phải có những tiến trình xử lý phức tạp. Các ứng dụng đảm nhiệm công việc này thường tạo ra các kho trung gian và phải thực thi nhiều bước chuyển tiếp. Có hai tiến trình xử lý gồm:

    • Tập hợp dữ liệu đưa vào Warehouse: ngoài việc đọc hiểu các cấu trúc dữ liệu, tiến trình này còn phải thực hiện nhiều chức năng khác để bảo đảm tính nhất quán của dữ liệu trong Warehouse.

    • Phân bổ dữ liệu đến người dùng cuối: có nhiều công cụ để thực hiện việc này, nhưng nói chung dữ liệu thường được xử lý trước rồi mới hiển thị tới người dùng cuối.

  • Như vậy có thể thấy, Data Warehouse là yếu tố cơ bản, đóng vai trò then chốt trong việc tập hợp, xử lý dữ liệu thô trong doanh nghiệp/tổ chức. Do lượng thông tin trong một doanh nghiệp/tổ chức có thể đến từ nhiều nguồn khác nhau, dẫn đến việc dữ liệu không đồng nhất, bên cạnh đó khối lượng dữ liệu sẽ tăng nhanh theo thời gian. Điều này dẫn đến quá tải và giảm đáng kể khả năng truy xuất nếu đơn vị chỉ dụng một database duy nhất.

  • Xây dựng Data Warehouse là công đoạn đầu tiên và cơ bản trong quá trình tích hợp hệ thống báo cáo quản trị thông minh cho doanh nghiệp/tổ chức. Từ đó hệ thống báo cáo có thể truy xuất, xử lý dữ liệu một cách nhanh chóng và dễ dàng.


  1. tải về 3.95 Mb.

    Chia sẻ với bạn bè của bạn:
1   ...   7   8   9   10   11   12   13   14   ...   19




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương