PhầN 1: thông tin, DỮ liệu và phưƠng thức tổ chức quản lý, khai tháC, chia sẻ thông tin



tải về 3.95 Mb.
trang10/19
Chuyển đổi dữ liệu27.02.2022
Kích3.95 Mb.
#50896
1   ...   6   7   8   9   10   11   12   13   ...   19
BIM-cho-EVN (1)
Sachvui.Com-cong-nghe-blockchain-nhieu-tac-gia, Tam @ Quoc, Hinh ve trong PAS
Kho dữ liệu (Data warehouse)



    1. Khái niệm

  • Data Warehouse là kho dữ liệu tập trung chuyên dùng cho tạo báo cáo và phân tích dữ liệu.

  • Data Warehouse hỗ trợ các truy vấn phức tạp, vừa là điểm tập trung dữ liệu từ nhiều nguồn khác nhau để có được thông tin phân tích đầy đủ nhất. Theo đó Data Warehouse là một tập hợp dữ liệu hướng chủ đề, toàn vẹn, không bị rò rỉ mất mát và có giá trị lịch sử. Cụ thể:



    • Tính hướng chủ đề (Subject – oriented) nghĩa là Data Warehouse tập trung vào việc phân tích các yêu cầu quản lý ở nhiều cấp độ khác nhau trong quy trình ra quyết định. Các yêu cầu phân tích này thường rất cụ thể, và xoay quanh loại hình kinh doanh của doanh nghiệp, ví dụ các công ty phân phối sẽ quan tâm đến tình hình kinh doanh, doanh nghiệp viễn thông quan tâm đến lưu lượng dịch vụ… Tuy nhiên một doanh nghiệp thường quan tâm đến vài chủ đề khác nhau, như công ty phân phối còn phải quan tâm đến kho bãi, chuỗi cung ứng…

    • Tính toàn vẹn (Integrated). Data Warehouse giải quyết các khó khăn trong việc kết hợp dữ liệu từ nhiều nguồn dữ liệu khác nhau, giải quyết các sai khác về tên trường dữ liệu (dữ liệu khác nhau nhưng tên giống nhau), ý nghĩa dữ liệu (tên giống nhau nhưng dữ liệu khác nhau), định dạng dữ liệu (tên và ý nghĩa giống nhau nhưng kiểu dữ liệu khác nhau).

    • Tính bất biến (Nonvolatile) quy định rằng dữ liệu phải thống nhất theo thời gian (bằng cách hạn chế tối đa sửa đổi hoặc xoá dữ liệu), từ đó làm tăng quy mô dữ liệu lên đáng kể so với hệ thống nghiệp vụ (5-10 năm so với 2 đến 6 tháng như Database thông thường).

    • Giá trị lịch sử (time – varying). Data Warehouse có khả năng lấy các giá trị khác nhau của cùng một thông tin và thời điểm xảy ra thay đổi. Ví dụ thông tin địa chỉ, email, số điện thoại của khách hàng có thể thay đổi, nhưng việc thay đổi đó không được phép tác động đến giá trị báo cáo, phân tích thực hiện trước khi sự thay đổi xảy ra.

  • Data Warehouse cho phép người dùng ở mức quản lý ra quyết định thực hiện các phép phân tích tương tác với data bằng hệ thống xử lý phân tích trực tuyến (online analytical processing – OLAP). Ngoài ra Data Warehouse được dùng cho báo cáo, data mining (khai thác dữ liệu) và phân tích thống kê.

  • Database và Data Warehouse khác nhau về mặt khái niệm, có thể coi Database là một thành phần/tập con của Data Warehouse một Database nếu dùng riêng cho các mục đích trên cũng được coi là Data Warehouse đơn giản.



  • Database được ví như cái tủ sách cá nhân, nơi người ta thường xuyên tra cứu, cập nhật, hiệu đính, ghi chú vào lề, thêm mới hoặc chuyển sách đi, Data Warehouse được ví như thư viện quốc gia, nơi các tài liệu kinh điển được đưa đến liên tục để lưu trữ và tham khảo, không ai sửa chữa hoặc chuyển chúng qua chỗ nào khác cả.

  • Data Warehouse có khả năng lưu trữ tới hàng trăm GB hay thậm chí hàng Terabyte. Data Warehouse được xây dựng để tiện lợi cho việc truy cập theo nhiều nguồn, nhiều kiểu dữ liệu khác nhau sao cho có thể kết hợp được cả những ứng dụng của các công nghệ hiện đại và kế thừa được từ những hệ thống đã có sẵn từ trước.




    1. tải về 3.95 Mb.

      Chia sẻ với bạn bè của bạn:
1   ...   6   7   8   9   10   11   12   13   ...   19




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương