Geographic information quality evaluation procedures


Bảng 1 — Các bước quy trình



tải về 5.76 Mb.
trang4/16
Chuyển đổi dữ liệu08.06.2018
Kích5.76 Mb.
#39732
1   2   3   4   5   6   7   8   9   ...   16


Bảng 1 — Các bước quy trình

Các bước

Hoạt động thực thi

Mô tả

1

Nhận dạng các thành phần chất lượng dữ liệu có thể áp dụng, các thành phần phụ chất lượng dữ liệu và phạm vi chất lượng dữ liệu

Các thành phần chất lượng dữ liệu, các thành phần phụ chất lượng dữ liệu và phạm vi chât lượng dữ liệu cần kiểm tra được xác định theo yêu cầu của ISO 19113. Điều này được lặp lại nhiều lần kiểm tra theo thông số kỹ thuật sản phẩm hay yêu cầu của người sử dụng.

2

Nhận dạng đo lường chất lượng dữ liệu

Đo lường chất lượng dữ liệu, kiểu giá trị chất lượng dữ liệu và đơn vị giá trị chất lượng dữ liệu (nếu có) được xác định cho mỗi lần kiểm tra. Phụ lục D cung cấp các ví dụ về đo lường chất lượng dữ liệu cho các thành phần chất lượng dữ liệu và thành phần phụ chất lượng dữ liệu theo ISO 19113, Phụ lục D thông qua các ví dụ này giúp người sử dụng lựa chọn phương pháp đo lường.

3

Chọn và áp dụng phương pháp đánh giá chất lượng

Cần chọn phương pháp đánh giá chất lượng dữ liệu cho từng phép đo chất lượng dữ liệu đã được xác định.

Chú thích: Mô tả không gian các kết quả (nhận được từ nội suy không gian các kết quả, trình bày đồ họa…) có thể hữu ích, không tương ứng với kết quả, nhưng với các tập dữ liệu khác nhau, mặc dù có liên quan.



4

Xác định kết quả chất lượng dữ liệu

Kết quả chất lượng dữ liệu định lượng, một giá trị chất lượng dữ liệu hay tập các giá trị chất lượng dữ liệu, đơn vị giá trị chất lượng dữ liệu và ngày tháng năm là kết quả của việc áp dụng phương pháp đánh giá chất lượng.

5

Xác định tính tương thích

Bất kỳ khi nào mức chất lượng phù hợp được định rõ trong thông số kỹ thuật sản phẩm hay các yêu cầu người sử dụng, kết quả chất lượng dữ liệu được so sánh với nó để xác định mức độ tương thích. Sự đáp ứng về dữ liệu (chấp nhận/không chấp nhận) là việc so sánh kết quả chất lượng dữ liệu định lượng với mức chất lượng tương thích.

Table 1 — Process steps

Process

step

Action

Description

1

Identify an applicable data quality element, data quality subelement, and data quality scope

The data quality element, data quality subelement, and data quality scope to be tested shall be identified in accordance with the requirements of ISO 19113. This is repeated for as many different tests as required by the product specification or user requirements.

2

Identify a data quality measure

A data quality measure, data quality value type and, if applicable, a data quality value unit shall be identified for each test to be performed. Annex D provides examples of data quality measures for the data quality elements and data quality subelements given in ISO 19113. Annex D, by these examples, provides assistance to the user in selection of a measure.

3

Select and apply a data quality evaluation method

A data quality evaluation method for each identified data quality measure shall be selected.

NOTE A spatial description of the results, (achievable by spatial interpolation of the results, graphical portrayal, etc.) might be useful, corresponding not to a result, but to a different, although related, dataset.

4

Determine the data quality result

A quantitative data quality result, a data quality value or set of data quality values, a data quality value unit and a date is the output of applying the method.

5

Determine conformance

Whenever a conformance quality level has been specified in the product specification or user requirements, the data quality result is compared with it to determine conformance. A conformance data quality result (pass-fail) is the comparison of the quantitative data quality result with a conformance quality level.



7. Các phương pháp đánh giá chất lượng

7.1. Phân loại các phương pháp đánh giá chất lượng

Thủ tục đánh giá chất lượng dữ liệu được hoàn thành thông qua việc áp dụng một hay nhiều các phương pháp đánh giá chất lượng. Các phương pháp đánh giá chất lượng được chia thành hai loại: trực tiếp và gián tiếp.

Phương pháp xác định chất lượng dữ liệu trực tiếp thông qua việc so sánh dữ liệu với các thông tin tham khảo bên trong và/hay bên ngoài. Các phương pháp gián tiếp suy luận hay ước tính chất lượng dữ liệu bằng cách sử dụng thông tin trên dữ liệu như là nguồn gốc. Các phương pháp đánh giá chất lượng trực tiếp có thể được chia thành các loại nhỏ theo các nguồn gốc thông tin cần thiết để thực hiện đánh giá chất lượng.

Hình 2 miêu tả cấu trúc phân loại này



  1. Data quality evaluation methods

    1. Classification of data quality evaluation methods

A data quality evaluation procedure is accomplished through the application of one or more data quality evaluation methods. Data quality evaluation methods are divided into two main classes, direct and indirect.

Direct methods determine data quality through the comparison of the data with internal and/or external reference information. Indirect methods infer or estimate data quality using information on the data such as lineage. The direct evaluation methods are further subclassified by the source of the information needed to perform the evaluation.



Figure 2 depicts this classification structure



Hình 2. Phân loại các phương pháp đánh giá chất lượng dữ liệu (tham khảo)



Figure 2 — Classification of data quality evaluation methods (informative)

7.2. Các phương pháp đánh giá trực tiếp

7.2.1 Các loại phương pháp đánh giá trực tiếp

Phương pháp đánh giá trực tiếp được chia thành phương pháp đánh giá trong và phương pháp đánh giá ngoài. Tất cả dữ liệu cần thiết để thực hiện phương pháp đánh giá chất lượng dữ liệu trực tiếp trong là nội bộ tập dữ liệu được đánh giá.

VÍ DỤ 1. Tất cả dữ liệu cần thiết để thực hiện kiểm tra sự ổn định logic về sự ổn định về topo của đường biên khép kín nằm trong tập dữ liệu có cấu trúc topo.

Đánh giá chất lượng trực tiếp bên ngoài cần sử dụng dữ liệu tham khảo ngoài tập dữ liệu được đánh giá.

VÍ DỤ 2. Dữ liệu cần thực hiện thử nghiệm tính đầy đủ đối với tên đường trong tập dữ liệu yêu cầu nguồn thông tin khác về tên đường.

VÍ DỤ 3. Phép kiểm tra độ chính xác vị trí cần tập dữ liệu tham chiếu hay đo mới.



    1. Direct evaluation methods

      1. Types of direct evaluation methods

The direct evaluation method is further subdivided into internal and external. All the data needed to perform an internal direct data quality evaluation method is internal to the dataset being evaluated.

EXAMPLE 1 All the data necessary to perform a logical consistency test for topological consistency of boundary closure resides in a topologically structured dataset.

External direct quality evaluation requires reference data external to the dataset being tested.

EXAMPLE 2 The data needed to perform a completeness test for the road names in a dataset requires another information source of road names.



EXAMPLE 3 A positional accuracy test requires a reference dataset or a new survey.


7.2.2. Điều kiện để hoàn thành việc đánh giá trực tiếp

Đối với cả hai phương pháp đánh giá trong và đánh giá ngoài, có hai điều cần xem xét, tự động hay không tự động và kiểm tra toàn bộ hay lấy mẫu.

Các thành phần chất lượng dữ liệu và các thành phần phụ chất lượng dữ liệu được kiểm tra dễ dàng bằng các công cụ tự động bao gồm như sau:

a) sự ổn định về logic: sự ổn định về định dạng

Ví dụ: kiểm tra các trường dữ liệu với đầu vào dương

b) sự ổn định logic: sự ổn định topo

Ví dụ Poligon khép kín

c) sự ổn định logic: sự ổn định vùng

Ví dụ: đường danh giới bị vi phạm, giá trị vùng xác định không đúng.

d) Tính đầy đủ: không đầy đủ;

Ví dụ kiểm tra so sánh các tên đường từ file khác

e) Tính đầy đủ: đầy đủ

Ví dụ: kiểm tra so sánh các tên đường từ file khác

f) Độ chính xác thời gian: độ ổn định về thời gian

Ví dụ kiểm tra tất cả các bản ghi đối với phạm vi thích hợp về thời gian.


      1. Means of accomplishing direct evaluation

For both external and internal evaluation methods, there are two considerations, automated or non-automated and full inspection or sampling.

Data quality elements and data quality sub-elements which are easily checked by automated means include the following:

  1. logical consistency: format consistency;

Example: Check data fields for positive entry

  1. logical consistency: topological consistency;

Example: Polygon closure

  1. logical consistency: domain consistency;

Example: Bounds violations, specified domain value violations

  1. completeness: omission;

Example: Comparison check of street names from another file.

  1. completeness: commission;

Example: Comparison check of street names from another file.

  1. temporal accuracy: temporal consistency;

Example: Check all records for appropriate range of dates.

7.2.3. Kiểm tra tính đầy đủ

Kiểm tra đầy đủ yêu cầu thử nghiệm tất cả các đối tượng trong tập dữ liệu đã được xác định theo phạm vi chất lượng dữ liệu. Bảng 2 mô tả quy trình kiểm tra đầy đủ sẽ được sử dụng.




      1. Full inspection

Full inspection requires testing every item in the population specified by the data quality scope. Table 2 describes the procedure for full inspection that shall be used.


Bảng 2 - Thủ tục kiểm tra tính đầy đủ

Các bước thủ tục

Mô tả

Xác định mẫu

Mẫu là một đơn vị nhỏ nhất cần kiểm tra. Mẫu có thể là đối tượng, thuộc tính đối tượng hay quan hệ đối tượng.

Kiểm tra các mẫu trong phạm vi chất lượng dữ liệu

Kiểm tra tất cả mẫu trong phạm vi chất lượng dữ liệu

Table 2 — The procedure for full inspection

Procedure step

Description

Define items

An item is a minimum unit to be inspected. An Item can be a feature, a feature attribute or a feature relationship.

Inspect items in the data quality scope

Inspect every item it the data quality scope.

CHÚ THÍCH Kiểm tra đầy đủ phù hợp nhất cho những nhóm nhỏ hay các phép thử có thể thực hiện bằng phương tiện tự động.

NOTE Full inspection is most appropriate for small populations or for tests that can be accomplished by automated means.




7.2.4. Lấy mẫu

Lấy mẫu yêu cầu kiểm tra đầy đủ các mục trong nhóm đủ để nhận được kết quả chất lượng dữ liệu. Bảng 3 mô tả thủ tục lấy mẫu sẽ được sử dụng.



      1. Sampling

Sampling requires testing sufficient items in the population in order to achieve a data quality result. Table 3 describes the sampling procedure that shall be used.




Bảng 3 — Thủ tục lấy mẫu

Các bước

Mô tả

Định nghĩa phương pháp lấy mẫu

Các ví dụ lấy mẫu được đưa ra trong phụ lục E. Các phương pháp này bao gồm cả lấy mẫu ngẫu nhiên, lấy mẫu phân tầng (ví dụ hướng dẫn kiểu đối tượng, quan hệ đối tượng hay vùng), lấy mẫu theo phạm vi và lấy mẫu không ngẫu nhiên.

Xác định mẫu

Mẫu là một đơn vị nhỏ nhất cần kiểm tra. Mẫu có thể là đối tượng, thuộc tính đối tượng hay quan hệ đối tượng.

Phân chia phạm vi đối tượng thành các mảnh

Mảnh là tập các mẫu trong phạm vi chất lượng dữ liệu từ đó mẫu được mô tả và kiểm tra. Từng mảnh có thể bao gồm các đối tượng được sản xuất trong cùng điều kiện và thời gian.

Phân chia mảnh thành các đơn vị lấy mẫu

Đơn vị lấy mẫu là vùng của mảnh nơi được tiến hành kiểm tra

Xác định tỷ lệ mẫu và kích thước mẫu

Tỷ lệ lẫy mẫu cho biết thông tin bao nhiêu mẫu trong toàn bộ số mẫu được lấy ra để kiểm tra đối với từng mảnh

Chọn đơn vị lấy mẫu

Chọn số lượng yêu cầu đơn vị lấy mẫu để tỷ lệ lấy mẫu hay kích thước lấy mẫu cho các mục được hoàn thành.

Kiểm tra các mẫu trong các đơn vị lấy mẫu

Kiểm tra tất cả các mẫu trong các đơn vị lấy mẫu

Table 3 — Sampling procedure

Procedure step

Description

Define a sampling method

Examples of sampling methods are given in annex E. Those methods include simple random sampling, stratified sampling (e.g. guided by feature type, a feature relationship or an area), multistage sampling and non-random sampling.

Define items

Item is a minimum unit to be inspected. An Item can be a feature, a feature attribute or a feature relationship.

Divide data quality scope (population) into lots

A lot is a collection of items in the data quality scope from which a sample shall be drawn and inspected. Each lot shall, as far as possible, consists of items produced under the same conditions and at the same time.

Divide lots to sampling units

Sampling unit is the area of the lot where inspection is conducted.

Define the sampling ratio or sample size

A sampling ratio gives information on how many items on average are extracted for inspection from each lot.

Select sampling units

Select required number of sampling units so that sampling ratio or sample size for items is fulfilled.

Inspect items in the sampling units

Inspect every item it the sampling units.



Thủ tục lấy mẫu sẽ được báo cáo theo quy định tại điều 8.

ISO 2859 và ISO 3951-1 có thể được áp dụng để lấy mẫu cho việc đánh giá sự phù hợp với thông số kỹ thuật sản phẩm. Các tiêu chuẩn này ban đầu được phát triển để sử dụng cho dữ liệu phi không giam. Phụ lục E của tiêu chuẩn này đưa ra ví dụ mô tả cách áp dụng ISO 2859 và ISO 3951 và cung cấp hướng dẫn làm thế nào để xác định mẫu và đưa ra phương pháp lấy mẫu có lưu ý đến phân bố địa lý của dữ liệu.

Độ tin cậy của kết quả chất lượng dữ liệu cần được phân tích khi sử dụng lấy mẫu, đặc biệt, khi sử dụng kích thước mẫu nhỏ và các phương pháp khác đơn giản hơn so với lấy mẫu ngẫu nhiên.


The sampling procedure shall be reported in accordance with clause 8.

ISO 2859 and ISO 3951-1 may be applied to sampling for evaluating conformance to a product specification. These standards were originally developed for non-spatial use. Annex E of this International Standard gives examples describing how to apply ISO 2859 and ISO 3951 and provides guidelines on how to define samples and devise sampling methods taking the geographic nature of the data into account.

The reliability of the data quality result should be analysed when using sampling; especially, when using small sample sizes and methods other than simple random sampling.


7.3. Phương pháp đánh giá gián tiếp

Phương pháp đánh giá gián tiếp là phương pháp đánh giá chất lượng tập dữ liệu dựa trên cơ sở hiểu biết bên ngoài. Những hiểu biết bên ngoài có thể bao gồm, nhưng không hạn chế, các yếu tố tổng quan chất lượng dữ liệu và các báo cáo chất lượng khác về tập dữ liệu hay dữ liệu được sử dụng để thành lập tập dữ liệu.

CHÚ THÍCH 1 Phương pháp này được khuyến cáo chỉ sử dụng trong trường hợp phương pháp đánh giá trực tiếp không sử dụng được.

CHÚ THÍCH 2 Sử dụng các thông tin ghi lại việc sử dụng tập dữ liệu. Điều này rất thuận lợi khi tìm kiếm tập dữ liệu được sản xuất hay sử dụng cho những mục đích cụ thể.

CHÚ THÍCH 3 Thông tin nguồn gốc ghi lại thông tin về việc thành lập hay lịch sử tập dữ liệu. Bao gồm các thông tin về ví dụ, nguồn dữ liệu sử dụng để tạo tập dữ liệu hay các qui trình sản xuất được áp dụng. Điều này rất thuận lợi khi xác định sự phù hợp của tập dữ liệu về một công việc nào đó. Ví dụ siêu dữ liệu về nguồn gốc liên quan đến file mô hình số địa hình được thiết lập bằng các công cụ xây dựng mô hình lập thể từ các ảnh chụp trong những điều kiện nhất định. Kinh nghiệm chỉ cho người đánh giá rằng sai số mặt phẳng RMSE sẽ khoảng 10 mét đối với loại ảnh này. Hay ví dụ khác: nguồn gốc siêu dữ liệu về số hóa bản đồ địa hình tỷ lệ 1:25000 cho biết tính tương thích của dữ liệu với mục tiêu lập bản đồ nền phục vụ qui hoạch trong thành phố.

CHÚ THÍCH 4 Thông tin về mục tiêu trình bày về tập dữ liệu được sản xuất. Mục đích có thể là hỗ trợ những yêu cầu đặc biệt hay tập dữ liệu có mục đích chung cho một số công việc. Điều này rất có lợi khi xác định giá trị về tập dữ liệu.



    1. Indirect evaluation method

The indirect evaluation method is a method of evaluating the quality of a dataset based on external knowledge. This external knowledge may include, but is not limited to, data quality overview elements and other quality reports on the dataset or data used to produce the dataset.

NOTE 1 This method is recommended only if direct evaluation methods cannot be used.



NOTE 2 Usage information records uses of a dataset. This is helpful when searching for datasets that have been produced or used for specific purposes.

NOTE 3 Lineage information records information about the production and history of the dataset. It includes information about, for example, source materials to produce a dataset or the production processes applied. This is useful when determining the suitability of a dataset for a given use. An example is lineage metadata relating to a digital terrain model file that has been created by means of stereo-correlation from images captured under certain conditions. Experience tells the evaluator that the horizontal positional RMSE is 10 metres for this type of imagery. Or for example, lineage metadata of a digitised 1:25 000 scale topographic map indicates conformance to a town planner's requirements for a base map.

NOTE 4 Purpose information describes the purpose for which the dataset was produced. A purpose may be in support of a specific requirement or the dataset may be a general purpose dataset for several uses. This is useful when identifying the possible value of a dataset.

7.4 Các ví dụ đánh giá chất lượng dữ liệu

Ví dụ về các phương pháp điển hình được sử dụng và áp dụng như thế nào được trình bày trong phụ lục F, G và H.



    1. Data quality evaluation examples

Examples of typical methods used and how they may be applied are described in annexes F, G and H.

8. Báo cáo thông tin đánh giá chất lượng dữ liệu

8.1. Báo cáo dạng siêu dữ liệu

Kết quả chất lượng có tính định lượng sẽ được báo cáo bằng siêu dữ liệu theo ISO 19115 bao gồm mô hình liên quan và từ điển dữ liệu.



  1. Reporting data quality evaluation information

    1. Reporting in metadata

Quantitative quality results shall be reported as metadata in compliance with ISO 19115, which contains the related model and data dictionary.

8.2. Báo cáo trong báo cáo đánh giá chất lượng

Có hai điều kiện để lập một báo cáo đánh giá chất lượng



  1. Khi các kết quả chất lượng được báo cáo bằng siêu dữ liệu là chấp nhận/không chấp nhận.

  2. khi các kết quả chất lượng dữ liệu kết hợp được tổng hợp.

Báo cáo được yêu cầu trong điều kiện sau để giải thích quá trình tổng hợp được thực hiện như thế nào và giải thích như thế nào về ý nghĩa kết quả tổng hợp. Mặc dù báo cáo đánh giá chất lượng có thể được thiết lập ở nhiều thời điểm, cung cấp các thông tin chi tiết hơn so với báo cáo bằng siêu dữ liệu, nhưng báo cáo đánh giá chất lượng không thể được sử dụng thay thế báo cáo bằng siêu dữ liệu.

Báo cáo đánh giá chất lượng sẽ được thực hiện theo phụ lục I, trong đó có mô hình và từ điển dữ liệu liên quan.



    1. Reporting in a quality evaluation report

There are two conditions under which a quality evaluation report shall be produced:

  1. When data quality results reported as metadata are only reported as pass/fail.

  2. When aggregated data quality results are generated.

The report is required in the latter condition to explain how aggregation was done and how to interpret the meaning of the aggregate result. However, a quality evaluation report may be created at any other time, such as to provide more detail than reported as metadata, but a quality evaluation report cannot be used in lieu of reporting as metadata.

A quality evaluation report shall be produced in compliance with annex I which contains the relevant model and data dictionary.




8.3. Lập báo cáo kết quả chất lượng dữ liệu tổng hợp

Khi những kết quả chất lượng được tổng hợp vào một kết quả chất lượng riêng để báo cáo chất lượng về một tập dữ liệu, kết quả chất lượng dữ liệu tổng hợp sẽ được báo cáo bằng siêu dữ liệu và trong báo cáo chất lượng dữ liệu. Kết quả chất lượng dữ liệu sẽ được thông báo như là kiểu “tổng hợp”. Phụ lục J mô tả sản phẩm về các kết quả chất lượng dữ liệu tổng hợp và phụ lục H cung cấp ví dụ về sản phẩm.




    1. Reporting aggregated data quality result

When several quality results are aggregated into a single quality result for reporting the quality of a dataset, the aggregated data quality result shall be reported as metadata and in the data quality report. The data quality result shall be reported as type ‘aggregate’. Annex J describes the production of aggregate data quality results and annex H provides a production example.




Phụ lục A

(quy định)



Bộ thử nghiệm giản lược

Annex A

(normative)



Abstract test suites


A.1 Giới thiệu

Phụ lục qui định ba lớp phù hợp



  • thủ tục đánh giá chất lượng (A.2)

  • đánh giá chất lượng dữ liệu (A.3) và

  • lập báo cáo chất lượng dữ liệu (A.4)

Bất cứ thủ tục đánh giá chất lượng nào được cho là phù hợp với Tiêu chuẩn quốc tế này sẽ chấp nhận tất cả yêu cầu được mô tả trong Điều A.2. Tất cả đánh giá chất lượng dữ liệu được cho là phù hợp với Tiêu chuẩn quốc tế này sẽ chấp nhận tất cả những yêu cầu được mô tả trong Điều A.3. Tất cả báo cáo chất lượng dữ liệu yêu cầu sự phù hợp với Tiêu chuẩn quốc tế này sẽ chấp nhận tất cả các yêu cầu được mô tả trong Điều A.4.

CHÚ THÍCH Tất cả các trường hợp thử nghiệm là kiểu thử nghiệm ‘cơ bản’.



A.1 Introduction

This annex defines three classes of conformance

- quality evaluation procedure (A.2),

- evaluating data quality (A.3), and

- reporting data quality (A.4).

Any quality evaluation procedures claiming conformance with this International Standard shall pass all the requirements described in A.2. Any evaluation of data quality claiming conformance with this International Standard shall pass all the requirements described in A.3. Any report of data quality claiming conformance with this International Standard shall pass all the requirements described in A.4.



NOTE All of the test cases are of test type 'basic'.


A.2. Các thủ tục đánh giá chất lượng

Bộ thử nghiệm giản lược đối với lớp 1 như sau.



  1. Mục đích thử nghiệm: để đảm bảo thủ tục đánh giá chất lượng được thực hiện theo Tiêu chuẩn quốc tế này.

  2. Phương pháp thử nghiệm: chấp nhận tất cả các yêu cầu mô tả trong Điều A.3 và A.4

  3. Tham khảo: Điều A3 và A.4.

A. 2 Quality evaluation procedures

Abstract test suite for class 1 shall be as follows.



  1. Test purpose: to assure the quality evaluation procedure was produced in accordance with this International Standard.

  2. Test method: pass all the requirements described in A.3 and A.4.

  3. Reference: A.3 and A.4.

A.3 Đánh giá chất lượng dữ liệu

Bộ thử nghiệm giản lược đối với lớp 2 như sau.



  1. Mục đích thử nghiệm: Để đảm bảo chất lượng dữ liệu được báo cáo theo Điều 6.

  2. Phương pháp thử nghiệm: so sánh thủ tục đánh giá chất lượng với đánh giá chất lượng khi thích hợp.

  3. Tham khảo: ISO 19114:2003, Điều 6.

A.3 Evaluating data quality

Abstract test suite for class 2 shall be as follows.

  1. Test purpose: To assure data quality has been reported in accordance with Clause 6.



  1. Test method: Compare the quality evaluation procedure with the quality ecaluation as appropriate.

  2. Reference: ISO 19114:2003, Clause 6.

A.4 Báo cáo chất lượng dữ liệu

Bộ thử nghiệm giản lược đối với lớp 3 như sau:



  1. Mục đích thử nghiệm: để đảm bảo chất lượng dữ liệu được báo cáo theo Điều 8.

  2. Phương pháp thử nghiệm: so sánh đánh giá chất lượng được báo cáo để đảm bảo kết quả chất lượng dữ liệu được báo cáo theo Điều 8 và các phụ lục liên quan.

  3. Tham khảo: ISO 19114:2003, Điều 8.




A.4 Reporting data quality

Abstract test suite for class 3 shall be as follows:

  1. Test purpose: To assure data quality has been reported in accordance with clause 8.

  2. Test method: Compare the quality evaluation reported to assure data quality results were appropriately reported in accordance with Clause 8 and applicable annexes.

  3. Reference: ISO 19114:2003, Clause 8.






Phụ lục B

(tham khảo)


Sử dụng các thủ tục đánh giá chất lượng

Annex B

(informative)



Uses of quality evaluation procedures

B.1 Giới thiệu

Các thủ tục đánh giá chất lượng có thể được sử dụng trong các giai đoạn khác nhau về vòng đời sản phẩm. Phụ lục này cung cấp ví dụ về các giai đoạn vòng đời của sản phẩm, theo đó các thủ tục đánh giá chất lượng có thể được áp dụng.



A.1 Introduction

Quality evaluation procedures may be used in different phases of a product life cycle. This annex provides examples of stages of a product’s life cycle during which quality evaluation procedures may be applied.




B. 2 Phát triển thông số kỹ thuật sản phẩm hoặc yêu cầu của người sử dụng

Khi phát triển thông số kỹ thuật sản phẩm hoặc yêu cầu của người sử dụng, các thủ tục đánh giá chất lượng có thể được dùng để hỗ trợ trong việc thiết lập mức chất lượng phù hợp cần được đáp ứng bởi sản phẩm cuối cùng. Thông số kỹ thuật sản phẩm hoặc yêu cầu của người sử dụng phải bao gồm mức chất lượng phù hợp với các tập dữ liệu và các thủ tục đánh giá chất lượng được áp dụng trong quá trình sản xuất và cập nhật.



B.2 Development of a product specification or user requirements

When developing a product specification or user requirement, quality evaluation procedures may be used to assist in establishing conformance quality levels that should be met by the final product. A product specification or user requirement should include conformance quality levels for the dataset and quality evaluation procedures to be applied during production and updating.



B.3 Kiểm soát chất lượng trong quá trình xây dựng tập dữ liệu

Ở khâu sản xuất, nhà sản xuất có thể áp dụng các thủ tục đánh giá chất lượng, hoặc thiết lập một cách rõ ràng hoặc không có trong thông số kỹ thuật sản phẩm, như một phần của quá trình kiểm soát chất lượng. Mô tả các thủ tục đánh giá chất lượng được áp dụng, khi được sử dụng để kiểm soát chất lượng sản xuất, phải được báo cáo bằng nguồn gốc siêu dữ liệu, bao gồm, nhưng không nhất thiết giới hạn đối với việc áp dụng các thủ tục đánh giá chất lượng, thiết lập mức chất lượng phù hợp, và kết quả.



B.3 Quality control during dataset creation

At the production stage, the producer may apply quality evaluation procedures, either explicitly established or not contained in the product specification, as part of the process of quality control. The description of the applied quality evaluation procedures, when used for production quality control, should be reported as lineage metadata, including, but not necessarily limited to, the quality evaluation procedures applied, conformance quality levels established, and the results.



B. 4 kiểm tra cho phù hợp với thông số kỹ thuật sản phẩm

Sau khi hoàn thành việc sản xuất, một quá trình đánh giá chất lượng được sử dụng đối với sản xuất và báo cáo kết quả chất lượng dữ liệu. Những kết quả này có thể được sử dụng để xác định xem một tập dữ liệu có phù hợp với thông số kỹ thuật sản phẩm của nó. Nếu tập dữ liệu được chấp nhận trong quá trình kiểm tra, bao gồm các thủ tục đánh giá chất lượng, các tập dữ liệu được coi là đã sẵn sàng để sử dụng. Các kết quả của hoạt động kiểm tra phải được báo cáo theo quy định tại Điều 8.

Kết quả của việc kiểm tra sẽ là hoặc là chấp nhận hoặc từ chối tập dữ liệu. Nếu tập dữ liệu bị từ chối, sau khi dữ liệu đã được sửa chữa, cần phải kiểm tra lại trước khi sản phẩm có thể được coi là phù hợp với các thông số kỹ thuật sản phẩm.


B.4 Inspection for conformance to a product specification

On completion of the production, a quality evaluation process is used to produce and report data quality results. These results may be used to determine whether a dataset conforms to its product specification. If the dataset passes inspection, composed of a set of quality evaluation procedures, the dataset is considered to be ready for use. The results of the inspection operation should be reported in accordance with clause 8.

The outcome of the inspection will be either acceptance or rejection of the dataset. If the dataset is rejected, then after the data has been corrected, a new inspection will be required before the product can be deemed to be in conformance with the product specification.


B. 5 Đánh giá tập dữ liệu phù hợp với yêu cầu người sử dụng

Thủ tục đánh giá chất lượng được sử dụng để thiết lập các mức chất lượng phù hợp đối với một tập dữ liệu để đáp ứng yêu cầu của người dùng. Phương pháp gián tiếp cũng như trực tiếp có thể được sử dụng trong phân tích dữ liệu phù hợp với yêu cầu người sử dụng. Các kết quả đánh giá chất lượng cho phù hợp với yêu cầu người sử dụng có thể được báo cáo bằng siêu dữ liệu sử dụng cho các tập dữ liệu.



B.5 Evaluation of dataset conformance to user requirements

Quality evaluation procedures are used to establish the conformance quality levels for a dataset to meet a user requirement. Indirect as well as direct methods may be used in analyses of dataset conformance to user requirements. The results of the quality evaluation for conformance to user requirements may be reported as usage metadata for the dataset.




B.6 Kiểm soát chất lượng trong quá trình cập nhật tập dữ liệu

Các thủ tục đánh giá chất lượng được áp dụng trong quá trình cập nhật tập dữ liệu, cả hai cho các đối tượng được sử dụng để cập nhật và làm chuẩn chất lượng của tập dữ liệu sau khi cập nhật. Hướng dẫn sử dụng của tiêu chuẩn ISO 19113 và Tiêu chuẩn quốc tế này trên tập dữ liệu động được nêu trong phụ lục C.



B.6 Quality control during dataset update

Quality evaluation procedures are applied to dataset update operations, both to the items being used for update and to benchmark the quality of the dataset after update has occurred. The guidance for use of ISO 19113 and this International Standard on dynamic datasets is given in annex C.





Phụ lục C

(tham khảo)



Áp dụng các thủ tục đánh giá chất lượng đối với tập dữ liệu động

Annex C

(informative)

Applying quality evaluation procedures to dynamic datasets


C.1 Giới thiệu

Phụ lục này mô tả các thủ tục đánh giá chất lượng có thể được áp dụng đối với tập dữ liệu động như thế nào. Ở đây, tập dữ liệu động được xác định là tập dữ liệu được cập nhật thường xuyên và cho tất cả các mục đích thực tế chúng đang tiếp tục được cập nhật. Ví dụ, một tập dữ liệu địa chính trực tuyến có thể nhận được cập nhật vài phút một lần. Về cơ bản có hai cách để xác định và báo cáo chất lượng của một tập dữ liệu động: độ chuẩn xác và liên tục.



C.1 Introduction

This annex describes how quality evaluation procedures may be applied to dynamic datasets. Here dynamic datasets are defined as datasets that receive updates so frequently that for all practical purposes they are continuously being updated. For example, an online cadastre dataset may receive updates every few minutes. There are basically two ways to determine and report the quality of a dynamic dataset: benchmark and continuous.



C.2 Xác định và lập báo cáo chất lượng về một tập dữ liệu động

C.2.1 Thủ tục chuẩn

Thủ tục chuẩn được dựa trên việc thiết lập về một tần số xuất hiện báo cáo phù hợp, ví dụ như hàng tuần hoặc ba lần một tháng, và lập một bản sao của dữ liệu tại thời điểm báo cáo. Sau đó các bản sao được kiểm tra như thể nó là một tập dữ liệu tĩnh. Kiểu kiểm tra và báo cáo này sẽ cung cấp chất lượng dữ liệu về ngày tháng/thời gian của bản sao.



C.2 Determining and reporting the quality of a dynamic dataset

C.2.1 Benchmark procedure

The benchmark procedure is based on the establishment of a suitable reporting frequency, for example weekly or tri-monthly, and making a copy of the dataset at the reporting date. Then the copy is tested as if it were a static dataset. This type of testing and reporting will provide quality of the dataset as of the date/time of the copy.



C.2.2 Thủ tục tiến hành

Thủ tục tiến hành dựa trên việc kiểm tra cập nhật và đánh giá tác động của các bản cập nhật. Điều này tương đương với việc nhúng các thủ tục đánh giá chất lượng được đưa ra trong tiêu chuẩn này thành một tiêu chuẩn kiểu ISO 9000 về thủ tục định hướng xử lý. Vì thủ tục này chỉ có thể cung cấp hiện trạng chất lượng của các đơn vị được cập nhật, cần kết hợp cả hai thủ tục chuẩn và thủ tục tiến hành như được mô tả trong C.3 để thiết lập chất lượng cho các cơ sở dữ liệu được cập nhật.



C.2.2 Continuous procedure

The continuous procedure is based on testing the updates and evaluating the impact of the updates. This is equivalent to embedding the quality evaluation procedures given in this International Standard into an ISO 9000- type process-oriented procedure. Since this procedure only can provide current status of the quality of the updated items, it is necessary to combine both benchmark and continuous procedures as described in C.3 in order to establish the quality for the updated database.



C. 3 Xây dựng thủ tục đánh giá chất lượng liên tục

C. 3.1 Xác định các phần

Theo các bước mô tả trong Điều 6.2 của Tiêu chuẩn quốc tế này, xác định các thành phần có thể áp dụng chất lượng dữ liệu và thành phần phụ chất lượng dữ liệu liên quan của chúng, phạm vi chất lượng dữ liệu, đo lường chất lượng dữ liệu, và mức chất lượng phù hợp để sử dụng trong việc đánh giá và báo cáo kết quả.



C.3 Establishing continuous quality evaluation procedures

C.3.1 Identify the parts

In accordance with the steps given in 6.2 of this International Standard, identify applicable data quality elements and their associated data quality subelements, data quality scopes, data quality measure, and conformance quality levels to be used in the evaluation and reporting of the results.


C.3.2 Lựa chọn phương pháp được áp dụng
Lựa chọn phương pháp đánh giá chất lượng dữ liệu được áp dụng. Sau đó, việc đánh giá dựa trên các đối tượng được cập nhật và mối quan hệ của các đối tượng này với những đối tượng khác trong phạm vi chất lượng dữ liệu. Trong thủ tục đánh giá chất lượng liên tục chỉ có thế áp dụng một trong hai phương pháp trực tiếp hoặc gián tiếp.

VÍ DỤ
1) bản cập nhật từ một nguồn có đáng tin cậy không?
2) bản cập nhật có bảo đảm sự ổn định topo không?
3) địa chỉ của các đối tượng cập nhật có duy trì sự ổn định logic không?

C.3.2 Select the method to be applied

Select the data quality evaluation method to be applied. Then the evaluation would be on the updated feature and the relationship of that feature with the others within the data quality scope. In a continuous quality evaluation procedures only indirect or internal direct methods may be applied.



EXAMPLES

  1. Is the update from a trusted source?

  2. Does the update preserve topological consistency?

  3. Does the address of the feature updated retain logical consistency?

C. 3.3 Thiết lập tham khảo chất lượng tập dữ liệu

Sử dụng thủ tục chuẩn để thiết lập các giá trị tham khảo về chất lượng của tập dữ liệu về các đối tượng và thuộc tính đối tượng trong phạm vi kiểm tra và thời gian tiến hành kiểm tra.



C.3.3 Establish a dataset quality reference

Use the benchmark procedure to establish reference values of quality of the dataset for the features and feature attributes within scope to be checked during the continuous testing.



C. 3.4 Kết hợp thử nghiệm liên tục vào quá trình cập nhật

Kết hợp các thử nghiệm liên tục vào quá trình cập nhật để mỗi lần bản cập nhật đưa ra được kiểm tra và chấp nhận trước khi nó được đưa vào các tập dữ liệu.



C.3.4 Integrate continuous tests into update process

Integrate the continuous tests into the update process flow so that each proposed update is tested and accepted before it is introduced into the dataset.



C. 3.5 Tự động cập nhật các kết quả chất lượng dữ liệu
Bằng cách kết hợp các thử nghiệm liên tục vào quá trình cập nhật, mỗi lần cập nhật được chấp nhận thì kết quả chất lượng hiện tại được điều chỉnh theo. Điều này sẽ cho phép báo cáo trực tiếp về chất lượng dữ liệu được tạo ra.

C.3.5 Dynamically update data quality results

By integrating the continuous tests into the update process flow, each accepted update causes the current quality results to be adjusted accordingly. This will allow for immediate reports on dataset quality to be generated.



C. 4 Định kỳ thiết lập lại tài liệu tham khảo chất lượng của tập dữ liệu

Tất cả các khía cạnh chất lượng của một tập dữ liệu có thể không được kiểm tra thông qua một hoạt động dựa trên quá trình liên tục. Ví dụ, các đối tượng không đầy đủ có thể không được tìm thấy khi chỉ kiểm tra các đối tượng cập nhật. Các dữ liệu cần được kiểm tra theo định kỳ bằng phương pháp kiểm tra chất lượng theo chuẩn.



C.4 Periodically re-establish the reference quality of the dataset

All aspects of the quality of a dataset may not be tested through a continuous process-based operation. For example, omission of features may not be found when only updated items are tested. The dataset should be subject to periodic benchmark type quality procedures.





Phụ lục D
(tham khảo)

Các ví dụ về tiêu chuẩn để đánh giá

chất lượng dữ liệu

Annex D

(informative)

Examples of data quality measures


D. 1 Giới thiệu

Phụ lục này cung cấp các ví dụ đơn giản về đo chất lượng dữ liệu cho mỗi thành phần chất lượng dữ liệu và thành phần phụ liên kết với nó được xác định trong tiêu chuẩn ISO 19113 để giải thích các thành phần dữ liệu có liên quan như thế nào trong quá trình đánh giá. Các ví dụ chi tiết hơn có thể được tìm thấy trong các phụ lục khác của Tiêu chuẩn quốc tế này, đặc biệt là trong phụ lục J là các phương pháp để đánh giá chính xác vị trí của dữ liệu đường cong được tóm tắt.

Với mỗi thành phần chất lượng dữ liệu và sự kết hợp thành phần phụ, một ví dụ về phạm vi chất lượng dữ liệu được đưa ra cùng với ví dụ về các thông số dữ liệu. Sau đó, ba biện pháp chất lượng dữ liệu được hiển thị, mỗi biện pháp được thiết kế nhằm minh họa cho một cách đánh giá chất lượng. Vì vậy, các ví dụ sẽ đầy đủ nhất có thể, cùng với nó là thời gian đánh giá chất lượng và mức chất lượng phù hợp. Cuối cùng, một giải thích về kết quả chất lượng dữ liệu được đưa ra và để minh họa cho dự định kết quả chất lượng.

Trong khi các ví dụ được đưa ra trong phụ lục này rất đơn giản, chúng có thể được đề cập đến trong các hồ sơ hoặc tài liệu khác. Vì vậy, phụ lục này có mã nhận dạng đo chất lượng dữ liệu mà có liên quan đến các ví dụ về thành phần chất lượng dữ liệu và thành phần phụ chất lượng dữ liệu.



  1. 1 Introduction

This annex provides simple examples of data quality measures for each data quality element and its associated subelements defined in ISO 19113 to demonstrate how the data quality components relate during an evaluation operation. More detailed examples may be found in other annexes of this International Standard, in particular in annex J where methods for evaluating positional accuracy of curve data are summarised.

For each data quality element and subelement combination, an example data quality scope is given along with example dataset parameters. Then three data quality measures are shown, each designed to demonstrate a different way to evaluate quality. So the examples will be as complete as possible, a data quality date and conformance quality level are given. Finally, an interpretation of the data quality result is given as and example quality result meaning.

While the examples given in this annex are simple, it may be desirable to refer to them in profiles or other documents. Therefore, this annex has a data quality measure identification code which relates the example to the data quality element and data quality sub-element.


D. 2 Mối quan hệ của các thành phần chất lượng dữ liệu

Bảng D.1 Đưa ra mối quan hệ của các thành phần chất lượng dữ liệu.

Để tiết kiệm không gian, mỗi thành phần chất lượng dữ liệu sẽ được đặt một tên rút gọn và sẽ được sử dụng trong phụ lục này.


D.2 Relationship of the data quality components

Table D.1 gives the relationship of the data quality components.



In order to save space, each data quality component has been given a short name that will be used throughout this annex.


Bảng D.1Quan hệ của các thành phần chất lượng dữ liệu

Các thành phần chất lượng dữ liệu

Tên rút gọn a

Phạm vi thành phần

Ví dụ

Phạm vi chất lượng dữ liệu

DQ _Scope

Dạng văn bản

Tất cả các đố tượng được phân loại là nhà

Thành phần chất lượng dữ liệu

DQ_Element

Phạm vi liệt kê

  1. Tính đầy đủ

  2. Sự ổn định logic

  3. Độ chính xác vị trí

  4. Độ chính xác thời gian

5. Độ chính xác chuyên đề

1 – Thành phần chất lượng dữ liệu đầy đủ mô tả sự hiện diện của các đối tượng, thuộc tính và quan hệ của đối tượng

Thành phần phụ chất lượng dữ liệu

DQ_Subelement

Phạm vi liệt kê

(Phụ thuộc vào thành phần chất lượng dữ liệu)

VÍ DỤ

EXAMPLE

1 – Đầy đủ

dữ liệu dư thừa trong tập dữ liệu




Biện pháp đánh giá chất lượng dữ liệu

DQ _Measure










Mô tả biện pháp đánh giá chất lượng dữ liệu

DQ_ MeasureDesc

Dạng văn bản

Sự tồn tại của các mục dư thừa




Mã nhận dạng biện pháp đánh giá chất lượng dữ liệu

DQ _MeasureID

Phạm vi liệt kê

10101

Phương pháp đánh giá chất lượng dữ liệu

DQ _EvalMethod













Kiểu phương pháp đánh giá chất lượng dữ liệu

DQ_EvalMethodType

Phạm vi liệt kê

  1. bên trong (trực tiếp)

  2. bên ngoài (trực tiếp)

  3. gián tiếp

2 – bên ngoài

Mô tả phương pháp đánh giá chất lượng dữ liệu

DQ_EvalMethodDesc

Dạng văn bản hoặc trích dẫn (phụ thuộc vào kiểu phương pháp đánh giá chất lượng dữ liệu)

So sánh tổng các mục trong tập dữ liệu với tổng các mục trong mô hình thế giới thực

Kết quả chất lượng dữ liệu

DQ _QualityResult










Kiểu đánh giá chất lượng dữ liệu

DQ_ValueType

Phạm vi liệt kê

  1. Biến Boolean

  2. số

  3. tỉ lệ

  4. tỉ lệ phần trăm

  5. mẫu

  6. bảng

  7. ảnh nhị phân

  8. ma trận

  9. trích dẫn (ISO 19115)

  10. dạng văn bản

  11. khác

1 – Biến Boolean




Đánh giá chất lượng dữ liệu

DQ_Value

Record (ISO 11404)

(Phụ thuộc vào kiểu đánh giá chất lượng dữ liệu)

True







Đơn vị đánh giá chất lượng dữ liệu

DQ _ValueUnit

(Phụ thuộc vào đánh giá chất lượng dữ liệu)

Không áp dụng




Ngày chất lượng dữ liệu

DQ _Date

ISO 8601:1988

2000-03-05

Mức chất lượng phù hợp

DQ_ConformanceLevel

Giá trị hoặc tập các giá trị

Không khác biệt giữa tập dữ liệu và mô hình thế giới thực

a Tên rút gọn để sử dụng trong phụ lục này

Table D.1 — Relationship of data quality components

Data quality components

Short name a

Component domain

Example

Data quality scope

DQ _Scope

Free text

All items classified as houses

Data quality element

DQ_Element

Enumerated domain

  1. - Completeness

  2. - Logical consistency

  3. - Positional accuracy

  4. - Temporal accuracy

5 - Thematic accuracy

1 - Completeness data quality element describing the presence or absence of features, their attributes and their relationships

Data quality subelement

DQ_Subelement

Enumerated domain

(Dependent upon data quality element)

EXAMPLE

1 - Commission excess data in the dataset




Data quality measure

DQ_ Measure










Data quality measure description

DQ_ MeasureDesc

Free text

Existence of excess items




Data quality measure identification code

DQ_ MeasureID

Enumerated domain

10101

Data quality evaluation method

DQ _EvalMethod













Data quality evaluation method type

DQ_EvalMethodType

Enumerated domain

  1. - internal (direct)

  2. - external (direct)

  3. - indirect

2 - external

Data quality evaluation method description

DQ_EvalMethodDesc

Free text or citation (depends on data quality evaluation method type)

Compare count of items in dataset against count of items in universe of discourse

Data quality result

DQ _QualityResult










Data quality value type

DQ_ValueType

Enumerated domain

  1. - Boolean variable

  2. - number

  3. - ratio

  4. - percentage

  5. - sample

  6. - table

  7. - binary image

  8. - matrix

  9. - citation (ISO 19115)

  10. - free text

  11. - other

1 - Boolean variable




Data quality value

DQ_Value

Record (ISO 11404)

(Depends on data quality value type )

True







Data quality value unit

DQ_ ValueUnit

(Depends on data quality value)

Not applicable




Data quality date

DQ_ Date

ISO 8601:1988

2000-03-05

Conformance quality level

DQ_ConformanceLevel

value or set of values

Zero difference between dataset and universe of discourse counts

a Short name is for use within this annex



D. 3 Các ví dụ về tiêu chuẩn để đánh giá sự đầy đủ chất lượng dữ liệu

Đầy đủ là sự hiện diện hay vắng mặt của các đối tượng, thuộc tính và mối quan hệ của chúng. Nó có các thành phần phụ sau đây:

- Đầy đủ: vượt quá dung lượng trong một tập dữ liệu;
- Không đầy đủ: dữ liệu không có trong một tập dữ liệu;
Bảng D.2 cung cấp một số ví dụ về các thành phần phụ.


D.3 Examples of data quality completeness measures

Completeness is the presence or absence of features, their attributes and their relationships. It has the following sub-elements:

- Commission: excess data in a dataset;

- Omission: data absent from a dataset;



Table D.2 provides some examples for the sub-elements.

Bảng D.2 — Các ví dụ về tiêu chuẩn để đánh giá đầy đủ chất lượng dữ liệu

Thành phần chất lượng dữ liệu

Ví dụ 1

Ví dụ 2

Ví dụ 3

DQ_Scope

Tất cả đối tượng được phân loại là nhà trong tập dữ liệu

Tất cả các đối tượng được phân loại là nhà trong phạm vi -83,1-83,3 kinh độ và +38,3 +38,4 vĩ độ

Tất cả các đối tượng được phân loại là nhà trong thành phố Augusta ở bang George, Mỹ

DQ_Element

1 – Tính đầy đủ

1 – Tính đầy đủ

1 – Tính đầy đủ

DQ _Subelement

1 – Dư thừa

1 – Dư thừa

1 – Dư thừa




DQ _Measure
















DQ_ MeasureDesc

Chấp nhận – không chấp nhận

Số dư thừa

Phần trăm dư thừa







DQ _MeasurelD

10101

10102

10103







DQ _EvalMethod



















DQ _EvalMethodType

2 - Đánh giá ngoài

2 - Đánh giá ngoài

2 - Đánh giá ngoài










DQ_EvalMethodDesc

So sánh số đối tượng trong tập dữ liệu với số đối tượng bên ngoài

So sánh số đối tượng trong tập dữ liệu với số đối tượng bên ngoài

Chia số dư thừa trong tập dữ liệu theo số đếm được trong mô hình thế giới thực; sau đó nhân với 100







DQ _QualityResult



















DQ_ ValueType

1 - Giá trị Boolean

2 – Giá trị số

4 – Giá trị phần trăm










DQ_ Value

False

10

10










DQ _ValueUnit

NA

Nhà

Phần trăm




DQ _Date

2000-03-05

2000-03-06

2000-03-04




DQ_ ConformanceLevel

Không dư thừa trong tập dữ liệu

Dư thừa ít hơn 9% trong tập dữ liệu

Dư thừa ít hơn 9% trong tập dữ liệu

Ví dụ về các thông số tập dữ liệu

110 đối tượng trong tập dữ liệu nằm trong phạm vi chất lượng dữ liệu; 100 đối tượng trong mô hình thế giới thực nằm trong phạm vi chất lượng dữ liệu

110 đối tượng trong tập dữ liệu nằm trong phạm vi chất lượng dữ liệu; 100 đối tượng trong mô hình hế giới thực nằm trong phạm vi chất lượng dữ liệu

110 đối tượng trong tập dữ liệu nằm trong phạm vi chất lượng dữ liệu;

100 đối tượng trong mô hình thế giới thực nằm trong phạm vi chất lượng dữ liệu













Ví dụ về dự định kết quả chất lượng

Không chấp nhận tập dữ liệu. Tồn tại các đối tượng dư thừa. Nhiều đối tượng được phân loại như là nhà trong tập dữ liệu hơn là trong mô hình thế giới thực.

Không chấp nhận tập dữ liệu. Số lượng các đối tượng dư thừa trong tập dữ liệu vượt quá mức chất lượng dữ liệu phù hợp.

Không chấp nhận tập dữ liệu. Tỉ lệ phần trăm các đối tượng dư thừa trong tập dữ liệu vượt quá mức chất lượng dữ liệu phù hợp.

Table D.2 — Examples of data quality completeness measures

Data quality component

Example 1

Example 2

Example 3

DQ_Scope

All items classified as houses in the dataset

All items classified as houses and bounded by longitudes -83,1 -83,3 and latitudes +38,3 +38,4

All items classified as houses and in the town of Augusta, Georgia, U.S.A.

DQ _Element

1 - Completeness

1 - Completeness

1 - Completeness

DQ _Subelement

1 - Commission

1 - Commission

1 - Commission




DQ_ Measure
















DQ_ MeasureDesc

Pass-Fail

Number of commissions

Percentage of commissions







DQ_ MeasurelD

10101

10102

10103







DQ _EvalMethod



















DQ_ EvalMethodType

2 - External

2 - External

2 - External










DQ_EvalMethodDesc

Compare count of items in dataset against count of items in universe of discourse

Compare count of items in dataset against count of items in universe of discourse

Divide count of excess items in dataset by count of items in universe of discourse; then multiply by 100







DQ _QualityResult



















DQ _ValueType

1 - Boolean variable

2 - Number

4 - Percentage










DQ _Value

False

10

10










DQ _ValueUnit

NA

Houses

Percent




DQ _Date

2000-03-05

2000-03-06

2000-03-04




DQ _ConformanceLevel

Zero commissions in dataset

Less than 9 commissions in dataset

Less than 9 percent commissions in dataset

Example dataset parameters

110 items in dataset are within the data quality scope; 100 items in the universe of discourse

are within the scope

110 items in dataset are within the data quality scope; 100 items in the universe of discourse

are within the scope

110 items in dataset are within the data quality scope; 100 items in the universe of discourse

are within the scope













Example quality result meaning

Dataset fails. Excess items exist. More items are classified as houses in the dataset than are

in the universe of discourse.

Dataset fails. The number of excess items in the dataset exceeds the data quality

conformance quality level

Dataset fails. The percentage of excess items in the dataset exceeds the data quality

conformance quality level













Bảng D.2 (tiếp theo)

Thành phần chất lượng dữ liệu

Ví dụ 4

Ví dụ 5

Ví dụ 6

DQ_Scope

Mọi đối tượng được phân loại là nhà trong tập dữ liệu

Tất cả các đối tượng được phân loại là nhà trong khoảng kinh độ -83,1 -83,3 và vĩ độ +38,3 +38,4

Mọi đối tượng được phân loại là nhà trong thành phố Stockholm, Sweden.

DQ _Element

1 – đầy đủ

1 – đầy đủ

1 – đầy đủ

DQ_ Subelement

2 – không đầy đủ

2 – không đầy đủ

2 – không đầy đủ




DQ_ Measure
















DQ _MeasureDesc

Pass-Fail

Số lượng không đầy đủ

Phần trăm không đầy đủ







DQ_ MeasureID

10201

10202

10203







DQ_ EvalMethod



















DQ _EvalMethodType

2 - Đánh giá ngoài

2 - Đánh giá ngoài

2 - Đánh giá ngoài










DQ_EvalMethodDesc

So sánh số lượng các đối tượng trong một tập dữ liệu và số lượng đối tượng có trong mô hình thế giới thực

So sánh số lượng các đối tượng trong một tập dữ liệu và số lượng đối tượng có trong mô hình thế giới thực

Chia toàn bộ số đối tượng trong tập dữ liệu với tổng số đối tượng trong thế giới thực và nhân với 100








DQ_ QualityResult



















DQ_ ValueType

1 - Giá trị Boolean

2 – Giá trị số

4 – Giá trị phần trăm










DQ _Value

False

10

10,0










DQ_ ValueUnit

NA

Nhà

Phần trăm




DQ_ Date

2000-03-06

2000-03-03

2000-03-04




DQ _ConformanceLevel

Không đầy đủ trong tập dữ liệu

ít hơn 9 đối tượng không đầy đủ trong một tập dữ liệu

ít hơn 9% đối tượng không đầy đủ trong một tập dữ liệu

Ví dụ về các thông số tập dữ liệu

90 đối tượng trong tập dữ liệu và 100 đối tượng trong mô hình thế giới thực nằm trong phạm vi chất lượng dữ liệu

90 đối tượng trong tập dữ liệu và 100 đối tượng trong mô hình thế giới thực nằm trong phạm vi chất lượng dữ liệu

90 đối tượng trong tập dữ liệu và 100 đối tượng trong mô hình thế giới thực nằm trong phạm vi chất lượng dữ liệu













Ví dụ về dự định kết quả chất lượng

Tập dữ liệu không dùng được khi dữ liệu không đầy đủ. Các đối tượng ít hơn được phân loại như là nhà trong tập dữ liệu hơn là trong mô hình thế giới thực.

Tập dữ liệu không dùng được khi số lượng các đối tượng không đầy đủ trong tập dữ liệu vượt quá mức chất lượng dữ liệu phù hợp

Tập dữ liệu không dùng được khi phần trăm các đối tượng không đầy đủ trong tập dữ liệu vượt quá mức chất lượng dữ liệu phù hợp













Table D.2 (continued)

Data quality component

Example 4

Example 5

Example 6

DQ_Scope

All items classified as houses in the dataset

All items classified as houses and bounded by longitudes -83,1 -83,3 and latitudes +38,3 +38,4

All items classified as houses and in the city of Stockholm, Sweden.

DQ _Element

1 - Completeness

1 - Completeness

1 - Completeness

DQ _Subelement

2 - Omission

2 - Omission

2 - Omission




DQ _Measure
















DQ_ MeasureDesc

Pass-Fail

Number of omissions

Percentage of omissions







DQ_ MeasureID

10201

10202

10203







DQ _EvalMethod



















DQ_ EvalMethodType

2 - External

2 - External

2 - External










DQ_EvalMethodDesc

Compare count of items in dataset against count of items in universe of discourse

Compare count of items in dataset against count of items in universe of discourse

Divide count of excess items in dataset by count of items in universe of discourse; then multiply by 100







DQ _QualityResult



















DQ_ ValueType

1 - Boolean variable

2 - Number

4 - Percentage










DQ _Value

False

10

10,0










DQ _ValueUnit

NA

Houses

Percent




DQ _Date

2000-03-06

2000-03-03

2000-03-04




DQ _ConformanceLevel

Zero omissions in dataset

Less than 9 omissions in dataset

Less than 9 percent omissions in dataset

Example dataset parameters

90 items in dataset are within the data quality scope; 100 items in the universe of discourse

are within the scope

90 items in dataset are within the data quality scope; 100 items in the universe of discourse

are within the scope

90 items in dataset are within the data quality scope; 100 items in the universe of discourse

are within the scope













Example quality result meaning

Dataset fails. Omissions exist. Fewer items are classified as houses in the dataset than are

in the universe of discourse.

Dataset fails. The number of missing items in the dataset exceeds the data quality

conformance quality level

Dataset fails. The percentage of missing items in the dataset exceeds the data quality conformance quality level














tải về 5.76 Mb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7   8   9   ...   16




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương