D.4 Các ví dụ về tiêu chuẩn để đánh giá sự ổn định logic chất lượng dữ liệu
Sự ổn định về mặt logic là mức độ tuân thủ các quy tắc logic của cấu trúc dữ liệu, thuộc tính và các mối quan hệ (cấu trúc dữ liệu có thể là khái niệm, logic hay vật lý). Sự ổn định về mặt logic có các thành phần phụ sau đây:
- sự ổn định về khái niệm - tuân thủ các quy tắc của các lược đồ khái niệm;
- sự ổn định về miền - tuân thủ các giá trị đối với các miền giá trị;
- sự ổn định về định dạng - mức độ mà dữ liệu được lưu trữ phù hợp với cấu trúc vật lý của tập dữ liệu;
- sự ổn định về topo – sự chính xác về đặc điểm topo của một tập dữ liệu được mã hóa một cách rõ ràng.
Bảng D.3 cung cấp một số ví dụ về các thành phần phụ.
|
D.4 Examples of data quality logical consistency measures
Logical consistency is the degree of adherence to logical rules of data structure, attribution and relationships (data structure can be conceptual, logical or physical). Logical consistency has the following sub-elements:
- conceptual consistency - adherence to rules of the conceptual schema;
- domain consistency - adherence of values to the value domain;
- format consistency - degree to which data is stored in accordance with the physical structure of the dataset;
- topological consistency - correctness of the explicitly encoded topological characteristics of a dataset.
Table D.3 provides some examples for the sub-elements.
|
Bảng D.3 — Các ví dụ về tiêu chuẩn để đánh giá sự ổn định logic chất lượng dữ liệu
Thành phần chất lượng dữ liệu
|
Ví dụ 1
|
Ví dụ 2
|
Ví dụ 3
|
DQ_Scope
|
Tất cả đối tượngđược phân loại như là nhà trong tập dữ liệu
|
Tất cả đối tượng được phân loại như là nhà và nằm trong kinh độ -83,1 -83,3 và vĩ độ +38,3 +38,4
|
Tất cả đối tượng được phân loại là nhà tại thành phố Helsinki, Hà Lan.
|
DQ _Element
|
2 - Sự ổn định về mặt logic
|
2 - Sự ổn định về mặt logic
|
2 - Sự ổn định về mặt logic
|
DQ _Subelement
|
1 - Ổn định về khái niệm
|
1 - Ổn định về khái niệm
|
1 - Ổn định về khái niệm
|
|
DQ _Measure
|
|
|
|
|
|
DQ_ MeasureDesc
|
Chấp nhận – không chấp nhận
|
Số lượng đối tượng vi phạm
|
Phần trăm đối tượng vi phạm
|
|
|
DQ_ MeasurelD
|
20101
|
20102
|
20103
|
|
|
DQ _EvalMethod
|
|
|
|
|
|
|
DQ_EvalMethodType
|
1- Nội bộ
|
1- Nội bộ
|
1- Nội bộ
|
|
|
|
DQ_EvalMethodDesc
|
Đếm số lượng đối tượng và các mối quan hệ đối tượng không tuân thủ lược đồ khái niệm trong tập dữ liệu
|
Đếm số lượng đối tượng và các mối quan hệ đối tượng không tuân thủ lược đồ khái niệm trong tập dữ liệu
|
Chi số đối tượng và các mối quan hệ đối tượng không tuân thủ lược đồ khái niệm bằng cách đếm số đối tượng trong tập dữ liệu
|
|
|
DQ _QualityResult
|
|
|
|
|
|
|
DQ _ValueType
|
1 - Giá trị Boolean
|
2 – Giá trị số
|
4 – Giá trị phần trăm
|
|
|
|
DQ_ Value
|
False
|
1
|
1,0%
|
|
|
|
DQ_ ValueUnit
|
NA
|
Đếm
|
Phần trăm
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
|
DQ_ ConformanceLevel
|
Không có đối tượng vi phạm trong tập dữ liệu
|
Không có đối tượng vi phạm trong tập dữ liệu
|
Không phần trăm đối tượng vi phạm trong tập dữ liệu
|
Ví dụ về các tham số của tập dữ liệu
|
80 đối tượng và 20 mối quan hệ đối tượng nằm trong phạm vị chất lượng dữ liệu. Một quan hệ đối tượng không phù hợp với lược đồ khái niệm.
|
80 đối tượng và 20 mối quan hệ đối tượng nằm trong phạm vị chất lượng dữ liệu. Một quan hệ đối tượng không phù hợp với lược đồ khái niệm.
|
80 đối tượng và 20 mối quan hệ đối tượng nằm trong phạm vị chất lượng dữ liệu. Một quan hệ đối tượng không phù hợp với lược đồ khái niệm
|
Ví dụ về dự định kết quả chất lượng
|
Không chấp nhận tập dữ liệu. Không tuân thủ lược đồ khái niệm.
|
Không chấp nhận tập dữ liệu. Số lượng các đối tượng không tuân thủ vượt quá mức chất lượng phù hợp.
|
Không chấp nhận tập dữ liệu. Phần trăm các đối tượng không tuân thủ vượt quá mức chất lượng phù hợp.
|
Table D.3 — Examples of data quality logical consistency measures
Data quality component
|
Example 1
|
Example 2
|
Example 3
|
DQ_Scope
|
All items classified as houses in the dataset
|
All items classified as houses and bounded by longitudes -83,1 -83,3 and latitudes +38,3 +38,4
|
All items classified as houses and in the city of Helsinki, Finland.
|
DQ_ Element
|
2 - Logical consistency
|
2 - Logical consistency
|
2 - Logical consistency
|
DQ _Subelement
|
1 - conceptual consistency
|
1 - conceptual consistency
|
1 - conceptual consistency
|
|
DQ _Measure
|
|
|
|
|
|
DQ_ MeasureDesc
|
Pass-fail
|
Number of violating items
|
Percentage of violating items
|
|
|
DQ_ MeasurelD
|
20101
|
20102
|
20103
|
|
|
DQ_ EvalMethod
|
|
|
|
|
|
|
DQ_EvalMethodType
|
1- Internal
|
1- Internal
|
1- Internal
|
|
|
|
DQ_EvalMethodDesc
|
Count the number of features and feature relationships which violate the conceptual schema in dataset
|
Count the number of features and feature relationships which violate the conceptual schema in dataset
|
Divide count of features and feature relationships which violate the conceptual schema by count of those in dataset
|
|
|
DQ_ QualityResult
|
|
|
|
|
|
|
DQ _ValueType
|
1 - Boolean variable
|
2 - Number
|
4 - Percentage
|
|
|
|
DQ _Value
|
False
|
1
|
1,0%
|
|
|
|
DQ _ValueUnit
|
NA
|
Count
|
Percent
|
|
DQ_ Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
|
DQ _ConformanceLevel
|
Zero violations in dataset
|
Zero violations in dataset
|
Zero percent violations in dataset
|
Example dataset parameters
|
80 features and 20 feature relationships are within the data quality scope. One feature relationship exists which is not defined in the conceptual schema.
|
80 features and 20 feature relationships are within the data quality scope. One feature relationship exists which is not defined in the conceptual schema.
|
80 features and 20 feature relationships are within the data quality scope. One feature relationship exists which is not defined in the conceptual schema.
|
Example quality result meaning
|
The dataset fails. Violation of the conceptual schema exists.
|
The dataset fails. The number of violation items exceeds the conformance quality level.
|
The dataset fails. The percentage of violation items exceeds the conformance quality level.
|
Bảng D.3 (tiếp theo)
Thành phần chất lượng dữ liệu
|
Ví dụ 4
|
Ví dụ 5
|
Ví dụ 6
|
DQ_Scope
|
Mọi đối tượng được phân loại như là khu vực sinh sống
|
Mọi đối tượng được phân loại như là khu vực sinh sống nằm trong kinh độ -91,3 -91,4 và vĩ độ +40,0 +40,2
|
Mọi đối tượng đề được phân loại như là khu vực sinh sống trong thành phố London, Anh, U.K.
|
DQ _Element
|
2 - Sự ổn đinh logic
|
2 - Sự ổn đinh logic
|
2 - Sự ổn đinh logic
|
DQ_ Subelement
|
2 - Sự ổn định về miền
|
2 - Sự ổn định về miền
|
2 - Sự ổn định về miền
|
|
DQ_ Measure
|
|
|
|
|
DQ _MeasureDesc
|
Chấp nhận/không chấp nhận
|
Số lượng không ổn định
|
Phần trăm không ổn định
|
|
DQ _MeasureID
|
20201
|
20202
|
20203
|
DQ _EvalMethod
|
|
|
|
|
|
DQ_ EvalMethodType
|
1- Nội bộ
|
1- Nội bộ
|
1- Nội bộ
|
DQ_EvalMethodDesc
|
So sánh các thuộc tính đối tượng nằm trong phạm vi (có thể chấp nhận miền thuộc tính) và xác định xem có thuộc tính nào nằm ngoài phạm vi
|
So sánh các thuộc tính đối tượng nằm trong phạm vi (có thể chấp nhận miền thuộc tính) và xác định xem có thuộc tính nào nằm ngoài phạm vi
|
Chia số đối tượng lỗ cho tổng số đối tượng trong phạm vi và nhân với 100
|
DQ _QualityResult
|
|
|
|
|
DQ_ ValueType
|
1 - Giá trị Boolean
|
2 – Giá trị số
|
4 – Giá trị phần trăm
|
|
DQ _Value
|
False
|
8
|
8,0%
|
|
|
DQ _ValueUnit
|
NA
|
Thuộc tính lỗi
|
Phần trăm
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
DQ_ConformanceLevel
|
Không có thuộc tính lỗi
|
10 hoặc ít hơn thuộc tính lỗi
|
Số thuộc tính lỗi ít hơn 5%
|
Ví dụ về các tham số của tập dữ liệu
|
Có 100 đối tượng trong toàn tập dữ liệu. 8 đối tượng trong số đó có miền thuộc tính lỗi.
|
100 đối tượng trong tập dữ liệu. 8 đối tượng trong số đó có miền thuộc tính lỗi.
|
100 đối tượng trong tập dữ liệu. 8 trong số đó có miền thuộc tính lỗi.
|
Ví dụ về dự định kết quả chất lượng
|
Tập dữ liệu không tin cậy vì có ít nhất một đối tượng trong tập dữ liệu có miền thuộc tính lỗi
|
Tập dữ liệu đáng tin cậy khi có ít hơn 10 đối tượng có miền thuộc tính lỗi
|
Tập dữ liệu không đáng tin cậy. Có tới hơn 5% đối tượng có miền thuộc tính lỗi
|
Table D.3 (continued)
Data quality component
|
Example 4
|
Example 5
|
Example 6
|
DQ_Scope
|
All items classified as living quarters
|
All items classified as living quarters and bounded by longitudes -91,3 -91,4 and latitudes +40,0 +40,2
|
All items classified as living quarters and in the city of London, England, U.K.
|
DQ_ Element
|
2 - Logical consistency
|
2 - Logical consistency
|
2 - Logical consistency
|
DQ _Subelement
|
2 - domain consistency
|
2 - domain consistency
|
2 - domain consistency
|
|
DQ _Measure
|
|
|
|
|
DQ_ MeasureDesc
|
Pass-Fail
|
Number of domain inconsistencies
|
Percentage of domain inconsistencies
|
|
DQ _MeasureID
|
20201
|
20202
|
20203
|
DQ_ EvalMethod
|
|
|
|
|
|
DQ_ EvalMethodType
|
1- Internal
|
1- Internal
|
1- Internal
|
DQ_EvalMethodDesc
|
Compare attribute of items within scope against acceptable attribute domain (acceptable attributes) and determine if any are outside the domain
|
Compare attribute of items within scope against acceptable attribute domain (acceptable attributes) and count those that are outside the domain
|
Divide the number of items with attribute violations by the total number of items within scope and multiply the result by 100
|
DQ _QualityResult
|
|
|
|
|
DQ_ ValueType
|
1 - Boolean variable
|
2 - Number
|
4 - Percentage
|
|
DQ_ Value
|
False
|
8
|
8,0%
|
|
|
DQ _ValueUnit
|
NA
|
Attribute violations
|
Percent
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
DQ_ConformanceLevel
|
Zero items with attribute violations
|
10 or fewer items with attribute violations
|
Less than 5,0 percent of the items with attribute violations
|
Example dataset parameters
|
100 items within scope in the dataset. Eight of the items have attributes that violate the attribute domain.
|
100 items within scope in the dataset. Eight of the items have attributes that violate the attribute domain.
|
100 items within scope in the dataset. Eight of the items have attributes that violate the attribute domain.
|
Example quality result meaning
|
Dataset fails. The attributes of at least one item violated the attribute domain.
|
Dataset passes. Fewer than ten items had attributes that violated the attribute domain
|
Dataset fails. Greater than 5 percent of the items had attributes that violated the attribute domain
|
Bảng D.3 (tiếp theo)
Thành phần chất lượng dữ liệu
|
Ví dụ 7
|
Ví dụ 8
|
Ví dụ 9
|
DQ_Scope
|
|
Mọi bản ghi trong tập dữ liệu được phân loại là khu vực sinh sống
|
Mọi đối tượng dữ liệu được phân loại là khu vực sinh sống nằm trong khoảng kinh độ +139 +140 và vĩ độ +36,0 +37,0
|
Mọi đối tượng được phân loại khu vực sinh sống trong thành phố Tokyo, Nhật bản
|
|
|
|
|
DQ_ Element
|
2 - Sự ổn đinh logic
|
2 - Sự ổn đinh logic
|
2 - Sự ổn đinh logic
|
DQ_ Subelement
|
3 - sự ổn định khuôn dạng
|
3 - sự ổn định khuôn dạng
|
3 - sự ổn định khuôn dạng
|
|
DQ _Measure
|
|
|
|
|
|
DQ _MeasureDesc
|
Chấp nhận – không chấp nhận
|
Số lượng không ổn định khuôn dạng
|
Phần trăm không ổn định khuôn dạng
|
|
|
DQ _MeasureID
|
20301
|
20302
|
20303
|
|
|
DQ_ EvalMethod
|
|
|
|
|
|
|
DQ_ EvalMethodType
|
1- Nội bộ
|
1- Nội bộ
|
1- Nội bộ
|
|
|
|
DQ_EvalMethodDesc
|
So sánh cấu trúc bản ghi cho tất cả các đối tượng được xây dựng theo định nghĩa và cấu trúc và đếm những trường không đúng yêu cầu. Đảm bảo rằng trường thông tin mã khu vực sinh sống là dạng chữ cái có 5 ký tự.
|
So sánh cấu trúc bản ghi cho tất cả các đối tượng được xây dựng theo định nghĩa và cấu trúc và đếm những trường không đúng yêu cầu. Đảm bảo rằng trường thông tin mã khu vực sinh sống là dạng chữ cái có 5 ký tự.
|
So sánh cấu trúc bản ghi cho tất cả các đối tượng được xây dựng theo định nghĩa và cấu trúc và đếm những trường không đúng yêu cầu. Đảm bảo rằng trường thông tin mã khu vực sinh sống là dạng chữ cái có 5 ký tự. Kiểm tra số lượng bản ghi đếm được và nhân với 100
|
|
|
DQ_ QualityResult
|
|
|
|
|
|
|
DQ_ ValueType
|
1 - Giá trị Boolean (đúng/Sai)
|
2 – Giá trị số
|
4 – Giá trị phần trăm
|
|
|
|
DQ_ Value
|
False
|
8
|
8,0%
|
|
|
|
DQ _ValueUnit
|
NA
|
Lỗi định dạng
|
Phần trăm
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
|
DQ_ConformanceLevel
|
Không có đối tượng lỗi
|
Không có đối tượng lỗi định dạng
|
0% lỗi
|
Ví dụ về các tham số của tập dữ liệu
|
Trong 100 đối tượng thì có 8 đối tượng bị lỗi định dạng
|
Trong 100 đối tượng thì có 8 đối tượng bị lỗi định dạng
|
Trong 100 đối tượng thì có 8 đối tượng bị lỗi định dạng
|
Ví dụ về dự định kết quả chất lượng
|
Tập dữ liệu không được chấp nhận vì có lỗi định dạng
|
Tập dữ liệu không được chấp nhận vì có lỗi định dạng
|
Tập dữ liệu không được chấp nhận vì có lỗi định dạng
|
Table D.3 (continued)
Data quality component
|
Example 7
|
Example 8
|
Example 9
|
DQ_Scope
|
|
All records in the dataset for items classified as
|
All records in the dataset for items classified as
|
All records in the dataset for items classified
|
|
|
|
|
living quarters
|
living quarters and bounded by longitudes +139 +140 and latitudes +36,0 +37,0
|
as living quarters and in the city of Tokyo, Japan
|
DQ_ Element
|
2 - Logical consistency
|
2 - Logical consistency
|
2 - Logical consistency
|
DQ _Subelement
|
3 - format consistency
|
3 - format consistency
|
3 - format consistency
|
|
DQ_ Measure
|
|
|
|
|
|
DQ _MeasureDesc
|
Pass-Fail
|
Number of format inconsistencies
|
Percentage of format inconsistencies
|
|
|
DQ _MeasureID
|
20301
|
20302
|
20303
|
|
|
DQ _EvalMethod
|
|
|
|
|
|
|
DQ_EvalMethodType
|
1- Internal
|
1- Internal
|
1- Internal
|
|
|
|
DQ_EvalMethodDesc
|
Compare the record structure for all items within scope to specified field definitions and structure and count those that are inconsistent. Specifically assure that the field for the living quarter's type code is an alphabetic field of 5 characters in length.
|
Compare the record structure for all items within scope to specified field definitions and structure and count those that are inconsistent. Specifically assure that the field for the living quarter's type code is an alphabetic field of 5 characters in length.
|
Compare the record structure for all items within scope to specified field definitions and structure and count those that are inconsistent. Specifically assure that the field for the living quarter's type code is an alphabetic field of 5 characters in length. Divide the count by the number of records checked and multiply the results by 100
|
|
|
DQ_ QualityResult
|
|
|
|
|
|
|
DQ _ValueType
|
1 - Boolean variable
|
2 - Number
|
4 - Percentage
|
|
|
|
DQ_ Value
|
False
|
8
|
8,0%
|
|
|
|
DQ_ ValueUnit
|
NA
|
Format violations
|
Percent
|
|
DQ_ Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
|
DQ_ConformanceLevel
|
Zero items may have format violations.
|
Zero items may have format violations.
|
Zero percent of the items may have format violations.
|
Example dataset parameters
|
100 items within scope in the dataset. Eight of the items violate the specified format.
|
100 items within scope in the dataset. Eight of the items violate the specified format.
|
100 items within scope in the dataset. Eight of the items violate the specified format.
|
Example quality result meaning
|
Dataset fails. Format violations found.
|
Dataset fails. Format violations found.
|
Dataset fails. Format violations found.
|
Bảng D.3 (tiếp theo)
Thành phần chất lượng dữ liệu
|
Ví dụ 10
|
Ví dụ 11
|
Ví dụ 12
|
DQ _Scope
|
Tất cả đường biên giới tỉnh nằm trong tập dữ liệu.
|
Tất cả đường biên giới bang ở Mỹ.
|
Tất cả đường biên giới bang ở Mỹ.
|
DQ _Element
|
2 - Sự ổn định logic
|
2 - Sự ổn định logic
|
2 - Sự ổn định logic
|
DQ_ Subelement
|
4 - Ổn định topo
|
4 - Ổn định topo
|
4 - Ổn định topo
|
|
DQ _Measure
|
|
|
|
|
DQ_MeasureDesc
|
Chấp nhận/Không chấp nhân
|
Số lượng đối tượng không ổn định topo
|
Phần trăm đối tượng không ổn định topo
|
|
DQ_ MeasureID
|
20401
|
20402
|
20403
|
DQ_ EvalMethod
|
|
|
|
|
|
DQ_EvalMethodType
|
1- Nội bộ
|
1- Nội bộ
|
1- Nội bộ
|
DQ_EvalMethodDesc
|
Tại mỗi tỉnh, kiểm tra xem biên giới có đóng không. Đếm số lượng đường biên không khép kín.
|
Tại mỗi bang, kiểm tra xem biên giới có đóng không. Đếm số lượng đường biên không khép kín.
|
Tại mỗi bang, kiểm tra xem biên giới có đóng không. Đếm số lượng đường biên không khép kín. Kiểm tra số lượng bản ghi đếm được và nhân với 100
|
DQ _QualityResult
|
|
|
|
|
DQ _ValueType
|
1 - Giá trị boolean
|
2 – giá trị số
|
4 – giá trị phần trăm
|
|
DQ _Value
|
False
|
2
|
2,0%
|
|
|
DQ _ValueUnit
|
NA
|
Không ổn định topo
|
Phần trăm không ổn định topo
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
DQ_ConformanceLevel
|
Không có đối tượng nào bị lỗi Topo
|
Không có đối tượng nào bị lỗi Topo
|
Không phần trăm đối tượng bị lỗi Topo
|
Ví dụ về các tham số của tập dữ liệu
|
100 đối tượng trong tập dữ liệu. Hai đối tượng không ổn định Topo
|
100 đối tượng trong tập dữ liệu. Hai đối tượng không ổn định Topo
|
100 đối tượng trong tập dữ liệu. Hai đối tượng không ổn định Topo
|
Ví dụ về dự định kết quả chất lượng
|
Tập dữ liệu không được chấp nhận vì có lỗi Topo
|
Tập dữ liệu không được chấp nhận vì số lỗi Topo vượt quá mức độ cho phép.
|
Tập dữ liệu không được chấp nhận vì phần trăm lỗi Topo vượt quá mức độ cho phép.
|
Table D.3 (continued)
Data quality component
|
Example 10
|
Example 11
|
Example 12
|
DQ _Scope
|
All province boundaries in the dataset.
|
All state boundaries in the United States
|
All state boundaries in the United States
|
DQ _Element
|
2 - Logical consistency
|
2 - Logical consistency
|
2 - Logical consistency
|
DQ_ Subelement
|
4 - topological consistency
|
4 - topological consistency
|
4 - topological consistency
|
|
DQ _Measure
|
|
|
|
|
DQ_MeasureDesc
|
Pass-Fail
|
Number of items with topological inconsistencies
|
Percentage of items with topological inconsistencies
|
|
DQ_ MeasureID
|
20401
|
20402
|
20403
|
DQ _EvalMethod
|
|
|
|
|
|
DQ_ EvalMethodType
|
1- Internal
|
1- Internal
|
1- Internal
|
DQ_EvalMethodDesc
|
For each province, check the boundaries to assure closure. Count the number of provinces whose boundaries do not close.
|
For each state, check the boundaries to assure closure. Count the number of provinces whose boundaries do not close.
|
For each state, check the boundaries to assure closure. Count the number of provinces whose boundaries do not close. Divide the count by the number of records checked and multiply the result by 100
|
DQ _QualityResult
|
|
|
|
|
DQ _ValueType
|
1 - Boolean variable
|
2 - Number
|
4 - Percentage
|
|
DQ _Value
|
False
|
2
|
2,0%
|
|
|
DQ _ValueUnit
|
NA
|
topological inconsistencies
|
percent of topological inconsistencies
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
DQ_ConformanceLevel
|
Zero items may have topological violations.
|
Zero items may have topological violations.
|
Zero percent of the items may have topological violations.
|
Example dataset parameters
|
100 items within scope in the dataset. Two of the items have topological inconsistencies.
|
100 items within scope in the dataset. Two of the items have topological inconsistencies.
|
100 items within scope in the dataset. Two of the items have topological inconsistencies.
|
Example quality result meaning
|
Dataset fails. Topological inconsistencies found.
|
Dataset fails. Number of topological inconsistencies exceeds conformance quality level.
|
Dataset fails. Percentage of topological inconsistencies exceeds conformance quality level.
|
D.5 Các ví dụ về tiêu chuẩn để đánh giá chính xác vị trí chất lượng dữ liệu
Độ chính xác vị trí là tính chính xác về vị trí của một đối tượng. Độ chính xác vị trí có các thành phần phụ sau đây:
- Độ chính xác tuyệt đối hay bên ngoài: độ lệch tọa độ của đối tượng được báo cáo so với tọa độ được coi là đúng của đối tượng đó;
- Độ chính xác nội bộ hay tương đối: độ lệch của các vị trí tương đối của các đối tượng trong một tập dữ liệu so với các vị trí tương đối được coi là đúng;
- Độ chính xác vị trí dữ liệu lưới: độ lệch của các giá trị vị trí dữ liệu theo dạng lưới với các giá trị được chấp nhận hoặc coi là thật.
Bảng D.4 cung cấp một số ví dụ về các thành phần phụ.
|
D.5 Examples of data quality positional accuracy measures
Positional accuracy is the accuracy of the position of a feature. Positional accuracy has the following subelements:
- absolute or external accuracy: closeness of reported coordinate values to values accepted as or being true;
- relative or internal accuracy: closeness of the relative positions of features in a dataset to their respective relative positions accepted as or being true:
- gridded data position accuracy: closeness of gridded data position values to values accepted as or being true.
Table D.4 provides some examples for the subelements
|
Bảng D.4 — Các ví dụ về tiêu chuẩn để đánh giá chính xác vị trí chất lượng dữ liệu
Thành phần chất lượng dữ liệu
|
Ví dụ 1
|
Ví dụ 2
|
DQ_Scope
|
Tất cả các nút tạo thành ranh giới đường bộ trong tập dữ liệu.
|
Tất cả các nút tạo thành ranh giới đường bộ trong khu vực giới hạn bởi kinh độ +139 +140 và vĩ độ +36,0 +37,0.
|
DQ _Element
|
3 - độ chính xác vị trí
|
3 - độ chính xác vị trí
|
DQ _Subelement
|
1 - độ chính xác tuyệt đối hay bên ngoài
|
1 - độ chính xác tuyệt đối hay bên ngoài
|
|
DQ _Measure
|
|
|
|
DQ_MeasureDesc
|
Sai số trung phương
|
Phần trăm các đối tượng có lỗi tọa độ lớn hơn giới hạn thông số kỹ thuật
|
|
DQ _MeasureID
|
30101
|
30102
|
DQ _EvalMethod
|
|
|
|
|
DQ_EvalMethodType
|
2 – bên ngoài
|
2 – bên ngoài
|
DQ_EvalMethodDesc
|
Đối với mỗi nút, đo khoảng cách giữa các giá trị lỗi tọa độ tuyệt đối của các nút trong tập dữ liệu và những giá trị tọa độ đó trên thực tế. Tính RMSE từ khoảng cách lỗi
|
Đối với mỗi nút, đo khoảng cách giữa các giá trị lỗi tọa độ tuyệt đối của các nút trong tập dữ liệu và những giá trị tọa độ đó trên thực tế. Đếm số lượng các nút có lỗi khoảng cách vượt quá giới hạn quy định (ví dụ 1 m). Chia số lượng nút không đạt cho tổng số nút và nhân kết quả với 100.
|
DQ _QualityResult
|
|
|
|
DQ_ ValueType
|
2 – số
|
4 – %
|
|
DQ_ Value
|
1,70m
|
25%
|
|
|
DQ _ValueUnit
|
Giá trị mét
|
Giá trị phần trăm
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
DQ_ ConformanceLevel
|
Không quy định
|
Không quy định
|
Ví dụ về các tham số của tập dữ liệu
|
Không đầy đủ
|
Không đầy đủ
|
Ví dụ về dự định kết quả chất lượng
|
RMSE khoảng cách của các nút là 1,70 m. Từ mức chất lượng phù hợp không được quy định, chỉ có RMSE được báo cáo.
|
25% của các nút trong phạm vi chất lượng dữ liệu có khoảng cách lỗi hơn 1 mét. Từ mức chất lượng phù hợp không được quy định, chỉ có tỷ lệ phần trăm được báo cáo.
|
Table D.4 — Examples of data quality positional accuracy measures
Data quality component
|
Example 1
|
Example 2
|
DQ_Scope
|
All nodes forming road boundaries in the dataset
|
All nodes forming road boundaries in the area bounded by longitudes +139 +140 and latitudes +36,0 +37,0
|
DQ _Element
|
3 - positional accuracy
|
3 - positional accuracy
|
DQ _Subelement
|
1 - absolute or external accuracy
|
1 - absolute or external accuracy
|
|
DQ _Measure
|
|
|
|
DQ_MeasureDesc
|
RMSE
|
Percentage of items with coordinate error greater than specification limit
|
|
DQ_ MeasureID
|
30101
|
30102
|
DQ _EvalMethod
|
|
|
|
|
DQ_EvalMethodType
|
2 - external
|
2 - external
|
DQ_EvalMethodDesc
|
For each node, measure the error distance between absolute coordinate values of the node in the dataset and those in the universe of discourse. Compute RMSE from the error distances.
|
For each node, measure the error distance between absolute coordinate values of the node in the dataset and those in the universe of discourse. Count the number of the nodes whose error distance exceeds the specification limit (e.g.1 m). Divide the number of the nonconforming nodes by the number of the nodes in the data quality scope. Multiply the result by 100.
|
DQ_ QualityResult
|
|
|
|
DQ_ ValueType
|
2 - number
|
4 - percentage
|
|
DQ_ Value
|
1,70m
|
25%
|
|
|
DQ _ValueUnit
|
metre
|
percentage
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
DQ_ ConformanceLevel
|
Not specified
|
Not specified
|
Example dataset parameters
|
Omitted
|
Omitted
|
Example quality result meaning
|
RMSE of distance of the nodes is 1,70m. Since conformance quality level is not specified, only the RMSE is reported.
|
25% of the nodes within the data quality scope have error distance more than 1 metre. Since conformance quality level is not specified, only the percentage is reported.
|
Bảng D.4 (tiếp theo)
Thành phần chất lượng dữ liệu
|
Ví dụ 3
|
Ví dụ 4
|
DQ _Scope
|
|
|
DQ_ Element
|
3 – độ chính xác vị trí
|
3 - độ chính xác vị trí
|
DQ _Subelement
|
2 – độ chính xác nội bộ hay tương đối
|
2 - độ chính xác nội bộ hay tương đối
|
|
DQ _Measure
|
|
|
|
DQ_MeasureDesc
|
RMSE
|
Phần trăm về các đối tượng có lỗi tọa độ lớn hơn giới hạn thông số kỹ thuật
|
|
DQ _MeasureID
|
30201
|
30202
|
DQ _EvalMethod
|
|
|
|
|
DQ _EvalMethodType
|
2 – bên ngoài
|
2 – bên ngoài
|
DQ_EvalMethodDesc
|
Đối với mỗi nút, đo khoảng cách giữa các giá trị lỗi tọa độ tương đối của các nút trong tập dữ liệu và những giá trị tọa độ đó trên thực tế. Tính RMSE từ khoảng cách lỗi
|
Đối với mỗi nút, đo khoảng cách giữa các giá trị lỗi tọa độ tương đối của các nút trong tập dữ liệu và những giá trị tọa độ đó trên thực tế. Đếm số lượng các nút có lỗi khoảng cách vượt quá giới hạn quy định (ví dụ 1 m). Chia số lượng nút không đạt cho tổng số nút và nhân kết quả với 100.
|
DQ _QualityResult
|
|
|
|
DQ _ValueType
|
2 – giá trị số
|
4 – giá trị %
|
|
DQ _Value
|
1,50m
|
20%
|
|
|
DQ_ ValueUnit
|
mét
|
%
|
|
DQ_ Date
|
2000-03-06
|
2000-03-06
|
DQ _ConformanceLevel
|
Không quy định
|
Không quy định
|
Ví dụ về các tham số của tập dữ liệu
|
Không đầy đủ
|
Không đầy đủ
|
Ví dụ về dự định kết quả chất lượng
|
RMSE khoảng cách của các nút là 1,50 m. Vì mức chất lượng phù hợp không được quy định, chỉ có RMSE được báo cáo.
|
20% của các nút trong phạm vi chất lượng dữ liệu có khoảng cách lỗi hơn 1 mét. Vì mức chất lượng phù hợp không được quy định, chỉ có tỷ lệ phần trăm được báo cáo.
|
Table D.4 (contineud)
Data quality component
|
Example 3
|
Example 4
|
DQ _Scope
|
|
|
DQ_ Element
|
3 - positional accuracy
|
3 - positional accuracy
|
DQ_ Subelement
|
2 - relative or internal accuracy
|
2 - relative or internal accuracy
|
|
DQ_ Measure
|
|
|
|
DQ_MeasureDesc
|
RMSE
|
Percentage of items with coordinate error greater than specification limit
|
|
DQ _MeasureID
|
30201
|
30202
|
DQ _EvalMethod
|
|
|
|
|
DQ_ EvalMethodType
|
2 - external
|
2 - external
|
DQ_EvalMethodDesc
|
For each node, measure the error distance between relative coordinate values of the node in the dataset and those in the universe of discourse. Compute RMSE from the error distances.
|
For each node, measure the error distance between relative coordinate values of the node in the dataset and those in the universe of discourse. Count the number of the nodes whose error distance exceeds the specification limit (e.g.1 m). Divide the number of the nonconforming nodes by the number of the nodes in the data quality scope. Multiply the result by 100.
|
DQ _QualityResult
|
|
|
|
DQ_ ValueType
|
2 - number
|
4 - percentage
|
|
DQ_ Value
|
1,50m
|
20%
|
|
|
DQ _ValueUnit
|
metre
|
percentage
|
|
DQ_ Date
|
2000-03-06
|
2000-03-06
|
DQ_ ConformanceLevel
|
Not specified
|
Not specified
|
Example dataset parameters
|
Omitted
|
Omitted
|
Example quality result meaning
|
RMSE of distance of the nodes is 1,50m. Since conformance quality level is not specified, only the RMSE is reported.
|
20% of the nodes within the data quality scope have error distance more than 1 metre. Since conformance quality level is not specified, only the percentage is reported.
|
Bảng D.4 (tiếp theo)
Thành phần chất lượng dữ liệu
|
Ví dụ 5
|
Ví dụ 6
|
Ví dụ 7
|
DQ_Scope
|
Tất cả dữ liệu điểm độ cao theo dạng lưới của DEM trong tập dữ liệu.
|
Tất cả dữ liệu điểm độ cao theo dạng lưới của DEM trong tập dữ liệu nằm trong khoảng kinh độ +139 +140 và vĩ độ +36,0 +37,0
|
Tất cả dữ liệu điểm độ cao theo dạng lưới của DEM trong thành phố Bangkok, Thái Lan.
|
DQ _Element
|
3 - Độ chính xác vị trí
|
3 - Độ chính xác vị trí
|
3 - Độ chính xác vị trí
|
DQ _Subelement
|
3 - độ chính xác vị trí dữ liệu lưới
|
3 - độ chính xác vị trí dữ liệu lưới
|
3 - độ chính xác vị trí dữ liệu lưới
|
|
DQ _Measure
|
|
|
|
|
|
DQ_MeasureDesc
|
RMSE
|
Phần trăm các đối tượng có sai số vị trí lớn hơn yêu cầu
|
Chấp nhận – Không chấp nhận
|
|
|
DQ _MeasureID
|
30301
|
30302
|
30303
|
|
|
DQ _EvalMethod
|
|
|
|
|
|
|
DQ_EvalMethodType
|
2 – bên ngoài
|
2 – bên ngoài
|
2 – bên ngoài
|
|
|
|
DQ_EvalMethodDesc
|
Đối với mỗi điểm theo dạng lưới, đo sự khác biệt giữa giá trị độ cao tuyệt đối của các điểm trong tập dữ liệu và thực tế. Tính RMSE từ sự khác biệt chiều cao.
|
Đối với mỗi điểm theo dạng lưới, đo sự khác biệt giữa giá trị độ cao tuyệt đối của các điểm trong tập dữ liệu và trong thực tế. Đếm số lượng các điểm có sự khác biệt chiều cao vượt quá giới hạn yêu cầu kỹ thuật (ví dụ 1 m). Chia số lượng các điểm không phù hợp bởi số lượng các điểm trong phạm vi chất lượng dữ liệu. Nhân kết quả với 100.
|
Đối với mỗi điểm theo dạng lưới, đo sự khác biệt giữa giá trị độ cao tuyệt đối của các điểm trong các tập dữ liệu và trong thực tế. Đếm số lượng các điểm có sự khác biệt chiều cao vượt quá giới hạn yêu cầu kỹ thuật ( ví dụ 1 m). Chia số lượng các điểm không phù hợp bởi số lượng các điểm trong phạm vi kiểm tra và nhân với 100. So sánh tỷ lệ phần trăm của các điểm không phù hợp so với mức yêu cầu.
|
|
|
DQ_ QualityResult
|
|
|
|
|
|
|
DQ ValueType
|
2 – giá trị số
|
4 – giá trị phần trăm
|
1 – giá trị boolean
|
|
|
|
DQ Value
|
0,8 mét
|
8%
|
False
|
|
|
|
DQ_ValueUnit
|
metre
|
Tỷ lệ phần trăm điểm với lỗi chiều cao lớn hơn giới hạn quy định.
|
N.A.
|
|
DQ _Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
|
DQ_ConformanceLevel
|
Không quy định
|
Không quy định
|
Ít hơn 5 phần trăm các đối tượng có thể có lỗi chiều cao lớn hơn giới hạn quy định.
|
Ví dụ về các tham số của tập dữ liệu
|
Không đầy đủ
|
Không đầy đủ
|
Không đầy đủ
|
Ví dụ về dự định kết quả chất lượng
|
RMSE của chiều cao là 0,8 m. Từ mức chất lượng phù hợp không được quy định, chỉ có RMSE được báo cáo.
|
8 % các điểm theo dạng lưới trong phạm vi chất lượng dữ liệu có lỗi chiều cao hơn 1 mét. Từ mức chất lượng phù hợp không được quy định, chỉ báo cáo theo tỷ lệ %
|
Không chấp nhận tập dữ liệu. Tỷ lệ phần trăm của các điểm không phù hợp vượt quá mức cho phép.
|
Table D.4 (contineud)
Data quality component
|
Example 5
|
Example 6
|
Example 7
|
DQ_Scope
|
All gridded elevation point data of DEM in the dataset
|
All gridded elevation point data of DEM in the area bounded by longitudes +139 +140 and latitudes +36,0 +37,0
|
All gridded elevation point data of DEM in the city of Bangkok, Thailand.
|
DQ _Element
|
3 - positional accuracy
|
3 - positional accuracy
|
3 - positional accuracy
|
DQ _Subelement
|
3 - gridded data position accuracy
|
3 - gridded data position accuracy
|
3 - gridded data position accuracy
|
|
DQ _Measure
|
|
|
|
|
|
DQ_MeasureDesc
|
RMSE
|
Percentage of items with coordinate error greater than specification limit
|
Pass-fail
|
|
|
DQ _MeasureID
|
30301
|
30302
|
30303
|
|
|
DQ_ EvalMethod
|
|
|
|
|
|
|
DQ_EvalMethodType
|
2 - external
|
2 - external
|
2 - external
|
|
|
|
DQ_EvalMethodDesc
|
For each gridded point, measure the difference between absolute height value of the point in the dataset and that in the universe of discourse. Compute RMSE from the height differences.
|
For each gridded point, measure the difference between absolute height value of the point in the dataset and that in the universe of discourse. Count the number of the points whose height difference exceeds the specification limit (e.g.1 m). Divide the number of the non-conforming points by the number of the points in the data quality scope. Multiply the result by 100.
|
For each gridded point, measure the difference between absolute height value of the point in the dataset and that in the universe of discourse. Count the number of the points whose height difference exceeds the specification limit (e.g.1 m). Divide the number of the non-conforming points by the number of the points in the data quality scope and multiply the ratio by 100. Compare the percentage of the non-conforming points against the conformance quality level.
|
|
|
DQ_ QualityResult
|
|
|
|
|
|
|
DQ_ ValueType
|
2 - number
|
4 - Percentage
|
1 - Boolean variable
|
|
|
|
DQ _Value
|
0,8 metre
|
8%
|
False
|
|
|
|
DQ_ValueUnit
|
metre
|
Percent of points with height error greater than the specification limit.
|
N.A.
|
|
DQ_ Date
|
2000-03-06
|
2000-03-06
|
2000-03-06
|
|
DQ_ConformanceLevel
|
Not specified.
|
Not specified.
|
Less than 5 percent of items may have height error greater than specification limit
|
Example dataset parameters
|
Omitted
|
Omitted
|
Omitted
|
Example quality result meaning
|
RMSE of height is 0,8 m. Since conformance quality level is not specified, only the RMSE is reported
|
8 percent of the gridded points within the data quality scope have height error more than 1 metre. Since conformance quality level is not specified, only the percentage is reported
|
Dataset fails. Percentage of non conforming points exceeds the conformance quality level
|
Chia sẻ với bạn bè của bạn: |