Geographic information quality evaluation procedures



tải về 5.76 Mb.
trang7/16
Chuyển đổi dữ liệu08.06.2018
Kích5.76 Mb.
#39732
1   2   3   4   5   6   7   8   9   10   ...   16
Bảng D.6 (tiếp theo)

Thành phần chất lượng dữ liệu

Ví dụ 4

Ví dụ 5

Ví dụ 6

DQ_Scope

Tất cả các đối tượng có địa danh trong tập dữ liệu

Tất cả các đối tượng có địa danh trong khu vực khoảng kinh độ +139 +140 và vĩ độ +36,0 +37,0

Tất cả các đối tượng có địa danh của thành phố Lisbon, Portugal.

DQ_ Element

5 - độ chính xác chuyên đề

5 - độ chính xác chuyên đề

5 - độ chính xác chuyên đề

DQ_ Subelement

2 - sự đúng đắn của thuộc tính phi định lượng

2 - sự đúng đắn của thuộc tính phi định lượng

2 - sự đúng đắn của thuộc tính phi định lượng




DQ _Measure
















DQ_ MeasureDesc

Chấp nhận-không chấp nhận

Số đối tượng có tên địa danh sai

Phần trăm các đối tượng có địa danh sai




























DQ_ MeasureID

50201

50202

50203







DQ_ EvalMethod



















DQ_EvalMethodType

2 – bên ngoài

2 - bên ngoài

2 - bên ngoài










DQ_EvalMethodDesc

So sánh các địa danh trong tập dữ liệu với các địa danh trong thực tế.

So sánh các địa danh trong tập dữ liệu với các địa danh trong thực tế. Đếm các đối tượng có địa danh sai

So sánh các địa danh trong tập dữ liệu với các địa danh trong thực tế. Đếm các đối tượng có địa danh sai. Chia kết quả cho tổng số đối tượng trong phạm vi chất lượng dữ liệu và nhân với 100.







DQ_ QualityResult



















DQ_ ValueType

1- giá trị đúng/sai

2 – giá trị số

4 – giá trị phần trăm










DQ _Value

False

5

5%










DQ_ValueUnit

N.A.

Số đối tượng có địa danh sai

Phần trăm




DQ_ Date

2000-03-06

2000-03-06

2000-03-06




DQ_ConformanceLevel

Không có đối tượng nào có địa danh sai

Có ít hơn 3 đối tượng có địa danh sai

Ít hơn 3% các đối tượng có thể có địa danh sai

Ví dụ về các tham số của tập dữ liệu

100 đối tượng có địa danh trong tập dữ liệu; thì có 5 đối tượng bị đánh vần sai

100 đối tượng có địa danh trong phạm vi chất lượng dữ liệu; thì có 5 đối tượng bị đánh vần sai.

100 đối tượng có địa danh trong phạm vi chất lượng dữ liệu; thì có 5 đối tượng bị đánh vần sai.

Ví dụ về dự định kết quả chất lượng

Tập dữ liệu không được chấp nhận vì có ít nhất một đối tượng có địa danh sai.

Tập dữ liệu không được chấp nhận vì có hơn 3 đối tượng có địa danh sai.

Tập dữ liệu không được chấp nhận vì có hơn 3% đối tượng có địa danh sai.


Table D.6 (continued)

Data quality component

Example 4

Example 5

Example 6

DQ_Scope

All items with geographic names in the dataset

All items with geographic names in the area bounded by longitudes +139 +140 and latitudes +36,0 +37,0

All items with geographic names in the city of Lisbon, Portugal.

DQ_ Element

5 - thematic accuracy

5 - thematic accuracy

5 - thematic accuracy

DQ_ Subelement

2 - non-quantitative attribute correctness

2 - non-quantitative attribute correctness

2 - non-quantitative attribute correctness




DQ _Measure
















DQ _MeasureDesc

Pass-fail

Number of items with incorrect geographic

Percentage of items with incorrect geographic
















names

names.







DQ_ MeasureID

50201

50202

50203







DQ_ EvalMethod



















DQ_EvalMethodType

2 - external

2 - external

2 - external










DQ_EvalMethodDesc

Compare the geographic names in the dataset against those in the universe of discourse.

Compare the geographic names in the data quality scope against those in the universe of discourse. Count items with incorrect geographic names.

Compare the geographic names in the data quality scope against those in the universe of discourse. Count items with incorrect geographic names. Divide the result by the total number of items in the data quality scope and multiply it by 100.







DQ _QualityResult



















DQ_ ValueType

1-Boolean variable

2 - Number

4 - Percentage










DQ _Value

False

5

5%










DQ_ValueUnit

N.A.

Number of items with incorrect geographic names

Percent




DQ_ Date

2000-03-06

2000-03-06

2000-03-06




DQ_ConformanceLevel

Zero items may have incorrect geographic names

Less than 3 items may have incorrect geographic names.

Less than 3 percent of items may have incorrect geographic names.

Example dataset parameters

100 items with geographic name in the dataset; 5 names are misspelled

100 items with geographic name in the data quality scope ; 5 names are misspelled

100 items with geographic name in the data quality scope ; 5 names are misspelled

Example quality result meaning

Dataset fails. At least one item has incorrect geographic names

Dataset fails. Greater than 3 items have incorrect geographic names

Dataset fails. Greater than 3 percent of the items have incorrect geographic names

Bảng D.6 (tiếp theo)

Thành phần chất lượng dữ liệu

Ví dụ 7

Ví dụ 8

Ví dụ 9

DQ_Scope

Tất cả đối tượng có thuộc tính nhiệt độ trong tập dữ liệu

Tất cả đối tượng có thuộc tính nhiệt độ trong khu vực bởi kinh độ +139 +140 và vĩ độ +36,0 +37,0

Tất cả đối tượng có thuộc tính nhiệt độ trong thành phố Munich, Đức.

DQ_ Element

5 – độ chính xác thuộc tính

5 - độ chính xác thuộc tính

5 - độ chính xác thuộc tính

DQ_ Subelement

3 - độ chính xác thuộc tính định lượng

3 - độ chính xác thuộc tính định lượng

3 - độ chính xác thuộc tính định lượng




DQ_ Measure
















DQ_MeasureDesc

RMSE

Phần trăm các đối tượng có giá trị thuộc tính nhiệt độ cao hơn cho phép

Chấp nhận-không chấp nhận







DQ _MeasureID

50301

50302

50303







DQ_ EvalMethod



















DQ_EvalMethodType

2 – bên ngoài

2 – bên ngoài

2 – bên ngoài










DQ_EvalMethodDesc

Đối với mỗi đối tượng, đo sự khác biệt giữa giá trị nhiệt độ trong tập dữ liệu và trong thực tế. Tính RMSE từ sự khác biệt đó.

Đối với mỗi đối tượng, đo sự khác biệt giữa giá trị nhiệt độ trong tập dữ liệu và trong thực tế. Đếm số lượng các đối tượng trong đó nhiệt độ chênh lệch vượt quá giới hạn theo quy định (ví dụ 1°). Chia số đối tượng không phù hợp cho số đối tượng trong phạm vi chất lượng dữ liệu. Nhân kết quả với 100.


Đối với mỗi đối tượng, đo sự khác biệt giữa giá trị nhiệt độ trong tập dữ liệu và trong thực tế. Đếm số lượng các đối tượng trong đó nhiệt độ chênh lệch vượt quá giới hạn theo quy định (ví dụ 1°). Chia số đối tượng không phù hợp cho số đối tượng trong phạm vi chất lượng dữ liệu. Nhân kết quả với 100. So sánh phần trăm các đối tượng không phù hợp với mức cho phép.







DQ_ QualityResult



















DQ _ValueType

2 –Số

4 – Phần trăm

1-giá trị Boolean










DQ_ Value

0,5

5

False










DQ_ValueUnit

Mức độ

Phần trăm các đối tượng có lỗi nhiệt độ lớn hơn giới hạn thông số kỹ thuật.

N.A.




DQ Date

2000-3-06

2000-3-06

2000-3-06




DQ_ConformanceLevel

Không quy định

Không quy định

Ít hơn 1% số đối tượng có lỗi nhiệt độ lớn hơn giới hạn thông số kỹ thuật

Ví dụ về các tham số của tập dữ liệu

Không đầy đủ

Không đầy đủ

Không đầy đủ

Ví dụ về dự định kết quả chất lượng

RMSE của nhiệt độ là 0,5°. Mức chất lượng phù hợp không được quy định, chỉ có RMSE được báo cáo.

5 % các đối tượng trong phạm vi chất lượng dữ liệu có lỗi nhiệt độ hơn 1 °. Mức chất lượng phù hợp không được quy định, chỉ có tỷ lệ phần trăm được báo cáo.

Không chấp nhận tập dữ liệu bị. Tỷ lệ phần trăm các đối tượng không phù hợp vượt quá mức cho phép.

Table D.6 (continued)


Data quality component

Example 7

Example 8

Example 9




DQ_Scope

All items which have temperature attribute in the dataset.

All items which have temperature attribute in the area bounded by longitudes +139 +140 and latitudes +36,0 +37,0

All items which have temperature attribute in the city of Munich, Germany.




DQ_ Element

5 - thematic accuracy

5 - thematic accuracy

5 - thematic accuracy




DQ _Subelement

3 - quantitative attribute accuracy

3 - quantitative attribute accuracy

3 - quantitative attribute accuracy







DQ _Measure



















DQ_MeasureDesc

RMSE

Percentage of items with temperature error greater than specification limit

Pass-fail







DQ MeasureID

50301

50302

50303







DQ EvalMethod



















DQ_EvalMethodType

2 - external

2 - external

2 - external










DQ_EvalMethodDesc

For each item, measure the difference between temperature value in the dataset and that in the universe of discourse. Compute RMSE from the differences.

For each item, measure the difference between temperature value in the dataset and that in the universe of discourse. Count the number of the items whose temperature difference exceeds the specification limit (e.g.1 deg.). Divide the number of the non-conforming items by the number of the items in the data quality scope. Multiply the result by 100.

For each item, measure the difference between temperature value in the dataset and that in the universe of discourse. Count the number of the items whose temperature difference exceeds the specification limit (e.g.1 deg.). Divide the number of the non­conforming items by the number of the items in the data quality scope. Multiply the result by 100. Compare the percentage of the non­conforming items against the conformance quality level.







DQ _QualityResult



















DQ _ValueType

2 -number

4 - percentage

1-Boolean variable










DQ_ Value

0,5

5

False










DQ_ValueUnit

degree

Percent of the items with temperature error greater than the specification limit.

N.A.




DQ _Date

2000-3-06

2000-3-06

2000-3-06








DQ_ConformanceLevel

Not specified

Not specified

Less than 1 percent of items may have temperature error greater than specification limit




Example dataset parameters

Omitted

Omitted

Omitted




Example quality result meaning

RMSE of temperature is 0,5 deg. Since conformance quality level is not specified, only the RMSE is reported

5 percent of the items within the data quality scope have temperature error more than 1 deg. Since conformance quality level is not specified, only the percentage is reported

Dataset fails. Percentage of non conforming items exceeds the conformance quality level




Phụ lục E

(Tham khảo)



Hướng dẫn áp dụng các phương pháp lấy mẫu đối với tập dữ liệu địa lý

Annex E

(informative)

Guidelines for sampling methods applied to geographic datasets





E.1 Giới thiệu

Phụ lục này hướng dẫn để xác định các mẫu và các phương pháp lấy mẫu. Lấy mẫu để đánh giá tính tương thích với thông số kỹ thuật sản phẩm, bộ ISO 2859 và ISO 3951-1 có thể được áp dụng. Những tiêu chuẩn này ban đầu được phát triển để sử dụng phi không gian. Phụ lục này mô tả cách áp dụng ISO 2859 và ISO 3951-1 và kỹ thuật lấy mẫu không gian khác đối với thông tin địa lý.



E.1 Introduction

This annex provides guidelines for defining samples and devising sampling methods. For sampling for evaluating conformance to a product specification, ISO 2859 series and ISO 3951-1 may be applied. These standards were originally developed for non-spatial use. This annex describes how to apply ISO 2859 and ISO 3951-1 and other spatial sampling techniques to geographic information.






E.2 Mảnh và mẫu

Mảnh và mẫu là những khái niệm quan trọng trong phương pháp kiểm tra lấy mẫu được quy định trong bộ ISO 2859 và ISO 3951-1. Mảnh là đơn vị nhỏ nhất để có thể đánh giá chất lượng. Mẫu là đơn vị nhỏ nhất được kiểm tra và do người tạo sản phẩm xác định theo các thông số kỹ thuật của sản phẩm.



E.2 Lot and item

The lot and item are important concepts in the sampling inspection method specified by ISO 2859 series and ISO 3951-1. A lot is the minimum unit for which quality may be evaluated. An item is the minimum unit to be inspected and should be defined by the data producer in accordance with the product specification.




E.3. Kích thước mẫu

Kích thước của toàn tập dữ liệu và theo đó là kích thước mẫu có thể được xác định theo các cơ sở khác nhau về các đối tượng. Xác định kích thước mẫu yêu cầu chỉ định rõ ràng về các đối tượng. Các ví dụ về cơ sở khác nhau được trình bày trong bảng E.1.

Sự khác biệt giữa các quan điểm được minh họa trong hình E.1. Hình vẽ trình bày dữ liệu trong phạm vi chất lượng dữ liệu. Hình vẽ mô tả diện tích lấy mẫu có thể xấp xỷ 15% của toàn bộ diện tích phạm vi chất lượng dữ liệu nhưng chỉ khoảng 10% chiều dài đường cong trong diện tích lấy mẫu và 0% của điểm cao nhất.

Để khắc phục các khó khăn trong việc lấy mẫu như hình E.1, kích thước và vị trí mẫu có thể được xác định bằng cách sử dụng kết hợp các tiêu chuẩn, như vậy tuân theo sự trình bày về mẫu.

VÍ DỤ Mẫu có thể gồm 10% diện tích được bảo đảm bởi tập dữ liệu và chứa không ít hơn 5% toàn bộ chiều dài đường cong mô tả các đối tượng trong tập dữ liệu.


E.3 Sample size

The size of a population, and consequently the size of samples, may be defined according to different bases on items. The definition of a sample size requires an explicit indication of the items. Examples of different bases are presented in Table E.1.

The difference between the perspectives is illustrated in Figure E.1. The whole figure represents the data within the data quality scope. The figure depicts a possible sample area of approximately 15% of the total data quality scope area, but only about 10% of the curve length within the sample area, and 0% of the vertices.

To help overcome sample difficulties such as those in Figure E.1, the size and location of a sample might be defined using a combination of different criteria, thus enforcing the representativeness of the sample.



EXAMPLE The sample should include 10% of the area covered by the dataset and contain not less than 5% of the total curve length describing the objects in the dataset.




Bảng E.1. Các cơ sở khác nhau để xác định phạm vi (population)

Cơ sở

Kích thước tập dữ liệu

Kích thước mẫu

Các đối tượng

Số các đối tượng về kiểu đã cho

Số các đối tượng về kiểu đã cho được thể hiện như là số phần trăm của tổng số đối tượng

Diện tích được bảo đảm

Diện tích được bảo đảm bởi tập dữ liệu

Diện tích được bảo đảm bởi mẫu thể hiện như là số phần trăm của tổng diện tích.

Các đường cong

Tổng chiểu dài các đường cong trong tập dữ liệu

Chiều dài của các đường cong mẫu được thể hiện như là tỷ lệ phần trăm của tổng chiều dài.

Điểm cao nhất

Tổng số các điểm cao nhất mô tả các đường cong hay diện tích trong tập dữ liệu

Số các điểm cao nhất trong mẫu được thể hiện như là % của tổng số các điểm cao nhất.

Table E.1 — Different bases for defining population

Basis

Size of the dataset

Sample size

Features

Number of features of a given type

Number of features of a given type expressed as percentage of the total number of objects

Area covered

Area covered by the dataset

Area covered by the sample expressed as percentage of the total area

Curves

Total length of the curves in the dataset

Length of the sampled curves expressed as a percentage of the total length

Vertices

Total number of vertices describing curves or areas in the dataset

Number of vertices in the sample expressed as a percentage of the total number of vertices

Hình E.1 — Ảnh hướng của định vị vùng lấy mẫu về trình bày các đối tượng trong mẫu




tải về 5.76 Mb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7   8   9   10   ...   16




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương