Figure H.4 — Graphic representation of the dataset contents
Bảng H.1 — Các kiểu lỗi được phát hiện và các thành phần phụ chất lượng dữ liệu điển hình mà theo đó kết quả chất lượng có thể được báo cáo
Phát hiện các kiểu lỗi
|
Thành phần
|
Thành phần phụ mà theo đó lỗi được báo cáo
|
Các con đường không tồn tại, ví dụ như Green Street
|
Bao hàm tính hoàn thiện
|
tính đầy đủ
|
Tên đường không đúng, ví dụ, 1st Road
|
Sự chính xác chuyên đề
|
Đúng thuộc tính chất lượng
|
Một phần đường bị mất, ví dụ, Straight Street
|
Sự ổn định về mặt logic
|
Sự ổn định về Topo
|
Mất dữ liệu thuộc tính, ví dụ, Short Street flow arrow
|
Sự chính xác chuyên đề
|
Đúng thuộc tính chất lượng a
|
a Nếu các quy tắc về cơ sở dữ liệu được đưa ra trong đặc điểm kỹ thuật sản phẩm đòi hỏi hướng lưu lượng giao thông luôn luôn có lối đi vào, chẳng hạn như một chiều hoặc hai chiều, các lỗi được đánh giá không đầy đủ, tuy nhiên, nếu chỉ có một lối đi vào, nó được đo chính xác theo chủ đề.
|
Table H.1 — Error types detected and typical data quality subelements under which quality results may be Reported
Error types detected
|
Element
|
Subelement under which error is reported
|
Roads that do not exist, e.g., Green Street
|
Completeness
|
Commission
|
Incorrect road names, e.g., 1st Road
|
Thematic accuracy
|
Qualitative attribute correctness
|
Missing part of road, e.g., Straight Street
|
Logical consistency
|
Topological consistency
|
Missing attribute data, e.g., Short Street flow arrow
|
Thematic accuracy
|
Qualitative attribute correctness a
|
a If the rules for the database given in the product specification requires the flow direction field to always have an entry, such as one-way or two way traffic flow, the error is measured as an omission, however, if only an entry is required, it is measured as thematic correctness.
|
H. 5 Tổng hợp các kết quả đánh giá và lập báo cáo
Bảng thông báo lỗi được chuẩn bị để hiển thị số lượng các lỗi thường gặp phải và cách chúng được phân loại theo một thủ tục thường được sử dụng trong ngành công nghiệp cơ sở dữ liệu đường. Ví dụ cụ thể gán trọng số cho từng loại lỗi. Tổng trọng số tương đương với 100 phần trăm. Kết quả là giá trị có tính đến trọng số được coi là chất lượng của tập dữ liệu. Bảng H.2 cho thấy một ví dụ về tính toán kết quả chất lượng dữ liệu tổng hợp. Một mục được định nghĩa là một đoạn đường được giới hạn bởi các điểm giao cắt với các tuyến đường khác hoặc các ranh giới của đơn vị mẫu.
|
H. 5 Aggregation of evaluation results and reporting
An error table is prepared to show the number of errors encountered and how they are classified according to a typical procedure used in the road database industry. The particular example procedure assigns weights to each error type. The sum of the weights equals 100 percent. The resulting weighted value is considered to be the quality of the dataset. Table H.2 shows an example of calculating an aggregated data quality result. An item is defined as a road segment which is bounded by intersection points with the other roads or boundaries of the sample unit.
|
Bảng H.2 — Ví dụ về tính toán kết quả đánh giá chất lượng tổng hợp
Đối tượng
|
Số các mục trong mảnh
|
Số các mục không phù hợp
|
Tỷ lệ không phù hợp
|
Tỷ lệ chính xác
(được xác định như là 1-tỷ lệ)
|
Trọng lượng
|
Giá trị trọng lượng
(tỷ lệ chính xác x trọng lượng)
|
Đoạn đường
|
19
|
|
|
Không đúng
|
|
1
|
hỏng
|
|
0
|
4/19
|
0,79
|
50%
|
0,39
|
Dư thừa
|
|
3
|
|
Tên phố
|
|
|
Tên cơ sở
|
19
|
5
|
5 / 19
|
0,74
|
15%
|
0,11
|
Hướng đi
|
19
|
1
|
1 / 19
|
0,95
|
25%
|
0,23
|
Thủy văn
|
1
|
0
|
0 / 1
|
1,00
|
10%
|
0,10
|
Kết quả chất lượng dữ liệu tổng hợp (được xác định như là tổng của tỉ lệ chính xác trọng lượng x 100)
|
84%
|
Table H.2 — Example of computation of an aggregated quality evaluation result
Feature
|
Number of items in lot
|
Number of nonconforming items
|
Ratio of nonconforming
|
Accuracy
Proportion
(defined as
1-ratio)
|
Weights
|
Weighted value
(accuracy proportion x weight)
|
Road segment
|
19
|
|
|
incorrect
|
|
1
|
missing
|
|
0
|
4/19
|
0,79
|
50%
|
0,39
|
excess
|
|
3
|
|
Street Name
|
|
|
base name
|
19
|
5
|
5 / 19
|
0,74
|
15%
|
0,11
|
Direction of travel
|
19
|
1
|
1 / 19
|
0,95
|
25%
|
0,23
|
Hydrography
|
1
|
0
|
0 / 1
|
1,00
|
10%
|
0,10
|
Aggregated data quality result (defined as sum of weighted accuracy proportion x 100)
|
84%
|
Phụ lục I
(quy định)
Lập báo cáo thông tin chất lượng trong một thông báo đánh giá chất lượng
|
Annex I
(normative)
Reporting quality information in a quality evaluation report
|
I.1 Giới thiệu
Phụ lục này mô tả nội dung chi tiết của báo cáo đánh giá chất lượng định lượng. Báo cáo đánh giá chất lượng cung cấp các chi tiết về kết quả chất lượng và thủ tục được sử dụng để tính toán chúng hơn là được ghi lại trong siêu dữ liệu. Bảng I.1 của phụ lục này cung cấp một hình ảnh của các mối quan hệ lồng nhau của nội dung thông báo đánh giá chất lượng.
|
Introduction
This annex describes the content of a detailed quantitative quality evaluation report. The quality evaluation report provides more detail about the quality results and the procedures used to compute them than is recorded in metadata. Table I.1 of this annex provides a graphic of the nested relationships of the quality evaluation report content.
|
I.2 Các thành phần của báo cáo đánh giá chất lượng
Tiêu đề cột của bảng và mã số bảng trong Bảng I.1 là:
Số dòng của bảng cung cấp tham khảo cho từng mục trong bảng và được sử dụng trong cột miền để chỉ ra phạm vi các thành phần của mục này trong bảng.
Tên tên thành phần thông báo.
Định nghĩa/nội dung xác định các mục hoặc mô tả nội dung của mục.
Nghĩa vụ/điều kiện đưa ra các yêu cầu về thông báo mục hoặc điều kiện theo đó mục được yêu cầu. Có ba mã số nghĩa vụ:
bắt buộc (M) biểu thị một mục được yêu cầu.
điều kiện (C) yêu cầu nhập vào khi điều kiện được thỏa mãn.
tùy chọn (O) nhập vào là tùy chọn
Xuất hiện tối đa (xuất hiện tối đa) số lần tối đa mục này có thể xuất hiện trong miền của một mục cấp trên. Nhập một số nguyên cho biết số lần, và N cho biết nhiều như mong muốn.
Kiểu dữ liệu phần thông báo, văn bản, thực thể, hoặc khi không được áp dụng, một dấu "-" được hiển thị.
Miền với mỗi thành phần của báo cáo, tên miền xác định các giá trị cho phép hoặc sử dụng các dạng văn bản. Dạng văn bản chỉ ra rằng không có hạn chế đối với dữ liệu nhập vào. Mã số nguyên cơ sở được sử dụng để đại diện cho các giá trị trong lĩnh vực hạn chế miền (đóng).
|
Quality evaluation report components
The table column heading and table codes in Table I.1 are:
Table line number provides a reference for each item in the table and is used in domain column to show range of this item’s components in the table.
Name report element name.
Definition/content defines the item or describes the content of the item.
Obligation/condition gives requirements for reporting the item or the conditions under which the item is required. There are three obligation codes:
mandatory (M) denotes an is required entry.
conditional (C) entry required when the stated condition is satisfied.
optional (O) entry is optional
Maximum occurrences (max occur) maximum times this item can occur within a superior item’s domain. An integer entry indicates that number of times, and N indicates as many as desired.
Data type report section, text, entity, or when not applicable, a “-“ is shown.
Domain for each report element, the domain specifies the values allowed or the use of free text. Free text indicates that no restrictions are placed on the content of the entry. Integer-based codes shall be used to represent values in restricted (closed) domains.
|
Bảng I.1 — Các thành phần thông báo đánh giá chất lượng
Số dòng
|
Tên
|
Định nghĩa /
nội dung
|
Nghĩa vụ / điều kiện
|
Xuất hiện tối đa
|
Kiểu dữ liệu
|
Miền
|
1
|
addQualityReport
|
Báo cáo đánh giá chất lượng
|
C / subclause 9.2
|
1
|
Phần báo cáo
|
Lines 2 - 40
|
|
|
|
|
|
2
|
reportldentification
|
Báo cáo thông tin nhận dạng
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
3
|
reportScope
|
Phạm vi đánh giá tập dữ liệu trong báo cáo(ISO 19113)
|
O
|
1
|
CXây ký tựg
|
MD_MetadataScope
<>
|
4
|
compQuantDesc
|
Mô tả bổ sung các phương pháp đánh giá định lượng về giá trị đo và hạn chế của chúng
|
M
|
1
|
Phần báo cáo
|
Dòng 5 - 14
|
5
|
dataQualMeasure
|
Thông tin định nghĩa về giá trị của phép đo và phạm vi đối tượng đánh giá dữ liệu
|
M
|
1
|
Phần báo cáo
|
Dòng 6 - 10
|
6
|
mathDesc
|
Mô tả toán học chất lượng dữ liệu
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
7
|
compMeasValue
|
Giá trị đo chất lượng được áp dụng
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
8
|
valType
|
Đơn vị đo chất lượng dữ liệu
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
9
|
realibilityValue
|
Thực tế hoặc giới hạn độ tin cậy tính toán hoặc ước tính các giá trị đo chất lượng dữ lêij
|
O
|
1
|
Xây ký tự
|
Dạng văn bản
|
10
|
realibilityValueUnits
|
Đơn vị đo
|
O
|
1
|
Xây ký tự
|
Dạng văn bản
|
11
|
conformConfidence
|
Độ tin cayaj về tính đồng nhất
|
O
|
1
|
Phần báo cáo
|
Dòng
|
|
|
|
|
|
|
12 - 14
|
12
|
conformConfValue
|
Confidence in the conformance result.
NOTE The confidence in the conformance may be such as HIGH,LOW,NONE, or 95%, or so forth
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
13
|
conformConfValDesc
|
Đơn vị ghi giá trị độ tin cậy
|
M
|
1
|
Xây ký tự
|
Đơn vị giá trị hoặc kiểu giá trị
|
14
|
referenceDoc
|
Thông tin về tài liệu trong đó có tham chiếu đến quá trình phát triển và phương pháp đánh giá chất lượng
|
O
|
N
|
Class
|
CI_Citation
|
15
|
dqeMethodTypelnfo
|
Thông tin chi tiếp về phương pháp đánh giá chất lượng
|
M
|
1
|
Phần báo cáo
|
Dòng 16 - 37
|
16
|
dqeMethodType
|
Lớp đánh giá chất lượng
|
M
|
1
|
Xây ký tự
|
– trực tiếp - bên ngoài
– trực tiếp-nội bộ
– gián tiếp
|
17
|
dqeSamplingApplied
|
Thông tin về kiểm tra chất lượng
|
M
|
1
|
Xây ký tự
|
– áp dụng lấy mẫu
– kiểm tra đầy đủ
– không áp dụng
|
18
|
dqeMethodlnfo
|
Thông tin về phương pháp đánh giá chất lượng
|
M
|
1
|
Phần báo cáo
|
Dòng 19 - 37
|
Table I.1 — Quality evaluation report components
Line
No.
|
Name
|
Definition / content
|
Obligation / condition
|
Max.
Occur.
|
Data
type
|
Domain
|
1
|
addQualityReport
|
Quality evaluation report
|
C / subclause 9.2
|
1
|
report section
|
Lines 2 - 40
|
|
|
|
|
|
2
|
reportldentification
|
Report identification information
|
M
|
1
|
CharacterString
|
Free text
|
3
|
reportScope
|
Scope of dataset evaluated in this report (ISO 19113)
|
O
|
1
|
CharacterString
|
MD_MetadataScope
<>
|
4
|
compQuantDesc
|
Complementary description of quantitative assessment such as data quality measure values and their reliability limits
|
M
|
1
|
report section
|
Lines 5 - 14
|
5
|
dataQualMeasure
|
Information on definition and value of data quality measure of an object data quality scope
|
M
|
1
|
report section
|
Lines 6 - 10
|
6
|
mathDesc
|
Mathematical description of data quality measure
|
M
|
1
|
CharacterString
|
Free text
|
7
|
compMeasValue
|
Values of data quality measure applied
|
M
|
1
|
CharacterString
|
Free text
|
8
|
valType
|
Unit in which data quality measure value is recorded
|
M
|
1
|
CharacterString
|
Free text
|
9
|
realibilityValue
|
Reliability or confidence limit valuess of the computed or estimated data quality measure value
|
O
|
1
|
CharacterString
|
Free text
|
10
|
realibilityValueUnits
|
Unit in which reliability values are recorded
|
O
|
1
|
CharacterString
|
Free text
|
11
|
conformConfidence
|
Confidence in conformance
|
O
|
1
|
report section
|
Lines
|
|
|
|
|
|
|
12 - 14
|
12
|
conformConfValue
|
Confidence in the conformance result.
NOTE The confidence in the conformance may be such as HIGH,LOW,NONE, or 95%, or so forth
|
M
|
1
|
CharacterString
|
Free text
|
13
|
conformConfValDesc
|
Unit or value type in which the confidence in conformance is recorded
|
M
|
1
|
CharacterString
|
ValueUnit or ValueType
|
14
|
referenceDoc
|
Information on documents which are referenced in developing and applying the data quality evaluation method
|
O
|
N
|
Class
|
CI_Citation
|
15
|
dqeMethodTypelnfo
|
Detailed information about applying the quality evaluation method
|
M
|
1
|
report section
|
Lines 16 - 37
|
16
|
dqeMethodType
|
Quality evaluation method class
|
M
|
1
|
CharacterString
|
- direct-external
- direct-internal
- indirect
|
17
|
dqeSamplingApplied
|
Information on inspection strategy applied
|
M
|
1
|
CharacterString
|
- sampling applied
- full inspection
- not applicable
|
18
|
dqeMethodlnfo
|
Information on the data quality evaluation method
|
M
|
1
|
report section
|
Lines 19 - 37
|
Bảng I.1 (tiếp theo)
Số dòng
|
Tên
|
Định nghĩa/nội dung
|
Nghĩa vụ / điều kiện
|
Xuất hiện tối đa
|
Kiểu dữ liệu
|
Miền
|
19
|
dqeAssumptions
|
Thông tin được xây dựng dựa trên sự phát triển và ứng dụng các phương pháp đánh giá chat lượng dữ liệu
|
O
|
1
|
Xây ký tự
|
Dạng văn bản
|
21
|
dqeProcAlgorithm
|
Thông tin về cách thức xử lý để xác định kết quả về chất lượng dữ liệu
|
M
|
1
|
Xây ký tựg
|
Free text (if a specific computer algorithm or command is used, then its name shall be included)
|
22
|
dqeParamlnfo
|
Thông tin vè các tham số sử dụng trong đánh giá chất lượng dữ liệu
|
O
|
N
|
Phần báo cáo
|
Dòng 23 - 37
|
23
|
dqeParamDefinition
|
Thông tin định nghĩa các tham số
|
M
|
1
|
Xây ký tự
|
Free text, e.g., weight value of each aggregate data quality measure
|
24
|
dqeParamValues
|
Giá trị tham số sử dụng trong phương pháp đánh giá chất lượng dữ liệu
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
25
|
dqeParamDomain
|
Đơn vị ghi cho các tham số này
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
26
|
dqeFullInspecMethod
|
Thông tin về phương pháp kiểm tra đầy đủ
|
C / áp dụng kiểm tra đầy đủ
|
1
|
Xây ký tự
|
Dòng 27 - 29
|
27
|
dqeFullInspecType
|
Thông tin về phương pháp kiểm tra đủ và mô tả quá trình thực hiện
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
28
|
dqeltemDescription
|
Thông tin về một mục được định nghĩa như thế nào
|
M
|
1
|
Xây ký tựg
|
Dạng văn bản
|
29
|
referenceDoc
|
Thông tin về tài liệu có tham khảo để áp dụng phương pháp đánh giá dữ liệu
|
O
|
N
|
Class
|
Cl_Citation
|
30
|
dqeSampleMethod
|
Thông tin về lấy mẫu
|
C / áp dụng lấy mẫu
|
1
|
Phần báo cáo
|
Dòng 31 - 37
|
31
|
dqeSamplingScheme
|
Thông tin về kiểu lấy mẫu và mô tả quá trình lấy mẫu
|
M
|
1
|
Xây ký tự
|
Free text, e.g., simple random sampling: items are sampled from each lot.
|
32
|
dqeltemDescription
|
Thông tin về một mục dược định nghĩa như thế nào
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
33
|
dqeLotDescription
|
thông tin định nghĩa một mảnh
|
C / áp dụng mảnh
|
1
|
Xây ký tự
|
Dạng văn bản
|
34
|
dqeSamplingRatio
|
Thông tin về số lượng mẫu trung bình được kiểm tra trong mỗi mảnh hoặc toàn bộ số mẫu đang có
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
Table I.1 (continued)
Line
No.
|
Name
|
Definition / content
|
Obligation / condition
|
Max.
Occur.
|
Data
type
|
Domain
|
19
|
dqeAssumptions
|
Information on underlying assumptions in developing and applying the data quality evaluation method
|
O
|
1
|
CharacterString
|
Free text
|
21
|
dqeProcAlgorithm
|
Information on how data is processed to determine the data quality result
|
M
|
1
|
CharacterString
|
Free text (if a specific computer algorithm or command is used, then its name shall be included)
|
22
|
dqeParamlnfo
|
Information on parameters used in the data quality evaluation method
|
O
|
N
|
report section
|
Lines 23 - 37
|
23
|
dqeParamDefinition
|
Information on the definition of parameter used
|
M
|
1
|
CharacterString
|
Free text, e.g., weight value of each aggregate data quality measure
|
24
|
dqeParamValues
|
Value of parameter used in the data quality evaluation method
|
M
|
1
|
CharacterString
|
Free text
|
25
|
dqeParamDomain
|
Unit in which the parameter value is recorded
|
M
|
1
|
CharacterString
|
Free text
|
26
|
dqeFullInspecMethod
|
Information on full inspection method
|
C / full inspection applied
|
1
|
Report section
|
Lines 27 - 29
|
27
|
dqeFullInspecType
|
Information on the type of full inspection and description of the procedure
|
M
|
1
|
CharacterString
|
Free text
|
28
|
dqeltemDescription
|
Information on how items are defined
|
M
|
1
|
CharacterString
|
Free text
|
29
|
referenceDoc
|
Information on documents which are referenced in developing, applying the data quality evaluation method
|
O
|
N
|
Class
|
Cl_Citation
|
30
|
dqeSampleMethod
|
Information on sampling method
|
C / sampling applied
|
1
|
report section
|
Lines 31 - 37
|
31
|
dqeSamplingScheme
|
Information on the type of sampling scheme and description of the sampling procedure
|
M
|
1
|
CharacterString
|
Free text, e.g., simple random sampling: items are sampled from each lot.
|
32
|
dqeltemDescription
|
Information on how items are defined
|
M
|
1
|
CharacterString
|
Free text
|
33
|
dqeLotDescription
|
Information on how lots are defined
|
C / lot applied
|
1
|
CharacterString
|
Free text
|
34
|
dqeSamplingRatio
|
Information on how many samples on average are extracted for inspection from each lot or population
|
M
|
1
|
CharacterString
|
Free text
|
Bảng I.1 (tiếp theo)
Số dòng
|
Tên
|
Định nghĩa/ nội dung
|
Nghĩa vụ/ điều kiện
|
Xuất hiện tối đa
|
Kiểu dữ liệu
|
Miền
|
35
|
dqeDeductiveSource
|
Thông tin về loại dữ liệu nguồn cũng như phương pháp xử lý
|
C / áp dụng phương pháp suy luận
|
1
|
Xây ký tự
|
Dạng văn bản, ví dụ. nguồn gốc và cách sử dụng phạm vi chất lượng dữ liệu
|
36
|
dqeDeductRefDocs
|
Nhận dạng nguồn dữ liệu được sử dụng
|
M
|
N
|
Xây ký tự
|
Dạng văn bản
|
37
|
referenceDoc
|
Thông tin về các tài liệu tham khảo trong quá trình phát triển ứng dụng phương phá
|
O
|
N
|
Lớp
|
CI_Citation
|
38
|
aggSourceValues
|
Thông tin về các thành phần dữ liệu sử dụng và nguồn dữ liệu nào được tổng hơp để xác định tính phù hợp và chất lượng dữ liệu
|
C /Tính toán kết quả tổng hợp
|
N
|
Phần báo cáo
|
Dòng
39 - 44
|
|
|
|
|
|
|
|
|
|
|
39
|
aggResult
|
Mô tả dữ liệu như một thông tin định tính
|
M
|
1
|
Phần báo cáo
|
Dòng
40 - 44
|
40
|
aggValueDomain
|
Đơn vị mà các giá trị định lượng ghi được
|
M
|
1
|
Xây ký tự
|
Dạng văn bản, ví dụ., mét, km
|
41
|
aggMeasureValue
|
Giá trị đo sử dụng
|
M
|
1
|
Xây ký tự
|
Dạng văn bản
|
42
|
aggErrorStat
|
Kiểu thống kê
|
M
|
1
|
Xây ký tự
|
Dạng văn bản, e.g., RMS
|
43
|
Ngày-giờ
|
Ngày- giờ dữ liệu được tính toán
|
O
|
1
|
Thời gian
|
ISO 19108
|
44
|
aggQEPreport
|
Con trỏ vào báo cáo chất lượng dữ liệu
|
O
|
1
|
Lớp
|
CI_Citation
|
45
|
qepOtherDesc
|
Thông tin quan trọng bao gồm kết quả trực tiếp để thiết lập giá trị đo chất lượng dữ liệu và mức độ tương thích của dữ liệu
|
O
|
N
|
Xây ký tự
|
Dạng văn bản
|
Table I.1 (continued)
Line
No.
|
Name
|
Definition / content
|
Obligation / condition
|
Max
occur
|
Data
type
|
Domain
|
35
|
dqeDeductiveSource
|
Information on what data are used as sources in deductive evaluation method
|
C / deductive method applied
|
1
|
CharacterString
|
Free text, e.g. lineage and usage of the data quality scope
|
36
|
dqeDeductRefDocs
|
Identification of source documents used as basis for deduction
|
M
|
N
|
CharacterString
|
Free text
|
37
|
referenceDoc
|
Information on documents which are referenced in developing and applying the data quality evaluation method
|
O
|
N
|
Class
|
CI_Citation
|
38
|
aggSourceValues
|
Information on which component
|
C /
|
N
|
report section
|
Lines
|
|
|
datasets are used and what data
|
aggregation
|
|
|
39 - 44
|
|
|
quality measures are aggregated
|
result
|
|
|
|
|
|
for determining the data quality measure value and conformance
|
computed
|
|
|
|
39
|
aggResult
|
Description of the value as a quantitative result
|
M
|
1
|
report section
|
Lines 40 - 44
|
40
|
aggValueDomain
|
Unit in which the quantitative value is recorded
|
M
|
1
|
CharacterString
|
Free text, e.g., metres, kilometers
|
41
|
aggMeasureValue
|
Value of measure applied
|
M
|
1
|
CharacterString
|
Free text
|
42
|
aggErrorStat
|
Type of the statistic
|
M
|
1
|
CharacterString
|
Free text, e.g., RMS
|
43
|
dateTime
|
Data and time when the value was computed
|
O
|
1
|
DateTime
|
ISO 19108
|
44
|
aggQEPreport
|
A pointer to an quality evaluation report
|
O
|
1
|
Class
|
CI_Citation
|
45
|
qepOtherDesc
|
Additional information, including intermediate results, that is considered important when estimating data quality measure values and determining conformance
|
O
|
N
|
CharacterString
|
Free text
|
Phụ lục J
(tham khảo)
Tổng hợp các kết quả chất lượng dữ liệu
|
Annex J
(informative)
Aggregation of data quality results
|
J.1 Giới thiệu
Chất lượng của một tập dữ liệu có thể được trình bày bởi một hoặc nhiều kết quả chất lượng dữ liệu tổng hợp (ADQR). Các ADQR tổng hợp kết quả chất lượng từ việc đánh giá chất lượng dữ liệu dựa trên các thành phần chất lượng dữ liệu khác nhau, các thành phần phụ chất lượng dữ liệu khác nhau và / hoặc phạm vi chất lượng dữ liệu.
Các điều khoản phụ tiếp theo của phụ lục này là ví dụ về các phương pháp có thể được sử dụng để sản xuất một ADQR. Trong khi những ví dụ cho thấy tính toán sử dụng các giá trị Boolean, chúng không nhất thiết phải là Boolean. Một kết quả chất lượng dữ liệu có thể là định lượng và thể hiện bằng một giá trị số hoặc giá trị Boolean. Một tập dữ liệu có thể được coi là một chất lượng tổng hợp được chấp nhận mặc dù một hoặc nhiều kết quả chất lượng dữ liệu riêng không chấp nhận. Trong mọi trường hợp, dự định về kết quả tổng hợp phải được làm rõ.
Khi ADQR có thể khó hiểu một cách đầy đủ, dự định về kết quả chất lượng dữ liệu tổng hợp nên được hiểu trước khi đưa ra kết luận dựa trên kết quả chất lượng dữ liệu tổng hợp về chất lượng của các tập dữ liệu.
Điều 8 của Tiêu chuẩn Quốc tế này mô tả báo cáo để tổng hợp kết quả chất lượng dữ liệu.
|
J.1 Introduction
Quality of a dataset may be represented by one or more aggregated data quality results (ADQR). The ADQR combines quality results from data quality evaluations based on different data quality elements, data quality subelements and/or data quality scopes.
The following subclauses of this annex are examples of methods that may be used for producing an ADQR. While the examples show computation using Boolean values, they do not have to be Boolean. A data quality result may be quantitative or qualitative and represented by a numeric or Boolean value. A dataset may be deemed to be of an acceptable aggregate quality even though one or more individual data quality results fails acceptance. In any case, the meaning of the aggregate result must be made clear.
As the ADQR may be difficult to fully understand, the meaning of the aggregate data quality result should be understood before drawing conclusions based on aggregate data quality results for the quality of the dataset.
Clause 8 of this International Standard describes reporting requirements for aggregate data quality results.
|
J. 2 100% chấp nhận/không chấp nhận
Mỗi kết quả chất lượng dữ liệu liên quan đến việc tính toán được đưa ra một giá trị Boolean v một (1) nếu nó chấp nhận và là số (0) nếu nó không chấp nhận. Chất lượng tổng hợp được xác định bởi phương trình,
ADQ = v1 x v2 x v3 x . . . x vn
trong đó n là số lượng khung đo lường chất lượng dữ liệu.
Nếu ADQR = 1, sau đó chất lượng tập dữ liệu tổng thể được thực hiện đầy đủ, do đó được chấp nhận. Nếu ADQR = 0, nó được coi là không phù hợp, do đó không được chấp nhận. Kỹ thuật này không cung cấp kết quả cho biết vị trí hoặc tầm quan trọng của sự không phù hợp.
|
J.2 100% pass/fail
Each data quality result involved in the computation is given a Boolean value v of one (1) if it passed and zero (0) if it failed. The aggregate quality is determined by the equation,
ADQ = v1 x v2 x v3 x . . . x vn
where n is the number of data quality measurement frames.
If ADQR = 1, then the overall dataset quality is deemed to be fully conforming, hence pass. If ADQR = 0, then it is deemed non-conforming, hence fail. The technique does not provide a result that indicates location or magnitude of the non-conformance.
|
J.3 chấp nhận/không chấp nhận trọng số
Mỗi kết quả chất lượng dữ liệu liên quan đến việc tính toán được đưa ra một giá trị Boolean v (1) nếu nó chấp nhận và là số (0) nếu nó không chấp nhận. Dựa trên ý nghĩa về mục đích của sản phẩm, giá trị trọng số w giữa 0,0 và 1,0, bao gồm, được gán cho mỗi kết quả chất lượng dữ liệu. Tổng của tất cả các trọng số phải bằng 1,0. Lựa chọn trọng sô là một quyết định chủ quan được thực hiện bởi nhà sản xuất hoặc người dùng dữ liệu. Lý do về quyết định của nhà sản xuất dữ liệu nên được báo cáo như là một phần của kết quả. Chất lượng tổng hợp được xác định bởi phương trình,
ADQR = v1 x w1 + v2 x w2 + v3 x w3 + . . . + vn x wn
với n là số thứ tự
Kỹ thuật này không cung cấp một giá trị độ lớn cho thấy các thể hiện mức phù hợp của một tập dữ liệu với thế giới thực cũng như đo độ phù hợp này. Kỹ thuật này không cung cấp một giá trị định lượng cho biết sự xuất hiện phù hợp hoặc không phù hợp.
|
J.3 Weighted pass/fail
Each data quality result involved in the computation is given a Boolean value v of one (1) if it passed and a zero (0) if it failed. Based on the significance to the purpose of the product, a weight value w between 0,0 and 1,0, inclusive, is assigned to each data quality result. The total of all the weights should equal 1,0. The choice of weights is a subjective decision made by the data producer or user. The reason for the data producer’s decision should be reported as part of the result. The aggregate quality is determined by the equation,
ADQR = v1 x w1 + v2 x w2 + v3 x w3 + . . . + vn x wn
where n is the number of data quality measurement frames.
This technique does provide a magnitude value indicating how close a dataset is to full conformance as measured. The technique does not provide a quantitative value that indicates where conformance or non-conformance occurs.
|
J.4 tập con về đầy đủ các kết quả cho mục đích sản phẩm
Kỹ thuật này là sự thay đổi của phương pháp 100% chấp nhận/không chấp nhận và trọng số chấp nhận/không chấp nhận. Một tập hợp các kết quả chất lượng dữ liệu liên quan đến việc tính toán được lựa chọn từ kết quả chất lượng dữ liệu được tạo ra trong quá trình đánh giá chất lượng dữ liệu đầy đủ. Tập con trình bày về kết quả chất lượng dữ liệu được coi là quan trọng đối với mục đích của sản phẩm. Kỹ thuật này có thể được sử dụng khi có nhiều thành phần chất lượng dữ liệu đã được đo hơn là cần thiết để đáp ứng thông số kỹ thuật sản phẩm và / hoặc mục đích sản phẩm.
Chất lượng tổng hợp được xác định bằng cách áp dụng 100% chấp nhận/không chấp nhận, có tính đến trọng số, hoặc một số kỹ thuật đánh giá tổng hợp khác về các tập hợp con của kết quả khung đo lường chất lượng dữ liệu.
Khi kỹ thuật này được áp dụng, xác định các khung đo lường chất lượng dữ liệu được lựa chọn là thành viên của nhóm nên được ghi chép.
|
J.4 Subset of results sufficient for product purpose
This technique is a modification of the 100% pass/fail and the weighted pass/fail methods. A subset of data quality results involved in the computation is selected from data quality results produced during the full data quality evaluation. The subset represents data quality results considered significant to the purpose of the product. This technique may be used when more data quality elements have been measured than are needed to meet the product specification and/or purpose.
The aggregate quality is determined by applying the 100% pass/fail, the weighted pass/fail, or some other aggregate evaluation technique to the subset of data quality measurement frame results.
When this technique is applied, the identity of the data quality measurement frames selected as members of the subset should be documented.
|
J.5 giá trị tối đa /tối thiểu
Mỗi kết quả chất lượng dữ liệu được đưa ra một giá trị v dựa trên tầm quan trọng của kết quả chất lượng dữ liệu với mục đích của sản phẩm. Lý do về quyết định của nhà sản xuất dữ liệu nên được báo cáo như là một phần của kết quả chất lượng dữ liệu. Chất lượng tổng hợp được xác định theo một trong hai phương trình,
ADQR = max.(vi, i = 1. . . n )
hoặc
ADQR = min.(vi, i = 1. . . n )
Trong đó n là số lượng khung đo lường chất lượng dữ liệu.
Kỹ thuật này không cung cấp giá trị độ lớn cho thấy khoảng cách giữa một tập dữ liệu là hoàn toàn phù hợp khi đo, nhưng chỉ trong các đối tượng của khung dữ liệu đo lường chất lượng trình bày là tối đa hoặc tối thiểu. Kỹ thuật này không cung cấp một giá trị định lượng cho biết sự xuất hiện phù hợp hoặc không phù hợp khi khung đo lường chất lượng dữ liệu được chọn là thông báo cùng với các ADQR. Tuy nhiên, kiểu ADQR này nói rất ít về tầm quan trọng của kết quả chất lượng dữ liệu khác.
|
J.5 Maximum/minimum value
Each data quality result is given a value v based on the significance of a data quality result to the purpose of the product. The reason for the data producer’s decision should be reported as part of the dataset’s quality result. The aggregate quality is determined by either of the two equations,
ADQR = max.(vi, i = 1. . . n )
or
ADQR = min.(vi, i = 1. . . n )
where n is the number of data quality measurement frames measured.
The technique does provides a magnitude value indicating how close a dataset is to full conformance as measured, but only in terms of the data quality measurement frame represented by the maximum or minimum. The technique does provide a quantitative value that indicates where conformance or non-conformance occurs when the selected data quality measurement frame is reported along with the ADQR. However, this type of ADQR tells little about the magnitude of the other data quality results.
|
Tài liệu tham khảo
[1] ISO 2859 (tất cả các phần), thủ tục lấy mẫu để kiểm tra bằng các thuộc tính
[2] ISO 3534-2: —1, Thống kê - Từ vựng và biểu tượng - Phần 2: Thống kê ứng dụng
[3] ISO 3951-1: —2, thủ tục lấy mẫu và biểu đồ để kiểm tra bởi các biến — Phần 1: Thông số kỹ thuật về kế hoạch lấy mẫu đơn được lập chỉ số bằng cách giới hạn chất lượng chấp nhận (AQL) để kiểm tra lot-by-lot cho một đặc tính chất lượng và AQL duy nhất
[4] ISO 8601:2000, các thành phần dữ liệu và định dạng trao đổi — trao đổi thông tin — Trình bày về thời gian
[5] ISO 9001:2000, Hệ thống quản lý chất lượng — Các yêu cầu
[6] ISO 11404:1996, Công nghệ thông tin — Ngôn ngữ lập trình, môi trường và giao diện phần mềm hệ thống — kiểu dữ liệu ngôn ngữ độc lập
[7] ISO 19108:2002, Thông tin địa lý — Lược đồ thời gian
|
Bibliography
ISO 2859 (all parts), Sampling procedures for inspection by attributes
ISO 3534-2: —1, Statistics — Vocabulary and symbols — Part 2: Applied statistics
ISO 3951-1: —2 Sampling procedures and charts for inspection by variables — Part 1: Specification for single sampling plans indexed by acceptance quality limit (AQL) for lot-by-lot inspection for a single quality characteristic and a single AQL
ISO 8601:2000, Data elements and interchange formats — Information interchange — Representation of dates and times
ISO 9001:2000, Quality management systems — Requirements
ISO 11404:1996, Information technology — Programming languages, their environments and system software interfaces — Language-independent datatypes
[7] ISO 19108:2002, Geographic information —Temporal schema
|
Chia sẻ với bạn bè của bạn: |