G.3 Đánh giá chất lượng
G.3.1 Nhận dạng lỗi
Bằng cách so sánh tập dữ liệu, trình bày trên hình G.4 với thế giới thục mô phỏng đặc trưng ở hình G.3, danh sách lỗi có thể lập được trong tập dữ liệu ví dụ. Tiếp theo là ví dụ danh mục lỗi phát hiện với số lỗi cho theo qui chiếu:
a) Các không đầy đủ (omision) và lấy nhầm (commission) trong lưu trữ cây. Ba cây (No. 6, No. 8, No. 27 ) thừa và hai cây thiếu (No. 9, No. 25).
b) Các lỗi thiếu và thừa ghi nhận trong đường mòn lưu trữ. Một đường thiếu (No.18) và một đường thừa (No.19).
c) Một ngôi nhà thay thế một tòa nhà công nghiệp (số 23).
d) Hai đường dẫn bị mã hóa nhầm như đường giao thông (số 17, số 26).
e) Một ngôi nhà bị mất (số 21).
f) lỗi thuộc tính trên đường. Hai con đường có sai "điều kiện" (số 29, số 28).
g) Một bệnh viện được biểu diễn trong các tập dữ liệu (số 3).
h) Hai cây có chiều cao dưới 1 mét được biểu diễn trong các tập dữ liệu (số 6, số 8)
i) Cây mã lớp độ cao cây bị thiếu. Một cây thiếu một mã lớp trong khi nó là B trong vũ trụ luận (số 22).
j) thuộc tính chiều cao cây phân loại sai. Sáu cây bị sai chiều cao (số 2, số 11, số 13, số 16, số 20, số 24).
k) thuộc tính tên nhà 'tên gia đình' lỗi. Những ngôi nhà có tên là "van Hamme" (số 7) và "Herge" (số 1) trong thế giới thực mô phỏng không có tên trong các tập dữ liệu. Ngôi nhà có tên là "Goscinny" trong các tập dữ liệu (số 12) không có tên trong thế giới thực mô phỏng.
l) lỗi tên thuộc tính là 'tên gia đình'. Những ngôi nhà có tên là "Franquin" (số 5) và "Pratt" (số 15) trong thực địa được đặt tên là "Franklin" và "Prat" tương ứng trong các tập dữ liệu.
m) Lỗi đếm số người cư trú trong nhà bị sai: Thuộc tính số người cư trú trong nhà bị thiếu trong một ngôi nhà (số 31) và sai cho ba nhà (số 4, số 14, số 30).
n) lỗi không đầy đủ nhà trong các tòa nhà công nghiệp. Một tòa nhà công nghiệp bị thiếu (số 10).
CHÚ THÍCH Việc phân loại các lỗi như không đầy đủ / lấy thừa, đầy đủ hoặc độ chính xác chuyên đề là lỗi kép. Ví dụ, việc phân loại sai của một ngôi nhà là một tòa nhà công nghiệp có thểo coi là lỗi không đầy đủ cho lớp nhà khu dân cư/ nhưng cũng là lỗi lấy thừa cho lớp nhà công nghiệp
|
G.3 Evaluation of data quality
G.3.1 Identification of errors
By comparing the dataset, represented by Figure G.3, with the universe of discourse, represented by Figure G.2, a list of errors in the example dataset can be produced. The following is a list of detected errors with error numbers given for reference.
a) Errors of omission and commission in recording of trees. Three trees No. 6, No. 8, No. 27) are in excess and two trees are missing No. 9, No. 25).
b) Errors of omission and commission in recording paths. One path is missing (No.18) and one is in excess (No.19).
c) A house replaces an industrial building (No.23).
d) Two paths are miscoded as roads (No.17, No.26).
e) A house is missing (No.21).
f) Attribute error on roads. Two roads have the wrong “condition” (No.29, No.28).
A hospital is represented in the dataset (No.3).
Two trees with a height less than 1 metre are represented in the dataset (No.6, No.8)
Tree height attribute class code missing. A tree is missing a class code while it is B in the universe of discourse (No.22).
Tree height attribute misclassified. Six trees have the wrong height class assigned (No.2, No.11, No.13, No.16, No.20, No.24).
House name attribute ‘family name’ errors. The houses named “van Hamme” (No.7) and “Herge” (No.1) in the universe of discourse have no name in the dataset. The house named “Goscinny” in the dataset (No.12) has no name in the universe of discourse.
House name attribute ‘family name’ errors. The houses named “Franquin” (No.5) and “Pratt” (No.15) in the universe of discourse are named “Franklin” and “Prat” respectively in the dataset.
House occupant count attribute errors. The occupant count attribute is missing for one house (No.31) and wrong for three houses (No.4, No.14, No.30).
Omission error in industrial buildings. One industrial building is missing (No.10).
NOTE The classification of errors as omission/commission, completeness or thematic accuracy is subjective. For example, the misclassification of a house as an industrial building could alternately be considered as an error of omission of the one and commission of the other.
|