Chương 1
CÁC VẤN ĐỀ CƠ BẢN CỦA TIN HỌC
1.1. Thông tin 1.1.1 Thông tin là gì?
Khái niệm thông tin (information) được sử dụng thường ngày. Con người có nhu cầu đọc báo, nghe đài, xem phim, video, đi tham quan, du lịch, tham khảo ý kiến người khác, ... để nhận được thêm thông tin mới. Thông tin mang lại cho con người sự hiểu biết, nhận thức tốt hơn về những đối tượng trong đời sống xã hội, trong thiên nhiên, ... giúp cho họ thực hiện hợp lý công việc cần làm để đạt tới mục đích một cách tốt nhất.
Khi tiếp nhận được thông tin, con người thường phải xử lý nó để tạo ra những thông tin mới, có ích hơn, từ đó có những phản ứng nhất định. Người tài xế chăm chú quan sát người, xe cộ đi lại trên đường, độ tốt xấu mặt đường, tính năng kỹ thuật cũng như vị trí của chiếc xe để quyết định, cần tăng tốc độ hay hãm phanh, cần bẻ lái sang trái hay sang phải... nhằm đảm bảo an toàn tối đa cho chuyến xe đi.
Thông tin có thể được phát sinh, được lưu trữ, được truyền, được tìm kiếm, được sao chép, được xử lý, nhân bản. Thông tin cũng có thể biến dạng, sai lệch hoặc bị phá hủy.
Mỗi tế bào sinh dục của những cá thể sinh vật mang thông tin di truyền quyết định những đặc trưng phát triển của cá thể đó. Gặp môi trường không thuận lợi, các thông tin di truyền đó có thể bị biến dạng, sai lệch dẫn đến sự hình thành những cá thể dị dạng. Ngược lại, bằng những tác động tốt của di truyền học chọn giống, ta có thể cấy hoặc làm thay đổi các thông tin di truyền theo hướng có lợi cho con người.
Thông tin được thể hiện dưới nhiều dạng thức khác nhau như sóng ánh sáng, sóng âm, điện từ, các ký hiệu viết trên giấy hoặc khắc trên gỗ, trên đá, trên các tấm kim loại ... Về nguyên tắc, bất kỳ cấu trúc vật chất nào hoặc bất kỳ dòng năng lượng nào cũng có thể mang thông tin. Chúng được gọi là những vật (giá) mang tin. Dữ liệu (data) là biểu diễn của thông tin và được thể hiện bằng các tín hiệu (signal) vật lý.
Thông tin chứa đựng ý nghĩa, còn dữ liệu là các dữ kiện không có cấu trúc và không có ý nghĩa rõ ràng nếu nó không được tổ chức và xử lý. Cùng một thông tin, có thể được biểu diễn bằng những dữ liệu khác nhau. Cùng biểu diễn một đơn vị, nhưng trong chữ số thập phân ta cùng ký hiệu 1, còn trong hệ đếm La Mã lại dùng ký hiệu I. Mỗi dữ liệu lại có thể được thể hiện bằng những ký hiệu vật lý khác nhau. Cũng là gật đầu, đối với nhiều dân tộc trên thế giới thì đó là tín hiệu thể hiện sự đồng tình; nhưng ngược lại, đối với người Hy Lạp, gật đầu để biểu lộ sự bất đồng. Cùng là ký hiệu I nhưng trong tiếng Anh có nghĩa là đại từ nhân xưng ngôi thứ nhất (tôi) còn trong toán học lại là chữ số La Mã có giá trị là 1. Mỗi tín hiệu có thể dùng để thể hiện các thông tin khác nhau. Chẳng hạn như trong máy tính điện tử (MTĐT), nhóm 8 chữ số 01000001, nếu là số sẽ thể hiện số 65, còn nếu là chữ sẽ là chữ “A”.
Như vậy, Thông tin là một khái niệm trừu tượng, tồn tại khách quan, có thể nhớ trong đối tượng, biến đổi trong đối tượng và áp dụng để điều khiển đối tượng. Thông tin làm tăng thêm hiểu biết của con người, là nguồn gốc của nhận thức. Thông tin về một đối tượng chính là một dữ kiện về đối tượng đó, chúng giúp ta nhận biết và hiểu được đối tượng.
Dữ liệu (data) là hình thức thể hiện của thông tin trong mục đích lưu trữ và xử lý nhất định. Khái niệm dữ liệu xuất hiện cùng với việc xử lý thông tin bằng máy tính. Vì thế trong nhiều tài liệu người ta định nghĩa dữ liệu là đối tượng xử lý của máy tính. Thông tin luôn mang một ý nghĩa xác định nhưng hình thức thể hiện của thông tin rõ ràng mang tính quy ước.
Tri thức (knowledge) có ý nghĩa khái quát hơn thông tin. Những nhận thức thu nhận được từ nhiều thông tin trong một lĩnh vực cụ thể nào đó, có tính hướng mục đích mới trở thành tri thức. Như vậy tri thức là mục đích của nhận thức trên cơ sở tiếp nhận thông tin. Quá trình xử lý thông tin chính là quá trình nhận thức để có tri thức.
1.1.2. Mã hóa thông tin trên máy tính 1.1.2.1. Mã hóa thông tin
Thông tin được chia làm hai loại là thông tin liên tục và thông tin không liên tục (thông tin rời rạc). Thông tin liên tục đặc trưng cho các đại lượng mà số lượng các giá trị có thể tiếp nhận được là vô hạn như độ dài dịch chuyển cơ học, điện áp, …. Còn thông tin rời rạc đặc trưng cho các đại lượng mà số lượng các giá trị có thể kể ra được như số trang sách của một cuốn sách, tên sinh viên trong lớp, địa chỉ của hộ gia đình trên phố, …
Thông tin rời rạc có thể biểu diễn thông tin qua các bộ ký hiệu (mã ký tự) mà ta gọi là bảng chữ. Giả sử, ta có tập đối tượng X cần biểu diễn. Để làm điều này, ta chọn một tập hữu hạn A các kí hiệu làm bảng chữ mà mỗi kí hiệu là một chữ. Chúng ta sẽ gọi mỗi dãy hữu hạn các chữ là một từ trên A. Ví dụ nếu A là tập các chữ số thì mỗi từ chính là một số (cho bằng một dãy số). Mã hoá các thông tin rời rạc của một tập trên một bảng chữ A chính là cách gán cho mỗi phần tử x thuộc X, một từ y trên A. Phép gán mã phải đảm bảo tính chất: mã của hai đối tượng khác nhau phải khác nhau. Tính chất này đảm bảo khi biết mã có thể tìm được đối tượng tương ứng. Quá trình gán mã được gọi là phép lập mã. Quá trình ngược được gọi là phép giải mã. Ví dụ, nếu X là tập các thí sinh, chọn A là tập các chữ số thì mã của một thí sinh có thể lấy là số báo danh của thí sinh đó. Số báo danh phải cho phép chỉ định duy nhất một thí sinh.
Dữ liệu là hình thức biểu diễn thông tin với mục đích xử lý thông tin. Vậy mã hoá chính là con đường chuyển từ thông tin thành dữ liệu. Các thông tin dưới dạng số, văn bản, âm thanh, hình ảnh, … đều phải chuyển dưới dạng mã phù hợp để máy tính có thể làm việc được.
Chia sẻ với bạn bè của bạn: |