PHẦn mở ĐẦu tính cấp thiết của đề tài



tải về 0.62 Mb.
trang1/8
Chuyển đổi dữ liệu06.08.2016
Kích0.62 Mb.
#14604
  1   2   3   4   5   6   7   8

Khóa luận tốt nghiệp K53 Thông tin – Thư viện


PHẦN MỞ ĐẦU

  1. Tính cấp thiết của đề tài

Bước vào thế kỷ XXI, Công nghệ thông tin (CNTT) và truyền thông đã chiếm một vị trí quan trọng trong mọi lĩnh vực của đời sống. Sự phát triển nhanh chóng của CNTT và truyền thông đã tác động mạnh mẽ đến ngành Thông tin – Thư viện (TTTV). Xu hướng phát triển của các cộng đồng thư viện trên thế giới hiện nay là tiến đến số hóa và kết nối để thu hẹp diện tích và khoảng cách địa lý.

Sự phát triển của CNTT không chỉ làm thay đổi nhanh chóng toàn bộ thế giới mà đồng thời còn tạo ra nhiều thách thức và cơ hội. Đặc biệt với ngành TTTV, ngành có sự kết hợp lĩnh vực quản trị tri thức với những ứng dụng CNTT và truyền thông. Ngành đang phải đương đầu với các thách thức do cuộc cách mạng công nghệ này đem lại để tồn tại và đáp ứng được những nhu cầu tin đa dạng, phức tạp của cộng đồng người dùng tin. Đây là quy luật của tự nhiên. Việc tăng nhanh cả về số lượng, chất lượng, loại hình, phương thức khai thác của thông tin – tri thức đã tạo ra một sức ép đáng kể cho các cơ quan TTTV phải tự biến đổi, hoàn thiện mình để quản trị nguồn thông tin tri thức đó.

Nhằm giải quyết bài toán quản trị tri thức, các mô hình thư viện hiện đại đã ra đời và xu thế xây dựng, phát triển các Thư viện số, các bộ sưu tập tài nguyên thông tin số đã trở thành một phần chủ đạo trong toàn cảnh hoạt động TTTV trên thế giới. Sự tác động của công nghệ web, CNTT chính là những yếu tố quan trọng hướng tới việc xây dựng thư viện số, phát triển các bộ sưu tập, nguồn tài nguyên thông tin số và đó là một sự thỏa mãn nhu cầu chưa từng có về lưu trữ, tổ chức, và truy cập thông tin. Sự xuất hiện của các bộ sưu tập tài nguyên số, thư viện số không chỉ tạo ra một cơ hội mới cho sự phát triển thư viện, mà còn đặt ra những yêu cầu cao hơn trong việc cải tổ những thư viện truyền thống. Tài nguyên số chính là một trong những nền tảng quan trọng tạo nên sức mạnh trí tuệ quốc gia.

Cùng với sự tác động mạnh mẽ của CNTT, ngành TTTV Việt Nam đang bước những bước đầu tiên trên con đường hiện đại hóa. Xã hội thông tin càng phát triển càng đặt ra nhiều thách thức không nhỏ cho ngành. Nhận thức được tầm quan trọng của các công nghệ ngày nay tới hoạt động TTTV, và cũng là sự hội nhập với cộng đồng thư viện trên thế giới, các cơ quan TTTV Việt Nam luôn tự đổi mới chính mình, nâng cao chất lượng dịch vụ TTTV để bắt kịp thời đại.

Hiện nay, Việt Nam đang trong quá trình xây dựng nhà nước pháp quyền định hướng xã hội chủ nghĩa và hoàn thiện hệ thống pháp Luật. Vì vậy, trong quá trình phát triển hiện tại, các cơ quan TTTV ngành Luật (sau đây gọi tắt là thư viện ngành Luật) đóng vai trò quan trọng trong việc lưu giữ, phổ biến và cung cấp các nguồn thông tin pháp Luật phục vụ công tác lập pháp, hành pháp và tư pháp, đặc biệt là công tác nghiên cứu, giảng dạy và học tập của các trường đào tạo Luật hướng tới các đối tượng người dùng tin.

Tuy nhiên sự đáp ứng thông tin của các thư viện ngành Luật vẫn còn hạn chế so với nhu cầu của người dùng tin. Thực tế tại một số thư viện ngành Luật ở Hà Nội cho thấy mặc dù sự đáp ứng thông tin còn hạn chế so với nhu cầu người dùng, nhưng mỗi thư viện đều có những thế mạnh, những khả năng có thể liên kết chia sẻ, phát triển nguồn lực thông tin. Hiển nhiên rằng không thể có một cơ quan TTTV nào có đủ khả năng đáp ứng mọi nhu cầu thông tin của người dùng tin. Bởi lẽ nhu cầu thông tin đang ngày càng biến đổi, phát triển nhanh chóng, vừa bao quát, vừa chuyên sâu trong nghiên cứu khoa học, giảng dạy của cán bộ, học tập của sinh viên, nghiên cứu của các chuyên gia....

Giải pháp đặt ra cho các thư viện ngành Luật là tiến hành trao đổi chia sẻ nguồn lực thông tin, xây dựng, phát triển các bộ sưu tập tài nguyên thông tin số, các thư viện số. Xây dựng, phát triển bộ sưu tập tài nguyên thông tin số sẽ trở thành một phần chủ đạo trong toàn cảnh hoạt động của các cơ quan. Bộ sưu tập tài nguyên thông tin số là cầu nối cho sự trao đổi giữa các chuyên gia, thủ thư và bạn đọc, là công cụ khám phá, tìm kiếm, truy xuất thông tin và là mô hình hiện đại nhằm cung cấp những dịch vụ thông tin chuyên biệt ở mức độ cao. Phát triển nguồn tài nguyên thông tin số không chỉ tạo ra một cơ hội mới cho sự phát triển thư viện, mà còn đặt ra những yêu cầu cao hơn trong việc cải tổ những thư viện truyền thống.

Chính vì vậy, các thư viện ngành Luật cần phát triển tài nguyên số và công nghệ khai thác. Thực tế cũng cho thấy các thư viện ngành Luật đã xây dựng được phần nào bộ sưu tập số, nguồn tài nguyên số của mình. Trên cơ sở đó, cần phải phát triển nguồn tài nguyên số của các cơ quan, đẩy mạnh sự phát triển của thư viện, đó là sự hội nhập cũng như tiến bước cùng thời đại. Xuất phát từ yêu cầu thực tế và nhận thức của bản thân về sự phát triển của sưu tập số, tác giả đã lựa chọn đề tài “Phát triển tài nguyên thông tin số cho các cơ quan TTTV ngành Luật ở Hà Nội” làm Khóa luận của mình với mong muốn tìm hiểu, nghiên cứu, từ đó đề xuất các giải pháp nhằm đẩy mạnh hoạt động phát triển nguồn tài nguyên thông tin số, tăng cường sự hợp tác và phát triển giữa các thư viện ngành Luật trong bối cảnh hiện nay.



  1. Mục đích, nhiệm vụ nghiên cứu

Trên cơ sở nghiên cứu các vấn đề xây dựng và phát triển sưu tập số, nguồn tài nguyên thông tin số, tìm hiểu tình hình thực tiễn hoạt động xây dựng phát triển nguồn tài nguyên thông tin số của các thư viện ngành Luật trên địa bàn Hà Nội, khóa luận đưa ra những nhận xét và kiến nghị nhằm đẩy mạnh hoạt động xây dựng, phát triển nguồn tài nguyên thông tin số của các cơ quan hướng tới sự tiết kiệm, đồng bộ, hiệu quả trong hoạt động, hợp tác.

Để thực hiện được mục đích trên, khóa luận cần giải quyết các nhiệm vụ sau:



  • Tìm hiểu các vấn đề lý luận về sưu tập số, tài nguyên thông tin số

  • Làm rõ vai trò của bộ sưu tập tài nguyên thông tin số đối với các cơ quan TTTV nói chung và ngành Luật nói riêng

  • Tìm hiểu tình hình hoạt động, hiện trạng, khả năng phát triển nguồn tài nguyên thông tin số của các thư viện ngành Luật.

  • Trình bày các nhân tố ảnh hưởng tác động tới hoạt động xây dựng phát triển nguồn tài nguyên thông tin số

  1. Tình hình nghiên cứu

Trên cở sở tham khảo và tìm hiểu các tài liệu liên quan đến sưu tập số, nguồn tài nguyên thông tin số, xây dựng, phát triển sưu tập số, nguồn tài nguyên thông tin số, hoạt động của thư viện ngành Luật…tác giả nhận thấy:

  • Đã có khá nhiều tài liệu, bài viết nghiên cứu của các chuyên gia TTTV về vấn đề lý luận của sưu tập số, thông tin số. Sự phát triển của tài nguyên số hiện nay. Đó là những bài viết đi sâu về các vấn đề nhỏ trong cả quy trình của vấn đề xây dựng và phát triển sưu tập số, nguồn tài nguyên thông tin số: Những vấn đề cơ bản về Siêu dữ liệu của Th.s Cao Minh Kiểm; Hướng dẫn thực hành xây dựng bộ sưu tập thư viện số bằng phần mềm nguồn mở Greenstone của Nguyễn Minh Hiệp…

  • Bên cạnh đó là các bài giảng ngành TTTV đề cập đến các vấn đề của thông tin số, sưu tập số, thư viện số hay thư viện điện tử như: Nghiên cứu thư viện số trên thế giới và định hướng nghiên cứu thư viện số ở Việt Nam; thư viện điện tử của Th.s Nguyễn Thị Thúy Hạnh…

  • Nắm bắt theo xu thế phát triển của nguồn tài nguyên thông tin số như hiện nay, cũng đã có nhiều khóa luận của sinh viên tiến hành nghiên cứu tìm hiểu các vấn đề lý luận và thực tiễn về tài nguyên thông tin số ở Việt Nam: “Tìm hiểu vấn đề xây dựng và phát triển sưu tập số” của sinh viên Lê Công Năng K49 chính quy, “công tác số hóa tài liệu tại thư viện Quốc gia Việt Nam” của sinh viên Lại Cao Bằng K52 chính quy, “khảo sát một số phần mềm tiêu biểu được sử dụng để xây dựng bộ sưu tập số trong các cơ quan TTTV Việt Nam” của sinh viên Đồng Thị Thanh Thoan K49 chính quy, “Tìm hiểu về việc phát triển và chia sẻ tài nguyên số tại trung tâm TTTV Đại học Quốc gia Hà Nội và thư viện Quốc gia Việt Nam” của sinh viên Mai Thị Hương K52 chính quy, “Thư viện số với các giải pháp quản trị quyền thông tin số” của sinh viên Vũ Thị Thanh Mai K46 tại chức…

  • Đối với các thư viện ngành Luật, đã có một số tài liệu, báo cáo khoa học tìm hiểu về nguồn lực thông tin, tình hình hoạt động tại các thư viện Luật, các bài báo đề cập tới vấn đề chia sẻ nguồn lực thông tin nói chung, các vấn đề nhằm đẩy mạnh sự phát triển của các thư viện ngành Luật. Gần đây nhất, là tháng 10 năm 2010, tại Trung tâm TTTV Đại học Luật Hà Nội có tổ chức hội thảo khoa học với chủ đề “Thư viện Luật Việt Nam, hợp tác và phát triển”. Tháng 04 năm 2011 tác giả cũng đã thực hiện một đề tài khoa học: “Nghiên cứu chia sẻ nguồn lực thông tin pháp Luật cho hệ thống các cơ quan TTTV ngành Luật ở Hà Nội.” Trong hội thảo về thư viện Luật Việt Nam, các bài viết nghiên cứu về tình hình hoạt động của các thư viện Luật cụ thể và trong đề tài khoa học của tác giả thực hiện, đều nêu ra việc cần phải tiến hành đẩy mạnh hoạt động hiệu quả, tiết kiệm, cũng như trao đổi tương tác giữa các cơ quan TTTV đem lại kết quả tốt nhất đối với người dùng tin trên cơ sở xây dựng các thư viện hiện đại, nguồn tin điện tử, nguồn tài nguyên thông tin số làm giải pháp cho các vấn đề này… Tuy nhiên chưa có công trình nào nghiên cứu vấn đề phát triển nguồn tài nguyên thông tin số cho hệ thống các thư viện ngành Luật. Với thực tiễn nghiên cứu của ngành, cũng như thực tiễn vai trò của vấn đề, khóa luận “Phát triển nguồn tài nguyên thông tin số cho hệ thống các cơ quan TTTV ngành Luật” được triển khai. Đây là vấn đề mới, và chưa có tác giả nào thực hiện

  1. Đối tượng, phạm vi nghiên cứu

- Đối tượng nghiên cứu: Lý thuyết chung về vấn đề phát triển nguồn tài nguyên thông tin số; Thực trạng xây dựng và phát triển nguồn tài nguyên thông tin số tại các thư viện ngành Luật; Các vấn đề liên quan đến xây dựng và phát triển nguồn tài nguyên thông tin số.

- Phạm vi nghiên cứu: Khảo sát thực tiễn hoạt động, hiện trạng xây dựng phát triển nguồn tài nguyên thông tin số tại một số thư viện ngành Luật trên địa bàn Hà Nội. Cụ thể là:

Trung tâm Thông tin – Thư viện Đại học Luật Hà Nội

Trung tâm Thông tin – Thư viện và Nghiên cứu Khoa học của Văn phòng Quốc hội

Thư viện Học viện Tư pháp

Thư viện Viện Nhà nước và Pháp luật


  1. Phương pháp nghiên cứu

- Phương pháp luận:

Trên cơ sở phương pháp luận của Chủ nghĩa duy vật biện chứng và duy vật lịch sử của Chủ nghĩa Mác Lênin.

Nắm vững tư tưởng của Chủ tịch Hồ Chí Minh và Nhà nước về công tác sách báo và thư viện.

- Phương pháp cụ thể:

Thu thập tài liệu, đọc và phân tích tài liệu

Quan sát điều tra thực tế

Điều tra bằng bảng hỏi

Phương pháp phỏng vấn, trao đổi, mạn đàm


  1. Đóng góp về lý luận và thực tiễn của đề tài

-Đóng góp về lý luận: Kết quả nghiên cứu của khóa luận sẽ góp phần hoàn thiện lý luận cơ bản về phát triển tài nguyên thông tin số nói riêng và phát triển vốn tài liệu nói chung.

-Đóng góp về thực tiễn:

Khóa luận nêu bật được thực trạng phát triển nguồn tài nguyên thông tin số của một số thư viện ngành Luật trên địa bàn Hà Nội. Trên cơ sở đó đưa ra những nhận xét, kiến nghị nhằm đẩy mạnh việc xây dựng và phát triển nguồn tài nguyên thông tin số cho các cơ quan này.



  1. Bố cục khóa luận

Ngoài phần mở đầu và kết luận, danh mục tài liệu tham khảo, phụ lục thì bố cục chính của khóa luận được chia thành 3 chương như sau:

Chương 1: Lý luận chung về phát triển tài nguyên thông tin số cho các cơ quan thông tin – thư viện ngành Luật ở Hà Nội

Chương 2: Thực trạng công tác phát triển tài nguyên thông tin số của các cơ quan thông tin – thư viện ngành Luật ở Hà Nội

Chương 3: Nhận xét và giải pháp phát triển tài nguyên thông tin số cho các cơ quan thông tin – thư viện ngành Luật ở Hà Nội

PHẦN NỘI DUNG

CHƯƠNG 1

LÝ LUẬN CHUNG VỀ PHÁT TRIỂN TÀI NGUYÊN THÔNG TIN SỐ CHO CÁC CƠ QUAN THÔNG TIN-THƯ VIỆN NGÀNH LUẬT Ở HÀ NỘI

    1. Những khái niệm cơ bản

      1. Khái niệm phát triển

Trong lịch sử triết học, quan điểm siêu hình xem sự phát triển chỉ là sự tăng, giảm thuần túy về lượng, không có sự thay đổi về chất của sự vật; đồng thời nó cũng xem sự phát triển là quá trình tiến lên liên tục, không trả qua nhưng bước quanh co phức tạp.

Đối lập với quan điểm siêu hình, trong phép biện chứng khái niệm phát triển dùng để chỉ quá trình vận động của sự vật theo khuynh hướng đi lên: từ trình độ thấp đến trình độ cao, từ kém hoàn thiện đến hoàn thiện hơn.

Phát triển cũng là quá trình phát sinh và giải quyết mâu thuẫn khách quan vốn có của sự vật; là quá trình thống nhất giữa phủ định các nhân tố tiêu cực và kế thừa, nâng cao nhân tố tích cực từ sự vật cũ trong hình thái mới của sự vật.


      1. Khái niệm tài nguyên

Dưới tác động mạnh mẽ của cách mạng khoa học và công nghệ, khái niệm tài nguyên được mở rộng ra trên nhiều lĩnh vực hoạt động của con người.

Hiểu theo nghĩa rộng, tài nguyên bao gồm tất cả các nguồn nguyên liệu, nhiên liệu – năng lượng, thông tin có trên trái đất và trong không gian vũ trụ liên quan mà con người có thể sử dụng cho mục đích tồn tại và phát triển của mình.

Trên cơ sở sưu tầm, có thể đưa ra một số định nghĩa tài nguyên như sau:

Theo Từ điển Tiếng Việt:



  • Tài nguyên là nguồn của cải có sẵn trong tự nhiên chưa khai thác hoặc đang được tiến hành khai thác.

  • Mọi đối tượng của xử lý thông tin như bộ nhớ, tệp dữ liệu, công trình máy tính… cần cho việc thực hiện một mục tiêu nào đó.

Hay hiểu hơn giản hơn: “ Tài nguyên là tất cả các dạng vật chất, phi vật chất và tri thức được sử dụng để tạo ra của cải vật chất, hoặc tạo ra giá trị sử dụng mới cho con người”

Như vậy, dựa trên các quan niệm, có thể nói tài nguyên là đối tượng sản xuất của con người. Xã hội loài người càng phát triển, số loại hình tài nguyên và số lượng mỗi loại tài nguyên được con người khai thác ngày càng tăng.



      1. Khái niệm thông tin số

Thế kỷ XXI được đánh dấu bằng sự ra đời của nền kinh tế mới, được gắn bằng nhiều thuật ngữ: kinh tế tri thức, kinh tế số, kinh tế mạng…Trong nền kinh tế này, xuất hiện một loại nguồn lực quan trọng là tài nguyên thông tin số. Đây là nguồn lực có tác động mạnh mẽ đến sự phát triển của ngành thư viện trên thế giới nói chung và của Việt Nam nói riêng. Cũng như bất kỳ nguồn lực nào trong xã hội, vấn đề cần thiết phải xác lập được phương thức quản lý và chiến lược phát triển thích hợp.

Theo Luật công nghệ thông tin, khái niệm thông tin số được trình bày như sau: “Thông tin số là thông tin được tạo lập từ các thiết bị kỹ thuật số, được lưu trữ dưới dạng các tín hiệu số, được xử lý, chuyển tải (trao đổi) giữa các thiết bị kỹ thuật số thông qua môi trường mạng hoặc môi trường khác”.

Với cách hiểu như vậy, thông tin số được coi là thông tin đại chúng, được tạo ra bởi con người hay sự vật, hiện tượng, được chuyển đổi thành dạng tín hiệu số, lưu trữ trong các thiết bị máy móc.

Thông tin số mang những đặc trưng vốn có của các nguồn tài nguyên truyền thống, bên cạnh đó còn mang những đặc điểm ưu việt:

Do sự phát triển của công nghệ thông tin, đặc biệt là công nghệ tạo và lưu trữ dữ liệu trên các vật mang tin từ tính, quang học, mật độ ghi thông tin trên các vật mang tin này rất cao nên dung lượng lưu trữ lớn, mật độ thông tin lớn.

Thông tin số đem lại khả năng đa truy cập, cho phép người dùng có thể tra tìm tài liệu đồng thời theo nhiều dấu hiệu khác nhau, cùng với đó là khả năng liên hệ, tiếp cận với tác giả, tạo ra một kênh phản hồi thông tin giữa người dùng tin và người sáng tạo ra thông tin.

Sự tồn tại dưới nhiều dạng của thông tin số làm cho thông tin số trở nên hấp dẫn hơn, dễ hiểu hơn, dề truyền đạt hơn, và hơn hết là khả năng truy cập từ xa trong mọi điều kiện về không gian, thời gian. CNTT truyền thông đã thực hiện được việc truyền thông tin dạng số từ các vị trí ở xa.

Tiếp cận mọi nơi, mọi lúc là điều không tưởng với các thư viện truyền thống, các nguồn tin lưu trữ dưới dạng truyền thống. Thông tin số ra đời đáp ứng được yêu cầu này, nó trở thành kênh thông tin đem lại những lợi ích quan trọng cho người sử dụng trong kỷ nguyên công nghệ điện toán:

Thông tin dạng số có thể gửi nhiều bản cùng một lúc qua mạng thông tin trong một phần nhỏ của một phút, thậm chí chỉ một giây. Người sử dụng không cần phải đến thư viện để sử dụng các máy tính được nối mạng. Họ có thể truy cập thông tin qua máy tính của mình.

Thông tin dạng số có thể cắt và dán từ tài liệu này sang tài liệu khác.

Thông tin dạng số được miễn phí hoặc rẻ hơn so với tài liệu in.

Thông tin dạng số thường thay đổi vai trò của cán bộ thư viện ở nhiều phương diện.

Sự phát triển nhanh chóng và đổi mới hàng ngày, thậm chí hàng giờ mang lại sự ưu việt cho nguồn thông tin số…Cũng qua đó nâng cao năng lực khai thác thông tin của người dùng tin

Tuy nhiên, thông tin số cũng có những hạn chế trong quá trình sử dụng, đó là tính đảm bảo an toàn thông tin. Sự phát triển của CNTT là tiền đề nhưng cũng đem lại những thách thức cho các vấn đề không mong muốn. Đó là việc dễ sao chụp thông tin, dễ bị làm sai lệch thông tin, các hệ quả của CNTT tác động tới sự phát triển của thông tin số…

Với các đặc trưng như vậy, thông tin số có ý nghĩa rất lớn đến việc xây dựng, phát triển những thư viện hiện đại và bền vững.


      1. Khái niệm phát triển tài nguyên thông tin số

Phát triển tài nguyên thông tin số là công tác làm tăng thêm nguồn lực thông tin số của mỗi cơ quan, đơn vị. Là những hoạt động nhằm gia tăng số lượng cũng như chất lượng tài liệu số.

Trên cơ sở nhu cầu người dùng tin, cũng như vai trò quan trọng của thông tin số mang lại, phát triển tài nguyên số là một hoạt động tất yếu, có ý nghĩa to lớn đến việc phát triển thư viện hiện đại và bền vững. Quá trình phát triển tài nguyên số cũng được vận động từ thấp đến cao, chất lượng, số lượng tài nguyên số sẽ ngày càng được tăng cường.

Tạo lập và phát triển tài nguyên thông tin số của riêng mỗi cơ quan là vấn đề lớn nhất trong xây dựng thư viện điện tử, thư viện số. Công việc này đòi hỏi phải đầu tư lớn và liên tục. Để làm tốt công việc này, các cơ quan xây dựng thư viện điện tử, thư viện số cần có cách tiếp cận hợp lý, khả thi và kinh tế.


      1. Khái niệm sưu tập số

Một sưu tập số không chỉ là một tập hợp các đối tượng số thông thường mà còn phải là một tập hợp các tài liệu hay đối tượng số được lựa chọn và tổ chức cùng với các siêu dữ liệu mô tả và có ít nhất một giao diện để cho người sử dụng truy cập.

Hoặc sưu tập số là tập hợp các dữ liệu trực tuyến (online) và dữ liệu điện tử trên vật mang tin vật lý như CD-ROM, vi phim, audio, video… về một chủ đề. Mặc dù mỗi loại hình tài liệu có sự khác nhau về cách thể hiện, nhưng nó đều cung cấp một giao diện đồng nhất mà qua đó các tài liệu có thể truy cập dễ dàng.

Chúng là tập hợp các thông tin được số hóa dưới những dạng thức nhất định để máy móc có thể đọc được và người dùng tin có thể truy cập thông tin một cách dễ dàng với những thiết bị tương thích. Nói cách khác sưu tập số là tập hợp các đối tượng số, mỗi đối tượng số được cấu thành bởi hai thành phần không thể thiếu là nội dung số và siêu dữ liệu.

Ví dụ: bộ sưu tập số về chủ tịch Hồ Chí Minh gồm các văn bản, các tác phẩm văn học, các văn kiện chính trị do Bác viết và do người khác viết về Bác; Những bài hát, bản nhạc viết về Hồ chí Minh; những đoạn phim, những băng video phản ánh cuộc đời và sự nghiệp hoạt động cách mạng của Người.

Một bộ sưu tập số như vậy trước khi trình bày phải qua một quá trình hình thành để tạo nên những cấu trúc hỗ trợ cho việc truy tìm và lướt tìm được dùng cho việc truy cập sưu tập.

Khi xây dựng xong, bộ sưu tập có thể được xuất bản trên Internet hoặc xuất ra CD-ROM một cách hoàn toàn tự động.

Một khi sưu tầm thêm tài liệu mới, ta có thể dễ dàng bổ sung thêm vào bộ sưu tâp bằng cách tái xây dựng. Một thư viện nói chung bao gồm nhiều bộ sưu tập khác nhau, mỗi sưu tập tổ chức mỗi khác, tuy nhiên hoàn toàn giống nhau về phương cách hiển thị. Những bộ sưu tập như thế có thể được tạo nên bằng một Phần mềm nguồn mở đa ngôn ngữ thư viện số Greenstone (Greenstone digital library multilingual open source software).

Các chuyên gia TTTV đã phân loại sưu tập số như sau:



  • Theo cấp độ lưu trữ:

Sưu tập lưu trữ: Là sưu tập những đối tượng số có mục đích lưu trữ lâu dài tại thư viện.

Sưu tập máy chủ: Là các tài liệu số lưu trong máy chủ nhưng không đảm bảo được lưu giữ lâu dài.

Sưu tập gương: Là các loại tài liệu số lưu trữ ở một nơi khác, thư viện chỉ giữ bản sao và không có ý định lưu giữ lâu dài.

Sưu tập liên kết: Là sưu tập những tài liệu số được lưu giữ bên ngoài thư viện. Thư viện chỉ tạo ra đường dẫn đến tài liệu đó mà không lưu giữ được trong máy chủ



  • Sưu tập theo loại hình tài liệu

Sưu tập văn bản

Sưu tập đa phương tiện như âm thanh, hình ảnh, video…

Sưu tập web


  • Sưu tập theo nguồn gốc số hóa:

Sưu tập tài liệu số hóa (Digitnized Object)

Sưu tập tài liệu gốc (Digital Born Object)



      1. Khái niệm siêu dữ liệu

Thuật ngữ "Siêu dữ liệu" (tiếng Anh "METADATA"), có thể được định nghĩa đơn giản là dữ liệu về dữ liệu. Theo tiến sỹ Warwick Cathro, "siêu dữ liệu là những thành phần mô tả tài nguyên thông tin hoặc hỗ trợ thông tin truy cập đến tài nguyên thông tin". Trong tài liệu, siêu dữ liệu được xác định là "dữ liệu mô tả các thuộc tính của đối tượng thông tin và trao cho các thuộc tính này ý nghĩa, khung cảnh và tổ chức. Siêu dữ liệu còn có thể được định nghĩa là dữ liệu có cấu trúc về dữ liệu". Gail Hodge định nghĩa siêu dữ liệu là "thông tin có cấu trúc mà nó mô tả, giải thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiếm, sử dụng và quản lý hơn. Siêu dữ liệu được hiểu là dữ liệu về dữ liệu hoặc thông tin về thông tin". Nói tóm lại, siêu dữ liệu là thông tin mô tả tài nguyên thông tin.

Mục đích đầu tiên và cốt yếu nhất của siêu dữ liệu là góp phần mô tả và tìm lại các tài liệu điện tử trên mạng Internet. Sự phát triển mạnh mẽ của Internet đã tạo ra sự bùng nổ của các loại dữ liệu đa dạng ở dạng số, văn bản, hình ảnh, âm thanh, hình ảnh động, tài liệu đa phương tiện. Những tài liệu số này có thể truy cập được trên Internet song việc tìm kiếm chúng một cách hiệu quả và khoa học như với các hệ thống thông tin trực tuyến là hết sức khó khăn. Để góp phần tăng cường chất lượng tìm kiếm các tài liệu số trên mạng Internet, người ta đã đưa ra giải pháp sử dụng siêu dữ liệu.

Bên cạnh đó là sự hỗ trợ người dùng tin đánh giá thông tin mà không phải truy cập trực tiếp đến thông tin; giúp kiểm tra sự tồn tại của đối tượng thông tin, mô tả về ngôn ngữ, vị trí của thông tin…

Thực ra trong hoạt động TTTV truyền thống, từ lâu đã có những khái niệm liên quan đến siêu dữ liệu. Các bản mô tả thư mục chứa các dữ liệu mô tả đối tượng (như cho sách, cho tạp chí), do đó, chúng có thể được xem như một dạng siêu dữ liệu. Với việc tự động hoá công tác biên mục, phiếu thư mục được thay thế bằng biểu ghi thư mục. Như vậy, thành phần "siêu dữ liệu" còn có thể được trình bày trong biểu ghi, vì vậy, biểu ghi này được coi là biểu ghi siêu dữ liệu (metadata record) của các đối tượng được Cơ sở dữ liệu (CSDL) quản lý. Với tài liệu truyền thống trên giấy, thông tin mô tả được bố trí nằm ngoài đối tượng mà nó mô tả (ví dụ, trên phiếu thư mục của mục lục thư viện, trong biểu ghi của CSDL). Nhờ những yếu tố mô tả như vậy, người ta có thể xác định và tìm kiếm lại được tài liệu một các chính xác theo một vài yếu tố.

Trong thư viện điện tử hiện nay hay trong môi trường mạng, siêu dữ liệu ngày càng trở nên quan trọng bởi nó giữ vai trò chủ đạo không chỉ cung cấp cho người dùng tin những mô tả tài liệu mà họ tìm kiếm mà còn thông tin sử dụng phần mềm để xác định vị trí thông tin phù hợp, để thỏa thuận điều khoản cung cấp tài liệu, yêu cầu và tiếp nhận tài liệu.

Và nguồn tài liệu điện tử hiện nay phân tán trên mạng nhiều đến mức không thể xử lý hết được bằng cách thủ công như đã và đang áp dụng với tài liệu xuất bản trên giấy. Để xử lý được hết tài liệu điện tử phân tán, người ta phải áp dụng các phương pháp tự động - sử dụng các chương trình đặc biệt (được gọi theo nhiều cách khác nhau như robots, crawlers, spiders,...). Do tài liệu số (điện tử) được tạo ra, thông thường không tuân thủ những quy định xuất bản truyền thống, không có những quy tắc nhất định giúp cho phép nhận dạng tự động được các yếu tố mô tả thông thường như tác giả, địa chỉ xuất bản, thông tin về khối lượng,.... nên cần thiết phải có những quy định thống nhất để các chương trình tự động nhận dạng và xử lý chúng đúng theo các yêu cầu nghiệp vụ.

Những quy định như vậy được gọi là các quy định về siêu dữ liệu. Có thể thấy hiện nay, do nhiều chương trình máy tính chỉ định chỉ số dựa vào một số thành phần hạn chế như nhan đề hoặc toàn văn nên không hỗ trợ những tìm kiếm đặc thù (thí dụ theo tác giả, theo chủ đề, theo lĩnh vực,....). Vì thế, để tạo điều kiện cho các chương trình có thể định chỉ số tự động theo một số yếu tố xác định, người ta cần thiết phải đưa thêm vào tài liệu điện tử những thuộc tính bổ sung để tăng cường việc mô tả tài nguyên thông tin. Các công cụ định chỉ số tự động sẽ được lập trình để nhận dạng các thuộc tính này và định chỉ số chúng, từ đó hỗ trợ tìm kiếm theo những thuộc tính đặc thù.

Trong thư viện truyền thống, siêu dữ liệu chủ yếu là dạng mô tả hình thức và nội dung của tài liệu có trong kho thư viện, trong thư viện điện tử, siêu dữ liệu đã phát triển ở mức độ cao hơn với khái niệm rộng hơn. Nó đã phát triển thành 5 loại siêu dữ liệu:



  • Siêu dữ liệu hành chính (Administraive): Được dùng để quản lý và quản trị các tài nguyên thông tin. Ví dụ: Thông tin bổ sung; bản quyền và thông tin tái bản; tài liệu về yêu cầu truy cập hợp pháp; thông tin định vị; các tiêu chí số hóa; kiểm soát phiên bản và những khác biệt giữa các đối tượng thông tin tương đồng; thông tin kiểm trá của hệ thống quản lý.

  • Siêu dữ liệu mô tả (Descriptive): Được dùng để mô tả hay nhận diện các tài nguyên thông tin. Ví dụ: các biểu ghi thư mục; các hỗ trợ tìm kiếm; định chỉ số chuyên biệt; siêu dữ liệu liên kết giữa các tài nguyên; chú giải của người sử dụng

  • Siêu dữ liệu bảo quản (Preservation): Các thông tin liên quan đến quản lý việc bảo quản các tài nguyên thông tin. Ví dụ: Các tài liệu về tình trạng, điều kiện vật lý của tài nguyên thông tin; các tài liệu về công tác bảo quản và các phiên bản thông tin dưới dạng vật lý và số.

  • Siêu dữ liệu sử dụng (Use): Các thông tin liên quan đến mức độ và loại hình sử dụng tài nguyên thông tin. Ví dụ: Các biểu ghi trình bày; các thông tin về người sử dụng và việc sử dụng; thông tin về tái sử dụng nội dung và các phiên bản đa phương tiện.

  • Siêu dữ liệu kỹ thuật (Technical): Các thông tin liên quan đến cách thức hoạt động của hệ thống cũng như siêu dữ liệu. Ví dụ: thông tin phản hổi về phần cứng và phần mềm; thông tin số hóa; thông tin về thời gian phản hồi của hệ thống; dữ liệu về tính xác thực.

Hiện nay, có nhiều trao đổi thông tin mang tính chất metadata khá thông dụng đang được áp dụng như: MARC21/UNIMARC, Dublin Core Metadata... các dữ liệu metadata này thường được gắn vào phần đầu cho mỗi tài liệu điện tử được đưa vào máy chủ hoặc trên mạng internet nhằm hỗ trợ các công cụ tìm kiếm lọc ra các thông tin metadata để tổ chức thành các kho dữ liệu mà không cần dùng đến hệ quản trị cơ sở dữ liệu truyền thống. Thực tế thì ngay bản thân ngôn ngữ XML tự nó đã hỗ trợ việc hình thành một cơ sở dữ liệu toàn văn, phi cấu trúc và rất thuận lợi cho việc tìm kiếm, trao đổi và lưu trữ thông tin


    1. tải về 0.62 Mb.

      Chia sẻ với bạn bè của bạn:
  1   2   3   4   5   6   7   8




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương