Chủ nhiệm Bộ môn Phan Nguyên Hải ĐỀ CƯƠng chi tiết bài giảNG



tải về 4.09 Mb.
trang5/44
Chuyển đổi dữ liệu26.11.2017
Kích4.09 Mb.
#34644
1   2   3   4   5   6   7   8   9   ...   44

- Các tác tử quyết định cái cần làm không cần tham khảo lịch sử của chúng – Chúng dựa hoàn toàn vào hiện tại mà không tham khảo quá khứ.

- Chúng ta gọi các tác tử như vậy là tác tử chỉ phản ứng:



- Bộ điều chỉnh nhiết là một tác tử chỉ phản ứng.

action(e) là tắt nếu e - nhiệt độ đảm bảo trái lại action(e) là mở.

8.6 Nhận thức



- Hệ nhận thức

- Hàm see là khả năng của tác tử quan sát môi trường, trong đó hàm action biểu diễn quá trình ra quyết định của tác tử

- Output của hàm see là nhận thức (percept):

see : E ® Per

ánh xạ các trạng thái môi trường tới các nhận thức, bây giờ action là hàm:



action : Per* ® A

ánh xạ chuỗi nhận thức tới các hành động



8.7 Tác tử có trạng thái


- Các tác tử có một cấu trúc dữ liệu nội tại nào đó, thường được dùng đê ghi thông tin về trạng thái môi trường và lịch sử. Giả sử I là tập tất cả các trạng thái nội tại của tác tử.

- Hàm nhận thức see đới với tác tử dựa trên trạng thái là không đổi:

see : E ® Per

hàm lựa chọn hành động action được định nghĩa là một ánh xạ



action : I ® Ac

từ các trạng thái nội tại tới các hành động. Một hàm khác next ánh xạ một trạng thái nội tại và nhận thức tới một trạng thái nội tại.



next : I ´ Per ® I

8.8 Vòng lặp điều khiển tác tử

- Tác tử bặt đầu với trạng thái nội tại i0

- Quan sát trạng thái môi trường của nó e, và hình thành nhận thức see(e).

- Trạng thái nội tại của tác tử sau đó được cập nhật thông qua hàm next, trở thành next(i0, see(e))

- Hành động tác tử lựa chọn là action(next(i0, see(e)))

- Quay lại bước 2.

IX. Các nhiệm vụ của tác tử

- Ta xây dựng các tác tử để thực hiện các công việc cho chúng ta

- Các nhiệm vụ phải được đặc tả

- Nhưng ta muôn nói với các tác tử điều cần làm mà không nói cho chúng làm như thế nào.

9.1 Các hàm Utility đối với các trạng thái

- Một khả năng là: gắn utilities với các trạng thái đơn lẻ - nhiệm vụ của tác tử là đưa ra các trạng thái cực đại utility.

- Một đặc tả nhiệm vụ là một hàm



u : E ® R

gắn một số thực với mọi trạng thái môi trường

- Nhưng giá trị của một lượt chạy là gì

+ giá trị utility nhỏ nhất của trạng thái trong lượt chạy

+ giá trị utility lớn nhất của trạng thái trong lượt chạy

+ tổng giá trị utility của các trạng thái trong lượt chạy

+ trung bình

- Nhược điểm: khó để xác định đánh giá tổng thể khi gán utilities cho các trạng thái cá thể

(có thể giảm đối với các trạng thái sau đó)

9.2 Utility đối với các lượt chạy



- Có thể gán utility cho các lượt chạy (chứ không phải các trạng thái)

- Cách tiệp cận này cho phép đánh giá tổng thể


Каталог: files -> FileMonHoc
FileMonHoc -> NGÂn hàng câu hỏi lập trình cơ BẢn nhóm câu hỏI 2 ĐIỂM
FileMonHoc -> CHƯƠng 2 giới thiệu về LÝ thuyết số
FileMonHoc -> CÁc hệ MẬt khoá CÔng khai kháC
FileMonHoc -> BỘ MÔn duyệt chủ nhiệm Bộ môn
FileMonHoc -> Khoa công nghệ thông tin cộng hòa xã HỘi chủ nghĩa việt nam
FileMonHoc -> Chủ nhiệm Bộ môn Ngô Thành Long ĐỀ CƯƠng chi tiết bài giảNG
FileMonHoc -> Chủ nhiệm Bộ môn Phan Nguyên Hải ĐỀ CƯƠng chi tiết bài giảNG
FileMonHoc -> Khoa: CÔng nghệ thông tin cộng hòa xã HỘi chủ nghĩa việt nam
FileMonHoc -> MẬt mã khóA ĐỐi xứng lý thuyết cơ bản của Shannon
FileMonHoc -> Khoa công nghệ thông tin bài giảng LẬp trình cơ BẢn biên soạn

tải về 4.09 Mb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7   8   9   ...   44




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương