Chủ nhiệm Bộ môn Phan Nguyên Hải ĐỀ CƯƠng chi tiết bài giảNG



tải về 4.09 Mb.
trang19/44
Chuyển đổi dữ liệu26.11.2017
Kích4.09 Mb.
#34644
1   ...   15   16   17   18   19   20   21   22   ...   44

- Các luật điều chỉnh stack

Nếu ở trên cùng của stack mục tiêu

Thì thực hiện

Mục tiêu đơn hoặc phức hợp khớp mô tả trạng thái hiện thời

Loại bỏ nó

Mục tiêu phức hợp không khớp mô tả trạng thái hiện thời

1. Giữ mục tiêu phức hợp gốc trong stack

2. Liệt kê các mục tiêu phức hợp trong stack theo một thứ tự mới nào đó



Mục tiêu đơn bằng chữ không khớp mô tả trạng thái hiện thời

Tìm luật mà danh sách thêm được tạo ra bao gồm mục tiêu này và

1. Thay thế mục tiêu với luật được tạo ra

2. Đặt biểu thức điều kiện tiên quyết được tạo ra của luật lên trên cùng stack


Luật

1. Loại bỏ luật khỏi stack

2. Cập nhật cơ sở dữ liệu dùng luật

3. Theo dõi luật


Không gì

Dừng

III. Cài đặt các tác tử lập luận thực tế



- Ví dụ đầu tiên về cài đặt một tác tử lập luận thực tế:

Frame1
- Chúng ta sẽ không quan tâm đến giai đoạn (2) hoặc (3)

- Vấn đề: các quá trình cân nhắc và lập luận các phương tiện-kết quả không xảy ra tức thời. Chúng cần thời gian.

- Giả sử tác tử bắt đầu cân nhắc tại thời điểm t0, bắt đầu lập luận phương tiện-kết quả tại t1, và bắt đầu thực hiện kế hoạch tại t2. Thời gian để cân nhắc là

tdeliberate = t1 – t0

- và thời gian để lập luận phương tiện-kết quả là:



tme = t2 – t1

- Hơn nữa giả sử việc cân nhắc là tối ưu theo nghĩa nếu nó chọn một ý định nào đó để đạt được, thì đây là điều tốt nhất đối với tác tử. (Cực đại utility kỳ vọng)

- Bởi vậy tại thời điểm t1, tá tử đã chọn một ý định để đạt được điều sẽ là tối ưu nếu nó đã đạt được tại thời điểm t0.

Nhưng trừ khi tdeliberate nhỏ đến mức có thể triệt tiêu, thì tác tử duy trì rủi ro ý định được chọn không còn tối ưu theo thời gian mà tác tử đã xác định.

- Đây là sự hợp lý về tính toán

- Cân nhặc chỉ là một nửa của vấn đề: tác tử vẫn phải xác định làm thế nào để đạt được ý định.

- Tác tử sẽ có hành vi tối ưu tổng thể trong những hoàn cảnh sau:

+ Khi việc cân nhắc và lập luận phương tiện-kết quả mất rất ít thời gian hoặc

+ Khi thế giới được đảm bảo không thay đổi trong khi tác tử đang cân nhắc và thực hiện các lập luận phương tiện-kết quả, để các giải thiết về lựa chọn ý định để đạt được và kế hoạch để đạt được ý định vẫn có giá trị tới khi tác tử hoàn thành việc cân nhặc và lập luận; hoặc

+ Khi một ý định tối ưu đạt được tại thời điểm t0 (thời điểm thế giới được quan sát) được đảm bảo vẫn tối ưu tới thời điểm t2 (thời điểm tác tử tìm ra kế hoạc hành động để đạt được ý định)

- Thuật toán với các công thức


Vòng điều khiển tác tử Phiên bản 2


  1. B:=B0;/*các niềm tin ban đầu*/

  2. While true do

  3. lấy nhận thức tiếp theo 

  4. B:=brf(B, );

  5. I:= deliberate(B)

  6. :=plan(B,I)

  7. execute()

  8. end while

IV. Cân nhắc

- Một tác tử cân nhắc như thế nào

+ bắt đầu bằng việc hiểu các lựa chọn sẵn có đối với bạn là gì.

+ chọn, và cam kết (theo đuổi một số) lựa chọn

- Các lựa chọn được chọn sau đó là các ý định

- Chức năng cân nhắc có thể phân ra thành hai thành phần chức năng riêng biệt:

+ hình thành các lựa chọn: tác tử hình thành một tập các lựa chọn có thể; biểu diễn việc tạo ra các lựa chọn thông qua một hàm options lấy các niềm tin hiện thời và các ý định hiện thời của tác tử làm đối số, và từ đó xác định một tập các lựa chọn (=các mong muốn)



+ Lọc: tác tử chọn trong các lựa chọn cạnh tranh, và cam kết đạt được chúng. Để chọn giữa các lựa chọn cạnh tranh, một tác tử dùng một hàm filter

Frame3
V. Các chiến lược theo đuổi (cam kết thực hiện)

“Tại thời điểm nào đó không xa trong tương lai, bạn có khó khăn với robot gia đình mới của bạn. Bạn nói “Whillie, mang cho tôi một cốc bia”. Robot trả lời “Vâng thưa ông”. Hai mươi phút sau, bạn thét lên “Willie, tại sao anh không mang bia cho tôi”. Nó trả lời “Ồ, tôi đã có ý đinh lấy cho ông bia, nhưng tôi đã quyết định làm một việc khác”. Bạn trả lại anh chàng thông minh này lại cho nhà sản xuất, kêu ca về việc thiết cam kết. Sau khi trang bị thêm, Willie trở lại, được đánh dấu “Mô hình C: Trợ lý theo đuổi cam kết”. Bạn lại hỏi Willie mang bia cho mình. Nó đồng ý và trả lời “Được”. Sau đó ban hỏi “anh đã mua loại bia gì?” Nó trả lời “Genessee”. Bạn nó “Không vấn đề gì”. Một phút sau, Willie đẩy với một Genessee trong một cái kẹp. Lần này bạn giận dữ trả lại Willie vì quá tận tụy. Sau khi sửa thêm, nhà sản xuất gửi Willie lại, hứa không có thêm vấn đề về sự tận tâm của robot. Bởi vậy phần nào tin tưởng khách hàng, bạn chấp nhận anh bạn trở lại nhà mình, nhưng khi thử, bản hỏi nó mang cho bạn cốc bia trước. Willie nói “Vâng, thưa ông” (Vấn đề thái độ của nó có vẻ như đã xác định). Robot lây bia và đi về phía bạn. Khi nó tiếp cận, nó nâng cánh tay, xoay xung quanh, một cách có cân nhắc nó đập tan cái chai, và không đẩy nữa. Trở lại nhà máy, khi được dịch vụ khách hàng chất vấn vì sao nó từ bỏ các cam kết của mình, robot trả lời theo những đặc tả của nó, nó giữ các cam kết miễn là được yêu cầu – các cam kết phải được hủy bỏ khi được hoàn thành hoặc không thể đạt được. Việc đập tan chiếc cốc thể hiện cam kết không thể đạt được”.

- Những cam kết sau thường được thảo luận trong tài liệu về các tác tử có lý trí.

+ Cam kết mù: một tác tử cam kết mù sẽ tiếp tục duy trì ý định tới khi nó tin rằng ý định đã thực sự đạt được. Cam kết mù đôi khi cũng được coi là các cam kết “cuồng tín”.

+ Cam kết chỉ có một mục đích: tác tử chỉ có một mục đích sẽ tiếp tục duy trì ý định tới khi nó tin rằng hoặc ý định đã đạt được hoăc nó không còn thể đạt được ý định nữa.

+ Câm kết rộng rãi: một tác tử rộng rãi sẽ duy trì ý định miễn là nó vẫn được tiên là có thể.

- Một tác tử có cam kết đối với cả các kết quả và các phương tiện.

- Hiện tại, vòng lặp điều khiển tác tử là quá tận tâm, cả phương tiện và kết quả.



Sửa: replan nêu một kế hoạch không thực hiện được.

Каталог: files -> FileMonHoc
FileMonHoc -> NGÂn hàng câu hỏi lập trình cơ BẢn nhóm câu hỏI 2 ĐIỂM
FileMonHoc -> CHƯƠng 2 giới thiệu về LÝ thuyết số
FileMonHoc -> CÁc hệ MẬt khoá CÔng khai kháC
FileMonHoc -> BỘ MÔn duyệt chủ nhiệm Bộ môn
FileMonHoc -> Khoa công nghệ thông tin cộng hòa xã HỘi chủ nghĩa việt nam
FileMonHoc -> Chủ nhiệm Bộ môn Ngô Thành Long ĐỀ CƯƠng chi tiết bài giảNG
FileMonHoc -> Chủ nhiệm Bộ môn Phan Nguyên Hải ĐỀ CƯƠng chi tiết bài giảNG
FileMonHoc -> Khoa: CÔng nghệ thông tin cộng hòa xã HỘi chủ nghĩa việt nam
FileMonHoc -> MẬt mã khóA ĐỐi xứng lý thuyết cơ bản của Shannon
FileMonHoc -> Khoa công nghệ thông tin bài giảng LẬp trình cơ BẢn biên soạn

tải về 4.09 Mb.

Chia sẻ với bạn bè của bạn:
1   ...   15   16   17   18   19   20   21   22   ...   44




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương