- Cho
+ R là tập tất cả các chuỗi hữu hạn có thể (trên E và Ac)
+ RAc là tập con của R kết thúc bằng một hành động nào đó
+ RE là tập con của R kết thúc với một trạng thái môi trường nào đó.
8.2 Các hàm chuyển trạng thái
+ Một hàm chuyển trạng thái biểu diễn hành vi của môi trường
+ Chú ý mô trường: phụ thuộc lịch sử, và không xác định.
+ Nếu t(r)=Æ, thì không có trạng thái kế tiếp đối với r. Trong trường hợp này ta nói hệ thống kết thúc lượt chạy.
+ Thông thường, chúng ta nói một môi trường Env là một bộ ba Env =áE,e0,tñ, E là tập hợp các trạng thái môi trượng, e0Î E là trạng thái bắt đầu và t là hàm chuyển trạng thái.
8.3 Tác tử
- Tác tử là một hàm ánh xạ các lượt chạy tới các hành động.
Một tác tử đưa ra quyết định về hành động cần thực hiện dựa vào lịch sử của hệ thống mà nó đã chứng kiến tới thời điểm hiện tại. Giả sử AG là tập tất cả các tác tử.
Chia sẻ với bạn bè của bạn: |