3.1 Mô hình
- Chúng ta cần một mô hình của môi trường trong đó các tác tử sẽ hoạt động…
+ Các tác tử đồng thời chọn hành động để thực hiện và kết quả của các hành động chúng chọn là một kết quả trong xảy ra.
+ Kết quả thực sự phục thuộc vào sự kết hợp của các hành động
+ giả sử mỗi tác tử chỉ có hai hành động có thể nó có thể thực hiện, C (“hợp tác”) và D (“đào ngũ”)
+ Hành vi của môi trường được xác định bởi hàm chuyển đổi trạng thái
- Đây là một hàm chuyển đổi trạng thái
(Môi trường này nhạy cảm với các hành động của cả hai tác tử)
Chia sẻ với bạn bè của bạn: |