این مقاله در قالب ورد ارائه می شود و قابل ویرایش می باشد چکیده بازی های غیر قطعی(تصادفی) به عنوان توسعه ای از فرآیندهای تصادفی مارکوف با چندین عامل در سیستمهای چند عامله و مدل سازی آنها حائز اهمیت بوده و به عنوان چارچوبی مناسب در تحقیقات یادگیریتقویتی چندعامله بهکاررفتهاند. در حال حاضراتوماتاهاییادگیر به عنوان ابزاری ارزشمند در طراحی الگوریتمهای یادگیری چند عامله به کار رفته اند. در این مقاله مدلی مبتنی براتوماتای یادگیر و مفهوم آنتروپی برای حل ...