عاملهای هوشمند در تجارت الکترونیکی به همراه مروری بر تئوری بازیها

مدتی است که در حال نگارش کتابی با عنوان "عاملهای هوشمند در تجارت الکترونیکی به همراه مروری بر تئوری بازیها" هستم که به حمدالله به تازگی به اتمام رسیده است و در حال ویرایش نهایی بر روی آن هستم. به همین دلیل در ادامه این مطلب بخشهایی از کتاب را قرار می دهم تا دوستان با موضوعات آن آشنا شوند.

ضمنا فهرست کتاب نیز در ابتدای مطلب درج شده است.

ادامه نوشته

عاملهای هوشمند در تجارت الکترونیکی(5): سیاست های بهینه در MDPها

یک مسئله تصمیم گیری مارکوف را در نظر بگیرید، سیاست را می توان از مدل گذر، یعنی احتمالات و تابع سودمندی، محاسبه کرد؛ در واقع، از آنجا که هر یک از حالت های دنیا دارای یک مقدار متناظر سودمندی است، عامل می تواند یک عمل بهینه را محاسبه کند. یک دنیای اتفاقی، اما برای سهولت، تک عاملی با مدل گذر   را در نظر بگیرید، عامل باید عمل بهینه a*را به گونه ای انتخاب کند که این عمل سودمندی مورد انتظار آن را بیشینه کند؛
ادامه نوشته