フルテキストファイル
タイトルヨミ
イデン アルゴリズム ニヨル セイヤク ツキ マルコフ ケッテイ カテイ ノ カイホウ
タイトル別表記
A Solving Method of a MDP with Constraint by Genetic Algorithm
著者
平山 克己 社会開発工学専攻
河合 一 社会開発システム学科 KAKEN
抄録
We consider discrete time Markov decision process (MDP) with finite state space, finite action space and two kinds of immediate reward The problem is to maximize time average reward generated by on reward stream, subject to that the other reward is not smaller than a prescribed value. The probelm is analyzed in the range of pure stationary policies MDP with one optimality criterion and no constraint can be solved by usual policy improvement method. MDP with one reward constraint can be solved by linear programming, in the range of mixed policies. On the other hand, however, when we restrict the policies to pure polices the problem is some conbinatrial problem,
for which any solving method has not been discovered. In this paper, we propose an approach applying Genetic Algorithm in order to carry on a search process effectively
and to obtain a near optimal pure stationary policy. A numerical example is given to examine the effeciency of the approach proposed here.
出版者
鳥取大学工学部
資料タイプ
紀要論文
ISSN
0385-8596
書誌ID
AN00174610
掲載誌名
鳥取大学工学部研究報告
最新掲載誌名
鳥取大学工学部研究報告
26
1
開始ページ
295
終了ページ
302
発行日
1995-11
著者版フラグ
出版社版
著作権表記
注があるものを除き、この著作物は日本国著作権法により保護されています。 / This work is protected under Japanese Copyright Law unless otherwise noted.
掲載情報
鳥取大学工学部研究報告. 1995, 26(1), 295-302
部局名
工学部・工学研究科
言語
日本語