注册
个人空间
帮助中心
中国工程院
知识中心首页
科教图书首页
图书
插图
文献
工具书
全部
书名
作者
主题词
标签
目录
全文
自然科学总论
自然科学理论与方法论
自然科学机构
医药卫生
医药一般理论
医药现状与发展
医学研究方法
预防医学
工业技术
一般工业技术
矿业工程
石油工程
冶金工业
金属
自然科学
数学
信息科学与系统科学
物理学
化学
天文学
数理化
数学
力学
物理学
化学
晶体学
生物科学
生物科学的理论与方法
生物科学现状与发展
交通运输
综合运输
铁路运输
交通运输经济
农业科学
农业一般性理论
农艺学
林业
农业技术现状与发展
天文地球
天文学
地球物理学
自然地理学
气象学
测绘学
地质学
环境科学安全科学
环境科学理论
环境污染及防治
安全科学
航空航天
航空
航天
航空航天医学
航空、航天技术的研究与探索
所有分类>
收起
06363733
动态规划与马尔柯夫过程
作者:(美)R.A.霍华特
中图分类:
数理化
学科分类:
理学
->
数学
->
概率论
出版日期:1963-11
主题词:
分享到:
阅 读
收 藏
这个是隐藏的空行
内容简介
本书建立了一类决策系统的分析结构,以马尔柯夫过程作为系统模型而以动态规划的迭代方法作为最优化手段,提供了实际计算的可能性。
目录
第一章 馬尔柯夫过程
7
阅读
玩具制造商例子—状态概率
8
阅读
z一变换
12
阅读
馬尔柯夫过程的z一变换分析
14
阅读
瞬时的、多鏈的和周期的性质
17
阅读
第二章 有报酬的馬尔柯夫过程
24
阅读
用递推关系求解
24
阅读
玩具制造商的例子
25
阅读
有报酬的馬尔柯夫过程的z一变换分析
28
阅读
渐近性质
30
阅读
第三章 用值迭代法求序貫决策过程的解
34
阅读
不同方式的引进
34
阅读
用值迭代法求解玩具制造商問题
36
阅读
值迭代法的估价
38
阅读
第四章 用策略迭代法求解序贯决策过程
40
阅读
定值运算
42
阅读
策略改进程序
45
阅读
迭代循环
46
阅读
玩具制造商問題
48
阅读
策略迭代法的性质的證明
50
阅读
第五章 策略迭代法的某些应用
53
阅读
出租汽車問題
53
阅读
棒球問題
60
阅读
汽車替换問題
65
阅读
第六章 多鏈过程的策略迭代法
73
阅读
定值运算
74
阅读
策略改进程序
76
阅读
一个多链的例子
78
阅读
迭代循环的性质
82
阅读
第七章 具有折扣的序贯决策过程
90
阅读
用值迭代法解有折扣的序贯决策过程
94
阅读
定值运算
96
阅读
策略改进程序
98
阅读
例子
100
阅读
迭代循环性质的證明
101
阅读
最优策略对于折扣因子的敏感性
103
阅读
具有折扣的汽車替换問題
105
阅读
总結
106
阅读
第八章 时間連續的决策过程
107
阅读
时間連續的馬尔柯夫過程
107
阅读
用拉普拉斯变换求解时間連續的馬尔柯夫過程
109
阅读
有报酬的时間連續的馬尔柯夫过程
115
阅读
时間連續的决策問題
121
阅读
定值运算
123
阅读
策略改进程序
124
阅读
完全各态历經的过程
126
阅读
工长的抉择問題
128
阅读
計算方面的比较
129
阅读
有折扣的时間連續的决策過程
131
阅读
策略改进
133
阅读
一个例子
136
阅读
与时間离散情形的比較
138
阅读
第九章 結論
140
阅读
附录瞬时和循环性态的关系
142
阅读
参考文献
147
阅读
譯者补充文獻
148
阅读
索引
149
阅读
更多...
这个是隐藏的空行
写书评
(不超过2000个字符)
这个是隐藏的空行
这个是隐藏的空行
最新评论
标签
过程
策略
时間
决策
問題
折扣
例子
性质
程序
玩具
代法
改进
制造商
运算
值迭
定值
报酬
過程
迭代
序贯
汽車
分析
證明
关系
迭代法
同类书籍推荐
精彩笔记
谁收藏过这本书?