马尔可夫决策-尚大教育软考学院

您现在的位置：首页 > 软考学苑 > 系统集成项目管理工程师 > 中项上午综合知识 > 中项章节知识点 >> 正文

正文

马尔可夫决策

来源：尚大教育-软考学院作者：尚大教育时间;2018-04-27 10:23:28 点击数：尚大软考交流群：376154208

马尔可夫决策(Markov decision)是一类可连续进行观察的随机动态系统的最优化决策。根据在各时刻观察到的状态，从允许的决策(控制、措施等)集合中选用一个决策，每个时刻 t 选取决策的规则，与系统在 t 以前的历史无关。马尔可夫决策过程是动态规划与马尔可夫过程结合的产物，由贝尔曼提出。它在设备的更换与维修、库存论、排队论、控制工程、可靠性理论

<尚大教育，教育至上，人才为大：sdedu.cc>

Markov 状态转移矩阵为

其中每一行和为 1。

相应的 1 次转移则为（P｛S1｝,P｛S2｝, ……,P｛S m｝）· P，2 次转移为（P｛S1｝,P｛S2｝, ……,P｛S m｝）· P·P，以此类推。

某地区有甲、乙、丙三家公司，近去的历史资料表明，这三家公司对某产品的市场占有率分别为 50%，30%，20%。不久前，丙公司制定了一项把甲、乙两公司的顾客吸引到本公司来的销售和服务措施。市场调查表明，在丙公司新的经营方针的影响下，顾客的转移概率矩阵为

（其中第一行可以理解为原甲公司的顾客中，有 70%的顾客继续在甲公司购买，有 10%的顾客转为在乙公司购买，有 20%的顾客转为在丙公司购买。其它两行可以类似理解）。则一季度后三公司的市场占有率为
(0.5 0.3 0.2)⋅ P

<尚大教育，教育至上，人才为大：sdedu.cc>


各省软考办
全国	北京	天津	河北	山西	上海	江苏	浙江	安徽	湖北
湖南	广东	广西	云南	西藏	江西	陕西	福建	吉林	辽宁
海南	山东	河南	重庆	甘肃	四川	贵州	青海	新疆	宁夏
内蒙古	黑龙江

来顶一下

返回首页

上一篇：风险型决策方法
下一篇：31.3 对策论

· 访问控制分类

· 访问控制模型

· 访问控制策略

· 35.6 访问控制技术

· 安全审计功能

· 网络安全审计的内容

· 安全审计的作用

· 35.5 信息安全审计

· 入侵检测系统与防火墙的结合

· 检测方法

距离2023年05月27-28日软考考试还有天

尚大软考交流群：376154208

软考培训

证书用途

尚大优势

培训须知

信管培训

集成培训

信监培训

信安培训

开班计划

报名交费
软考报名预计从2023年05月27-28日陆续开始

报名条件

报名入口

报名专业

如何报考

报名流程

报名费用

常见问题

报名教程

报名动态
教材、考试大纲请使用新版教材

官方教材

考试大纲

购买教材
准考证打印预计从请使用新版教材

各省打印时间

打印入口

注意事项
软考考试2023年05月27-28日

考试时间

考场规则

考试机构

历年真题

全国考试计划
成绩查分预计为2021年5月底

查分入口

历年成绩查询

证书查询
证书领证预计为2021年5月底

领取入口

历年证书查询

证书样本

软考各地考务机构

更多>>

历年真题汇总

更多>>

各省市软考报名简章

软考动态

更多>>

系统架构设计师	系统规划与管理师	系统分析师
网络规划设计师	信息系统项目管理师

网络管理员	电子商务技术员	信息系统运行管理员	程序员
网页制作员	信息处理技术员	多媒体应用制作技术员

系统集成项目管理工程师	信息技术支持工程师	计算机硬件工程师	嵌入式系统设计师	数据库系统工程师	电子商务设计师	软件评测师	软件设计师
软件过程能力评估师	信息系统管理工程师	计算机辅助设计师	多媒体应用设计师	信息安全工程师	信息系统监理师	网络工程师