| 单词 | 动态规划 |
| 释义 | §7 动 态 规 划 [最优化原则] 一个过程的最优策略具有以下性质,即无论其初始状态和初始决策如何,其今后各决策对以第一个决策所形成的状态作为初始状态的过程而言,必须构成最优策略。 [多阶段决策过程] 命
使总效率
为最大。
决定 最优化原则描述了最优控制策略的基本性质,它是建立在不变嵌入原则的基本概念上的。这个概念表示解一个特殊的最优决策问题时,可以把原来的问题嵌入一类较容易解的类似问题之中。对多阶段决策过程就可以将原来的多阶段最优化问题以解一单个阶段决策序列的问题来代替,这无疑是比较容易处理的。 根据最优化原则,
上式右端的第一项是初始效益,而第二项则代表最后
这个方程对
显然,应用基本原则,那末 [离散动态系统的最优控制] 设有一离散动态系统,其状态差分方程为
初始条件为
其中
问题是要决定一个控制序列 这是一个N阶段决策过程(图18。14),目标函数的最小值必为初始状态 度N的函数,如果把它记作
根据最优化原则可将上式写成
式中
这是一个函数方程,可以递推求解,每次都是求一个 (1) (1) 令 (2) (2) 对任一个
式中
(3) (3) 对任一个
式中 求出使上式右端取最小值的
(4) (4) 一般地,如果已经算出 由
式中
(5) (5) 重复步骤(4),由 [分配问题] 设有一定数量的某种资源 问题的数学模型是 求
且使
取最大值。 这是一个规划问题,当 对问题进行动态处理。令
当函数
其中 由上面的递推关系式,先求出 这种做法可以看作是将一个连续模型用离散模型代替。 [连续型的动态规划方法] 以下考虑连续动态系统的最优控制。 设有一由矢量微分方程
描述的
目标函数为
其中 这里的问题是:寻求控制量 命 其中
当
从此得出下列两个微分方程
由此可以决定最优控制矢量 例 考虑由
描述的一阶控制过程,其中
约束,决定使目标函数
为极小的最优控制信号 解 命 那末函数方程为
如果 即最优控制
所以
这可用数值方程求解。 说明 动态规划的函数方程方法提供了一个获得最优化问题的解的计算方法,它不依赖于偏微分方程的解,因此克服了两点边值问题的困难,但对高维多阶段决策过程,计算中需要很大的存贮量,因此在各种情况下,还需要利用各种不同的最优化技巧(如§1~§4的直接方法和数值方法)以及各种不同的计算方法(如降维法),甚至有时需要用观察或猜测来得到函数方程的解。 |
| 随便看 |
数学辞典收录了524条数学词条,基本涵盖了常用数学知识及数学英语单词词组的翻译及用法,是数学学习的有利工具。