03-2更新过程-更新过程的推广

Lingfeng2024-10-12

03-2更新过程-更新过程的推广

1. 更新回报过程

Definition (更新回报过程)

是一个更新过程,允许依赖于,要求随机向量列独立同分布,则

称为更新回报过程。

Theorem (更新回报定理)

是一个更新回报过程,其更新间隔满足,每次得到的回报满足,则


Example (火车调度问题)

设乘客到达火车站形成一个更新过程,其更新间距分布有有限期望。现设车站有个乘客到达车站时发出一列火车。每个旅客在车站等候时单位时间要付出元偿金,开出一列火车成本为元。求车站在长期运行下单位时间的平均成本。


计算一周期的成本为期望为

而一周期时间期望为
因此由更新回报定理


Example (产品保修策略)

设新产品售价为,成本为,产品寿命为,分布函数为。若在期限内损坏,则免费更换,但优惠时间不重新开始。若在期间损坏,则按时间折价更换产品,且优惠时间重新开始。若在之后损害,则需要原价购买且优惠重新开始。求长期执行此策略厂家期望利润是多少。


对于用户,需要购买的产品费用为

对于公司,需要付出成本为
因此长期平均利润为

先考虑,为时刻第一次更新,因此。根据Wald公式有

再考虑,注意到

2. 交替更新过程

Definition (交替更新过程)

设系统最初的开的,开的时间为,而后关闭在打开,随后后又关闭,交替进行,每当系统被打开称作一次更新。假设独立同分布,但允许不独立。

Theorem (交替更新定理)

的分布,的分布,的分布。即时刻系统是开的概率,设,则

证明
为第一次更新的时刻,此时

因此
由关键更新定理

Last Updated 1/26/2025, 7:48:46 AM