我们早先已经在《报童问题》一文中介绍了这个经典的商品采购模型。文中的推导略有些繁复。为了便于理解,本文将给出一个相对简单的解法。
问题
我们还是沿用前文的记号。问题定义如下:
每天早上,报童以批发价 c 元/份采购当天的报纸,然后以零售价 p 元/份售卖。如果当天报纸没有卖完,则以 s 元/份的价格卖给废品回收站。不失一般性,假设 p>c>s。用随机变量 D 表示当天的需求量,并已知其概率分布。求使得期望收益最大的采购量 x。
求解
收益为总销售额减去总成本:
π(x,D)=p⋅min(x,D)+s⋅max(x−D,0)−c⋅x=p⋅min(x,D)+s⋅[max(x,D)−D]−c⋅x=p⋅min(x,D)+s⋅[x+D−min(x,D)−D]−c⋅x=(p−s)⋅min(x,D)−(c−s)⋅x
这里利用了 max(x,D)+min(x,D)=x+D。
收益的期望为
E[π(x,D)]=(p−s)⋅E[min(x,D)]−(c−s)⋅x=(p−s)⋅∫0+∞min(x,d)f(d)dd−(c−s)⋅x
其中 f(d) 为随机变量 D 的概率密度函数。
为使期望收益最大,我们令
∂x∂E[π(x,D)]=0=(p−s)⋅∂x∂(∫0+∞min(x,d)f(d)dd)−(c−s)=(p−s)⋅∂x∂(∫0xd⋅f(d)dd+∫x+∞x⋅f(d)dd)−(c−s)=(p−s)⋅[∫0x∂x∂(d⋅f(d))dd+∫x+∞∂x∂(x⋅f(d))dd]−(c−s)=(p−s)⋅∫x+∞f(d)dd−(c−s)=(p−s)⋅[1−F(x)]−(c−s)
其中 F(d) 为随机变量 D 的累积分布函数。解上式得
F(x)=p−sp−c≡γ
γ 即为前文解得的临界分位数(Critical Fractile)。使得期望收益最大的采购量为
x∗=F−1(γ)