上面给出的链接里我没有详细讲,因为我知道要讲很多东东,可见当时很懒。哎,现在其实也懒,不过实在是闲着没事干,下面还是稍讲讲是怎么个“凹凸调整”法。
先给出一个引理(来源于 zhaobin 的半凹半凸定理,此处只是个特例)
若 $f(x)$ 在区间 $[a,b]$ 内下凸,在区间 $[b,c]$ 内上凸,变量 $x$, $y$, $z\in[a,c]$ 满足 $x\leqslant y\leqslant z$ 且 $x+y+z$ 为定值。
则:$f(x)+f(y)+f(z)$ 取最小值时必有 $x=y$ 或 $z=c$;$f(x)+f(y)+f(z)$ 取最大值时必有 $x=a$ 或 $y=z$。
注:
此处使用的凸函数定义是:设 $f(x)$ 在 $D$ 上有定义,若对任意的 $0<\lambda <1$, $a$, $b\in D$ 都有 $f\bigl(\lambda a+(1-\lambda )b\bigr)\leqslant \lambda f(x)+(1-\lambda )f(b)$,则称 $f(x)$ 在 $D$ 上为下凸函数,简称下凸,若不等号反向,则称为上凸。
在此定义下,若 $f(x)$ 二阶可导,则下凸等价于 $f''(x)\geqslant0$,上凸则反号。
接下来的证明将用到以下两个常用性质:
性质一、若 $x$, $y\in D$ 且 $f(x)$ 下凸,则 $f(x)+f(y)\geqslant 2f\bigl((x+y)/2\bigr)$;
性质二、若 $x$, $y\in D$, $x\leqslant y$ 且 $f(x)$ 上凸,设 $h>0$ 使得 $x-h$, $y+h\in D$,则 $f(x)+f(y)\geqslant f(x-h)+f(y+h)$。
性质一由定义令 $\lambda =1/2$ 立得,性质二由以下两式相加即得。
\begin{align*}
f(x)&\geqslant \frac{y-x+h}{y-x+2h}f(x-h)+\frac h{y-x+2h}f(y+h),\\
f(y)&\geqslant \frac h{y-x+2h}f(x-h)+\frac{y-x+h}{y-x+2h}f(y+h).
\end{align*}
这两个性质说明,当两个变量保持其和不变时,对于下凸函数,将两个变量拉到一起时函数值之和最小,对于上凸函数,将两个变量越往两边拉,函数值之和越小。
引理的证明
我们只证最小值的情形,最大值的类似。
(1)若 $y\leqslant b$,则固定 $z$,此时即 $x$, $y\in[a,b]$ 且 $x+y$ 为定值,故由性质一知 $f(x)+f(y)+f(z)$ 取最小值时有 $x=y$;
(2)若 $y>b$,分两小类讨论。
(2-1)若 $x\leqslant b$,则固定 $x$,此时即 $y$, $z\in[b,c]$ 且 $y+z$ 为定值,再分两小类讨论。
(2-1-1)若 $y+z\leqslant b+c$,则 $y+z-b\in[b,c]$,故由性质二有 $f(x)+f(y)+f(z)\geqslant f(x)+f(b)+f(y+z-b)$,注意到此时 $x$, $b\in[a,b]$,将 $x$ 重获ziyou,由性质一,又有 $f(x)+f(b)+f(y+z-b)\geqslant 2f\bigl((x+b)/2\bigr)+f(y+z-b)$,由此可见 $f(x)+f(y)+f(z)$ 取最小值时有 $x=y$;
(2-1-2)若 $y+z>b+c$,则 $y+z-c\in[b,c]$,故由性质二有 $f(x)+f(y)+f(z)\geqslant f(x)+f(y+z-c)+f(c)$,由此可见 $f(x)+f(y)+f(z)$ 取最小值时有 $z=c$。
(2-2)若 $x>b$,则固定 $y$,此时即 $x$, $z\in[b,c]$ 且 $x+z$ 为定值,再分两小类讨论。
(2-2-1)若 $x+z\leqslant b+c$,则 $x+z-b\in[b,c]$,故由性质二有 $f(x)+f(y)+f(z)\geqslant f(b)+f(y)+f(x+z-b)$,即转化为情形(2-1);
(2-2-2)若 $x+z>b+c$,则 $x+z-c\in[b,c]$,故由性质二有 $f(x)+f(y)+f(z)\geqslant f(x+z-c)+f(y)+f(c)$,由此可见 $f(x)+f(y)+f(z)$ 取最小值时有 $z=c$。
综上,引理得证。
将此方法推广到多元便得到半凹半凸定理。你能在脑海里动态地实现上述调整过程吗?如果实现了,那你已经理解了这个方法,并且也知道会明白多元的情形如何。
回到原题,为了方便处理,我将“锐角”的条件改为 $x$, $y$, $z\in[0,\pi/2]$,令 $\cos^2x=a$, $\cos^2y=b$, $\cos^2z=c$,则 $a$, $b$, $c\geqslant 0$ 且 $a+b+c=1$,令 $f(x)=\arccos\sqrt x$,则问题化为求 $f(a)+f(b)+f(c)$ 的取值范围。
求二阶导数易知 $f(x)$ 在 $[0,1]$ 上先下凸再上凸,即满足引理的条件。
由对称性,不妨设 $a\leqslant b\leqslant c$,先求最小值,由引理知,只要考虑 $a=b$ 与 $c=1$ 两种情况,后者显然只能得到 $f(a)+f(b)+f(c)=\pi$,而前者则化为求 $g(t)=2f(t)+f(1-2t)$ 的最小值,其中 $t\in[0,1/3]$。求导易得
\[g'(t)=\frac{3t-1}{\sqrt{t(1-t)(1-2t)}\bigl(2\sqrt{1-2t}+\sqrt{2(1-t)}\bigr)},\]
故当 $t=1/3$ 时 $g(t)$ 取最小值 $3\arccos(1/\sqrt3)$,所以 $f(a)+f(b)+f(c)$ 的最小值就是 $3\arccos(1/\sqrt3)$;
再求最大值,由引理知,只要考虑 $a=0$ 与 $b=c$ 两种情况,前者化为求 $\pi/2+f(t)+f(1-t)$ 的最大值,其中 $t\in[0,1/2]$,事实上,有恒等式 $\arccos\sqrt x+\arccos\sqrt{1-x}=\pi/2$,所以前者只能得到 $f(a)+f(b)+f(c)=\pi$,而后者仍然化为求上述 $g(t)$ 的最大值,只是此时 $t$ 的范围变成 $t\in[1/3,1/2]$,显然当 $t=1/2$ 时 $g(t)$ 取最大值 $\pi$,所以 $f(a)+f(b)+f(c)$ 的最大值就是 $\pi$。
综上,由连续性,所求的取值范围为 $[3\arccos(1/\sqrt3),\pi]$。而在原题的“锐角”情形下,取不到 $\pi$,但可以趋向它,所以原题的答案是 $[3\arccos(1/\sqrt3),\pi)$。
|