[別館]球面倶楽部零八式markIISR

東大入試数学中心。解説なので解答としては不十分。出題年度で並ぶようにしている。大人の解法やうまい解法は極めて主観的に決めている。

2006年(平成18年)山形大学前期-数学(医学部)[x]

n 個の実数 a_1,a_2,\ldots ,a_n
 a_1\geqq a_2\geqq \cdots \geqq a_n\geqq 0\displaystyle\sum_{k=1}^n a_k=1
を満たすとき、1\leqq l\leqq n であるすべての自然数 l に対して、\dfrac{l}{n}\leqq \displaystyle\sum_{k=1}^l a_k \leqq 1 が成り立つことを示せ.

2021.01.08記
ローレンツ曲線(と同じ).

n 人のうち上位 l 人の平均点は、全体の平均点以上になる.つまり、
\dfrac{1}{l}\displaystyle\sum_{k=1}^l a_k \geqq \dfrac{1}{n}\displaystyle\sum_{k=1}^n a_k=\dfrac{1}{n}
が成立する.これから \displaystyle\sum_{k=1}^l a_k \geqq \dfrac{l}{n} が成立する,というだけの話であるが,同じように考えると、
n 人のうち下位 l 人の平均点は、全体の平均点以下になる.

これは、 b_k=a_{n+1-k} (逆順に並べかえ)とおくと、本問が

n 個の実数 b_1,b_2,\ldots ,b_n
 b_n\geqq b_{n-1}\geqq \cdots \geqq b_1\geqq 0\displaystyle\sum_{k=1}^n b_k=1
を満たすとき、1\leqq l\leqq n であるすべての自然数 l に対して、0\leqq \displaystyle\sum_{k=1}^l b_k \leqq \dfrac{l}{n} が成り立つことを示せ.

と書き換えられることからもわかるだろう.この、\Bigl(\dfrac{l}{n},\displaystyle\sum_{k=1}^l b_k\Bigr)l=1,2,\ldots,n)を描画したとき,(0,0) とこの点列を結ぶ折れ線のことをローレンツ曲線と呼ぶ.

ローレンツ曲線はy=xの下側にある下に凸な折れ線となることが知られており、本文は、(値が正であることは自明だから、)この点列が y=x の下側にあることを示す問題となっている.

https://www.stat.go.jp/koukou/howto/process/graph/graph12.html
(2021.10.07 総務省統計局のこのページはなくなったので、同じく総務省統計局のページに差し替えました)
www.stat.go.jp

ローレンツ曲線を所得にあてはめると、全員の所得が等しいとき、ローレンツ曲線はy=xと一致し、所得の分布が極端であるほど、 y=xよりも下にくる.
ローレンツ曲線とy=x で囲まれた部分の面積の、y=xの下側の面積((0,0),(1,0),(1,1)でできる三角形の面積)に占める割合をジニ係数と呼ぶ.
ジニ係数が0に近いほど公平で、1に近いほど不公平であるというような、不公平さを表す指標の1つとなっている.

なお、ジニ係数が0となるのは、全部が同じ値で、ジニ係数が最大になるのは、1つを除いて全てが0となる場合(ジニ係数1-\dfrac{1}{n})である.

(大人の解法)
A_0=0,A_l=\displaystyle\sum_{k=1}^l a_kl=1,2,\ldots,n) とおくと、
A_l は単調増加で A_l\leqq A_n=1 が成立する.

また、i自然数として、A_{i-1}+A_{i+1}-2A_i=a_{i+1}-a_{i-1} \leqq 0 だから,点列(l,A_l)l=0,1,\ldots,n)を結ぶ折れ線は上に凸となる.
よって  \dfrac{(n-l) A_0+ l A_n}{n} \leqq A_l,すなわち  A_l\geqq\dfrac{l}{n} が成立する.

最後は、式で示したが、点列は (0,A_0)=(0,0)(n,A_n)=(n,1) を結ぶ直線 y=\dfrac{1}{n}x の上側(直線含む)にあるので
A_l\geqq \dfrac{l}{n}
としても良い.

まぁ、受験数学的には次のようにやる.


 n \displaystyle\sum_{k=1}^l a_k \leqq k \sum_{k=1}^n a_k =1 より \dfrac{l}{n}\leqq \displaystyle\sum_{k=1}^l a_k を示せば良い.

ここで  S_l=\dfrac{1}{l}  \displaystyle\sum_{k=1}^l a_k とおくと,示すべき式は S_n\leqq S_l となるので,S_l が単調減少であることを示せば良い.
 l(l+1)(S_{l+1}-S_l)=\displaystyle\sum_{k=1}^l (a_{k+1}-a_k)\leqq 0 であるから題意は証明された.

もっと直接的に,添字を増やすと値が小さくなることを利用して、


 \displaystyle\sum_{k=1}^l a_k \leqq \sum_{k=1}^n a_k =1 であり,

 n \displaystyle\sum_{k=1}^l a_k = l \sum_{k=1}^l a_k + (n-l) \sum_{k=1}^l a_k
\geqq l \displaystyle\sum_{k=1}^l a_k + (n-l)\times l\times  a_{l+1}
\geqq l \displaystyle\sum_{k=1}^l a_k + l \sum_{k=l+1}^n a_k
=l \displaystyle\sum_{k=1}^n a_k = l から
 \displaystyle\sum_{k=1}^l a_k \geqq \dfrac{l}{n}
である.

としても良いだろう.a_1 から a_ll 個を n 組用意して、そのうちの n-l 組を添字を増やして a_{l+1} から a_nn-l 個を l 組作ってやると値が小さくなって、a_1 から a_nn 個が l 組できる、ということである.


n 個の実数が 1 組与えられている.そこから小さいもの順に k 個取り,その和を S(k) とする.このとき,
\dfrac{S(k)}{k} \leqq \dfrac{S(n)}{n} を証明せよ. (90 法政大)

2021.10.07記
総務省統計局の web page がリニューアルしたようなので、リンク切れを修正しました.
新しいリンク
www.stat.go.jp
にある図、ジニ係数が0に近いローレンツ曲線

f:id:spherical_harmonics:20211007135600p:plain
総務省統計局の lorenz.html より引用

は間違っています.ローレンツ曲線はy=x,つまり均等配分線より下に位置しなければならないので、ローレンツ曲線がこのような図になることはありません.おそらくデータが、うまく並び替えられていないようです.ローレンツ曲線がこのようになっておかしいと思わないのは、ちょっと困りますね.