[別館]球面倶楽部零八式markIISR

東大入試数学中心。解説なので解答としては不十分。出題年度で並ぶようにしている。大人の解法やうまい解法は極めて主観的に決めている。

1971年(昭和46年)東京大学-数学(理科)[3]

[3] 与えられた実数係数の整式 f(x) について
\displaystyle  \int_{0}^{1} f(x)\,dx=2, \quad \int_{0}^{1} xf(x)\,dx=3
となるとする.そのとき,
\displaystyle  \int_{0}^{1}  \{ f(x)-ax-b \}^2 \,dx
の値を最小にする実数 a および b の値を求めよ.

本問のテーマ
Legendre 多項式(2020.09.16)
回帰直線(2023.08.09)

2020.09.16記

Legendre 多項式

[大人の解答]
n 次のLegendre 多項式P_n(t) とする.
t=2x-1 とおき、g(t)=f(x) とすると
g(t)=\alpha_0 P_0(t) +\alpha_1 P_1(t)+\alpha_2 P_2(t)+\cdots
のように Legendre 多項式で展開でき,このとき,
\displaystyle\int_{-1}^1 g(t) dt = 4\displaystyle\int_{-1}^1 t g(t) dt = 8
および \displaystyle\int_{-1}^1 P_m(t)P_n(t) dt = \dfrac{2}{2n+1}\delta_{mn} から,
 2\alpha_0=4\dfrac{2}{3}\alpha_1=8
が成立する.よって
\displaystyle\int_{-1}^1 \{g(t)-pt-q\}^2 dt
の値を最小にする pt+q2P_0(t)+12P_1(t)=12t+2=24x-10 だから,
a=24,b=-10 である.

なお,ずらし Legendre 多項式
\tilde{P}_0(x)=1\tilde{P}_1(x)=2x-1,…
を利用すると
f(x)=\beta_0 \tilde{P}_0(x) +\beta_1 \tilde{P}_1(x)+\beta_2 \tilde{P}_2(x)+\cdots
のように展開でき,このとき,
\displaystyle\int_0^1 \tilde{P}_0(x) f(x) dx =2\displaystyle\int_0^1 \tilde{P}_1(x) f(x) dx =2\times 3-2=4
および \displaystyle\int_{0}^1 \tilde{P}_m(x)\tilde{P}_n(x) dt = \dfrac{1}{2n+1}\delta_{mn} から,
 \beta_0=2\dfrac{1}{3}\beta_1=4
が成立する.よって
\displaystyle\int_{0}^1 \{f(x)-ax-b\}^2 dt
の値を最小にする ax+b2\tilde{P}_0(t)+12\tilde{P}_1(t)=24x-10 だから,a=24,b=-10 である,となる.

2023.08.09記(2024.01.08修正)

連続2次元データの回帰直線 - 球面倶楽部 零八式 mark II

[大人の解答]
連続2次元データ (x,y)y=f(x))に対して,yx への回帰直線が y=ax+b である.

よって
a=\dfrac{\mbox{Cov}[x,y]}{V[x]}b=E[y]-aE[x]
が成立する.

E[x]=\dfrac{1}{1-0}\displaystyle\int_0^1 x dx=\dfrac{1}{2}
E[x^2]=\dfrac{1}{1-0}\displaystyle\int_0^1 x^2 dx=\dfrac{1}{3}
V[x]=E[x^2]-(E[x])^2=\dfrac{1}{12}
であり,
E[y]=\dfrac{1}{1-0}\displaystyle\int_0^1 f(x) dx=2
E[xy]=\dfrac{1}{1-0}\displaystyle\int_0^1 xf(x) dx=3
\mbox{Cov}[x,y]=E[xy]-E[x]E[y]=3-\dfrac{1}{2}\cdot 2=2
であるから,求める回帰直線は
y=\dfrac{\mbox{Cov}[x,y]}{V[x]}(x-E[x])+E[y]=\dfrac{2}{1/12}\left(x-\dfrac{1}{2}\right)+2=24x-10
となり,a=24,b=-10 である.