[2] 変量 が変量 に正比例することは理論的にわかっているが,比例定数 の値がわからない.そこで, ,, のときの の値を測ったところ,それぞれ ,, という測定値を得た. の値をかりに定めたとき ,,
をそれぞれ , , に対応する の測定の誤差とみなす.このとき,
をそれぞれ , , に対応する の測定の誤差とみなす.このとき,
(i) 誤差の二乗の和が最小となるように の値を定めよ.
(ii) 誤差の絶対値の和が最小となるように の値を定めよ.
ただし,小数第三位を四捨五入して小数第二位まで求めよ.
本問のテーマ
最小二乗基準による代表値の定義
最小絶対偏差基準による代表値の定義
最小二乗基準による原点を通る回帰直線
最小絶対偏差基準による原点を通る回帰直線
最小絶対偏差基準による代表値の定義
最小二乗基準による原点を通る回帰直線
最小絶対偏差基準による原点を通る回帰直線
2019.04.03記
誤差の二乗和を最小とするのは平均値、誤差の絶対値和を最小とするのは中央値、という統計の初歩の問題なのだが、高校生に統計を必修化させる割りに、代表値をこの観点から教えていないのが問題。
[解答]
(i) を最小にするは、がそれぞれ個あるときの平均値であるから、により、
(i) を最小にするは、がそれぞれ個あるときの平均値であるから、により、
(ii) を最小にするは、がそれぞれ個あるときの中央値であるから、により、
2020.04.01記
(うっかり二重に書いていた.1年後に解説を書くと考え方は同じだけど文章がちょっと違う)
[解答]
(i) 誤差の二乗の和は となるので、 が4個, が9個, が16個の合計29個のデータの平均値を考えれば良く,それは
(i) 誤差の二乗の和は となるので、 が4個, が9個, が16個の合計29個のデータの平均値を考えれば良く,それは
(ii) 誤差の絶対値の和 となるので、 が2個, が3個, が4個の合計9個のデータの平均値を考えれば良く,それは である。
2022.05.03記
本問を比重の問題として,原点を通る回帰直線としても良い.
に対して, とする.
[別解]
(i)の最小二乗基準における原点を通る直線のあてはめは
の最小化なので, となり,本問の場合,
となる.
(i)の最小二乗基準における原点を通る直線のあてはめは
の最小化なので, となり,本問の場合,
となる.
(ii)の最小絶対偏差基準おける原点を通る直線のはてはめは
2008年(平成20年)東京大学後期-総合科目II[1]A - [別館]球面倶楽部零八式markIISR
と同様に考えると,必ず原点という仮想データを通るので,もう1つのデータ点を通ることがわかる.
そしてその最小値は,傾きの中央値となることが幾何的にわかる.
傾きは,, となるので,その中央値は から である.