>>522 データの特徴によって一定の群に分類する統計的手法なんかいくらでもありますが?
君が知らないだけであって。
例えば、n人(i=1,2,…,n)の年収(x)と年齢(y)という2つの系列のデータがあるとして、
それぞれのデータをa_i=(x_1,y_2),a_i=(x_2,y_2),…,a_n(x_n,y_n)とする。
それぞれのデータ間(iとj)のマハラノビス汎距離d_ijは
d_ij=√(x_1-μ_x)^2/σ_x^2+(y_1-μ_y)^2/σ_y^2
(μ_x,μ_yは変数x,yそれぞれの平均、σ_x,σ_yは変数x,yそれぞれの分散)
で定義される。
これを一番距離が近いデータ同士で一つの群c_m(mは群の番号)を形成し、
(例えばC_1∈(a_1,a_2)、C_2∈(a_2,a_5)、C_3∈(a_5,a_6)など)
さらに群同士の距離でさらに大きな群を形成していく。
(例えばC_4∈(C_1,C_2))
これをずっと繰り返していくと群の数がどんどん減っていって、
最終的に2つの群にまとめることができる。
(その1つ、2つ前で繰り返しをやめれば3つ、4つといった任意の群に分類することができる。)
これが最も基本的な分類のやり方ね。
それで形成された複数の群の特徴(例えば年齢に応じた年収の違いとか)が浮かび出てくる。
この群についてそれぞれ線形判別関数を推定して、新たに得られたサンプルがいずれに
群に属するかも推計することができる。
これまともな大学の学生なら教養で知ってるレベル。
具体的な例と計算法まで教えてあげたけど、
これでもわからないなら呆れるばかり。
>>523 >全体の1%なら勝ち組としてもいいだろうけど、10%でも勝ち組としていいのか、
>半分以上の位置なら、それを勝ち組としてしまってもいいのか
ごめん、それ偏差じゃないでしょw
上から順番に上位1%とか10%とか50%とか偏差関係ないじゃんw
もう一度聞くけど、偏差で何をみてるわけ?
そもそも母集団の性質もわかってない中で、
偏差によって「何を」見ているのか全くイミフなんだけど、そこんとこの説明よろしく。
>>526 いやいやw
普通に統計的リテラシーがある人なら「説明変数」の一言で片付くけど、
「頭が悪くて理解ができないから例示しろ」って言うから
わざわざ例示してるんだけどw