方向を正しく教える

計算

だいたいの実験って、いくつかの条件を、複数の測定で測っている。
そうでないとノイズレベルがわからないから、検定ができない。
このデザインを利用させてもらう。

あらゆる条件というかグループについて平均をとる。
平均をとることでノイズは低減する。
もし正規分布ノイズなら、ざっとグループ内のサンプル数のルートで小さくなる。

それで、それら代表値をつかってU とV とを算出する。
項目の主成分はこの時点で完了。以後、これをつかう。
これが新しい軸になる。

また、このときに使用したセンターを、以後も使用する(実験条件が変わらなければ)。

サンプルの主成分は、新しく測定がでてきたら、
L = XV (ただしXはそのセンターをつかってセンタリングしたもの)
から求める。

じつは

ピンときたかたも多かろうけど、これはつまり、
重回帰分析を特異値分解でやったものである。
違うのは、トレーニングさせてること、ノイズに強いこと、
最小二乗法的でないこと、いくつ項目があっても迷わなくていいこと。
ここまで、分析者がとれる任意な選択肢がほとんどないからね。

なによりの利点は、この回帰直線、何本も引かれていて(主成分の数だけ)、
それぞれが異なる意味をもつ(独立だから)こと。
データから最大限、なにかを引き出すには、語らせるのがいちばん。
こっちが決め付けるんじゃなくて。

そんな方法。

このVは

まあ係数です。
そして項目の主成分が、私がときどき説明でつかう「地図」です。
新しいデータのサンプルの主成分を求める作業は、
そのサンプルが地図のどこにいるのかを特定することです。

係数は複数のセットがあって、それぞれ独立です。
なにか全くことなることへのスコアを算出します。

この「異なること」が何なのかが、R すなわち項目の主成分に現れます。

目次にもどる