日記
バックナンバー

[先月] [目次] [来月] [最新版] [表トップ] [裏トップ] [digest]

2003年5月1日(木) 手抜き統計
マイシスター検索システムのスコアを、絶対表示から偏差値表示にしました(旧表示も残してありますが)。それについてありそうな質問とその答えをあげておきます。

Q1. 偏差値とは何ですか。
A1. ある統計情報が正規分布を取ると仮定し、それを平均50、標準偏差10の正規分布に変換したものです。偏差値により、その値が上位何%に入るかがわかります。


15102030405060708090
偏差値73.366.562.958.555.352.65047.544.841.637.2


Q2. 偏差値はどうやって計算しているのですか。
A2. 偏差値=(素点−平均)/標準偏差×10+50です。

Q3. 平均、標準偏差はどうやって計算しているのですか。
A3. 現時点では、1980年の任意の日に生まれた2人について計算しています。実際には、まず1980/1/1生まれの人に対して1980/1/1〜12/31に生まれた人それぞれについて値を計算します。次に1/2, 1/3…と進めて行くことで、1980年生まれ同士についてのすべての可能性について計算することができます。これらの値について平均と標準偏差を求め、その値を仮に全体の平均、標準偏差として利用しています。それぞれの値は以下の通り。

おにいちゃん度らぶらぶ度およめさん度
平均±標準偏差65.8±13.066.6±10.366.4±11.5


Q4. それは全体の代表値として利用するのに適切ですか。
A4. 証明はできていません。現在、データベースにあるほとんどのデータをカバーする範囲である1960年〜2020年について同様の計算を行っておりますが、途中経過を見る限りこの値がそれほど大きく誤っているという感じはありません。計算が完了したらより正確な値に変更する予定です。

Q5. 生まれた日によってほとんど誰とでも相性が良かったり、逆にいつも相性が悪かったりすることはありませんか?
A5. まったくないとはいえません。計算方法からして、自分の内惑星、特に太陽や月と、土星や木星が良いアスペクトをなせば比較的良い値になり、悪いアスペクトであれば比較的悪くなると予想できます。実際に、1980年の各日に生まれた人について、1980年の任意の日に生まれた人との相性を計算し、その平均と標準偏差を計算したところ(データは省略)、この年でもっとも相性の平均値が高いのは1980/6/22、低いのは4/19でした。しかし、この2つの日の間に統計的な有意差は認められませんでした。ただし、より広いスパンを見れば、有意に平均値が高い(ないしは低い)日があるかもしれません。また、データベース自体に偏りがあることにより、たまたま平均値が高くなったり低くなったりする日が存在する可能性もあります。


おにいちゃん度らぶらぶ度およめさん度
1980/6/2268.4±11.267.7±9.567.8±10.2
1980/4/1965.0±14.666.1±11.265.8±12.7

2003年5月6日(火) 脳内オフ
脳内オフで左手にケガをおってしまい、詳細をかけません。ごめんなさい。
2003年5月28日(水) spam
ここのところディスククラッシュの連続にみまわれ、日記をさぼってましたが久々に復活。

今月のある一週間調査してみたところ、一日平均にして約130通のspamを受信していました。ここのところいくつかMLを脱退したりして受信するメールの総量をへらしている(一日平均555通)影響もあり、全受信メールにしめる割合は約23%と相当なものになりつつあります。

#この程度の量でも楽に扱えるメーラって少ないように思いますが、いかがでしょう? 私はMewを愛用していますが, この度そのあたりとも関連して、今さらですがver 4にしてみました(方法)。すごく快適です。

一月ごろは50〜60通くらいだったので、最近、spamが増えて来てるようです。今はやりの債権回収系もありますが、ほとんどは英語のポルノ系のような。

まあ, いずれにしても困ったものです。

[先月] [目次] [来月] [最新版] [表トップ] [裏トップ] [digest]

mimori@puni.net

Akiary v.0.42+puni.net patch 0.3