薬学、製薬業界、薬剤師、薬学部、薬系就職にまつわる最新ニュースをまとめてお届け。興味ある薬学関連ニュースをUP!!

[ --/--/-- --:-- ]
スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


にほんブログ村 病気ブログ 薬・薬剤師へ 薬剤師ブログタイムズ ブログランキング参加中! クリックしてこの記事に投票

面白いニュースだと思ったらクリックお願い致します。

クリック数に応じて更新頻度が上がります!

スポンサー広告 | TB(-) | CM(-)

[ 2012/04/21 12:01 ]
統計学なんでもスレッド14

学生の時に一番嫌いだった科目が、今仕事で一番必要とされている現実をどう受け止めようか、、、、

スレッド中にでてくるハンバーガー統計学は私も読んだことがあります。

でも統計ってつかみ辛いんですよね。

何となくはわかるんだけど、確実にあっているという自信がない。

つい、専門部署に問い合わせて確認をしてもらっている毎日です。

自己学習に努めないといけませんね。学生さんが見ていたら統計をしっかり勉強してくれと言いたい。

1 132人目の素数さん 投稿日:2012/01/14(土) 01:26:04.68

スレのお約束を守った上で統計学について何でもどうぞ。

●学校の宿題の丸投げはやめましょう。
●質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
●荒らしは基本的にスルーでお願いします。

前スレ
統計学なんでもスレッド13
http://uni.2ch.net/test/read.cgi/math/1297356696/





参照:http://uni.2ch.net/test/read.cgi/math/1326471964/l50




にほんブログ村 病気ブログ 薬・薬剤師へ 薬剤師ブログタイムズ ブログランキング参加中! クリックしてこの記事に投票

面白いニュースだと思ったらクリックお願い致します。

クリック数に応じて更新頻度が上がります!



2 132人目の素数さん 投稿日:2012/01/14(土) 01:26:29.32

●過去スレ
統計学なんでもスレッド12
http://kamome.2ch.net/test/read.cgi/math/1283521346/
統計学なんでもスレッド11
http://kamome.2ch.net/test/read.cgi/math/1258355122/
統計学なんでもスレッド10
http://science6.2ch.net/test/read.cgi/math/1245043541/
統計学なんでもスレッド9
http://science6.2ch.net/test/read.cgi/math/1226981666/
統計学なんでもスレッド8
http://science6.2ch.net/test/read.cgi/math/1211786770/
統計学なんでもスレッド7
http://science6.2ch.net/test/read.cgi/math/1193183539/
統計学なんでもスレッド6
http://science6.2ch.net/test/read.cgi/math/1169836298/
統計学なんでもスレッド5
http://science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
http://science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
http://science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
http://science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
http://science.2ch.net/test/read.cgi/math/1012782106/




3 132人目の素数さん 投稿日:2012/01/14(土) 01:26:52.84

●関連スレ1 ソフトウェア
【R言語】統計解析フリーソフトR 第4章【GNU R】
http://kamome.2ch.net/test/read.cgi/math/1294561909/
統計ソフトSTATAの部屋 Ver.2
http://kamome.2ch.net/test/read.cgi/math/1284083650/
統計・解析ソフトについて
http://hibari.2ch.net/test/read.cgi/bsoft/1012298063/
【統計分析】機械学習・データマイニング【集合知】
http://toro.2ch.net/test/read.cgi/tech/1286200810/

●関連スレ2 試験
【会計士】★統計学part2★【選択科目】
http://kohada.2ch.net/test/read.cgi/exam/1260227046/
【通信】  統計士・データ解析士  【高杉】
http://ikura.2ch.net/test/read.cgi/lic/1288016000/
統計・プログラミング選択あつまれー
http://kohada.2ch.net/test/read.cgi/kouri/1323147411/
センター数学2Bで統計選択のやつ集まれ~ 2011
http://kohada.2ch.net/test/read.cgi/kouri/1318831930/

●関連スレ3 その他
統計学は低脳のやる学問?
http://uni.2ch.net/test/read.cgi/math/1310989332/
心理統計学スレ
http://awabi.2ch.net/test/read.cgi/psycho/1324507670/
偏った標本調査・世論調査・統計を吊し上げるスレ
http://ikura.2ch.net/test/read.cgi/sim/1322885523/
【泰野くん】(独)統計センター2【藤田】
http://uni.2ch.net/test/read.cgi/koumu/1284048045/
【さよなら】(独)統計センター3【ラスプーチン】
http://uni.2ch.net/test/read.cgi/koumu/1285335261/




5 132人目の素数さん 投稿日:2012/01/22(日) 19:46:19.81

歳 数 プロット
20 1 *
22 1 *
25 2 **
28 1 *

平均 24 歳ですが、
メディアンは 25 歳であってますか?




6 132人目の素数さん 投稿日:2012/01/22(日) 23:20:00.60

メディアンの定義は?
定義が分かっているなら合っているか合っていないか自明だと思うけど。




7  投稿日:2012/01/23(月) 00:12:43.11

ここでズバーン!とやると右も左も50%になるラインだと思ってます



8 132人目の素数さん 投稿日:2012/01/23(月) 00:25:59.95

20歳をもう一匹捕まえて
「うちの店は若い子多いよ、20歳メインだよ」

20歳をもう二匹捕まえれば
「うちの店は若い子多いよ、20歳のピチピチばっか!」

それが統計w




9 132人目の素数さん 投稿日:2012/01/23(月) 13:45:50.94

メディアンは24.75歳ですか?

ここでわけると右も左も2.5人になる気がします

24.5からさらに1/4右にいけば
**を1:3にわけて公平になると思うのです




10 132人目の素数さん 投稿日:2012/01/23(月) 14:22:58.94

>>9
メディアンは25歳です。
Wikipediaがあなたの質問にずばりと答えています。

中央値
http://ja.wikipedia.org/wiki/%E4%B8%AD%E5%A4%AE%E5%80%A4
>中央値(ちゅうおうち、英: median)は、代表値の一つで、
>有限個のデータを小さい順に並べたとき中央に位置する値。
>たとえば5人の人がいるとき、その5人の年齢の中央値は3番目に年寄りな人の年齢である。
>ただし、データが偶数個の場合は、中央に近い2つの値の算術平均をとる。
>中央値の事を、メディアン、メジアン、中間値とも呼ぶ。




11 132人目の素数さん 投稿日:2012/01/23(月) 15:50:14.24

ああ、真ん中の順位の人が所属する所の値を答えればいいのですね
偶数人なら真ん中の人はいないので間をとると



では離散的でなく、例えば24歳6ヶ月を24.5歳、11歳9ヶ月を11.75歳などとして
階級幅1.0歳の度数分布として扱うことを考えた場合はどうでしょう?

例えば区間[24.5, 25.5)歳の人は25歳として分類されるとします
(24歳6ヶ月の人を25歳に分類するのは明らかに違和感がありますが)

度数分布では順位の情報が消失してしまっているので
幅1.0を25歳に属する人数で割って …※
最も若い階級から24歳までの累積人数から
50%に到達する為の不足人数を算出し
その人数を※に掛けた値を
24.5に足した値がメディアンになるのでしょうか?


12 132人目の素数さん 投稿日:2012/01/23(月) 18:54:29.48

>>11
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/fig.png
階級内で均等分布しているなら図の▲のように
階級内の平均値が階級値になるように分布しているはずですが、
その計算方法だと図の●のように小さい方にずれます。
詳しくは下記ページをどうぞ。

中央値(Me)
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/median.html






13 132人目の素数さん 投稿日:2012/01/24(火) 20:28:12.48

医療統計やってるんですが、お願いします。

下記の回帰分析の結果から、総コレステロール(TC)とトリグリセリド(TG)のどちらが
糖尿病の重症度に影響を与えているか考察しなさい。

説明変数x1(TC):mx1=251
説明変数x2(TG):mx2=209
重相関係数:R=0.902
重寄与率:R2=0.814(81.4%)
標準偏回帰係数:b1=1.239 b2=0.549




19 名無しさん 投稿日:2012/01/31(火) 12:14:11.81 ID:sp1ZpjC8

正規分布の式に、π円周率が入ってるのは何?
円周率が正規分布に関係している理由を教えて下さい。




21 猫の定義 ◆MuKUnGPXAY  投稿日:2012/01/31(火) 12:23:33.54 ID:???

>>19
そういう疑問は学生の時に私も持ちましたね、何故理論物理の各公式に
はπ円周率が入ってるのかってね。そんでその話を某大物理学者の先生
に直接にお伺いしたら:
★★★『そういう疑問を持つ事は非常に大切なことです。
      でも囚われてしまったら論文が書けなくなります。
         研究というのはそんなに甘いものではアリマセン。』★★★
という返答をなさいました。

ちょっと印象に残ったお話でしたね。






26 名無しさん 投稿日:2012/01/31(火) 15:30:35.73 ID:???

>>19
ひょっとして正規分布の分布関数すら知らずに質問してない?




28 名無しさん 投稿日:2012/02/01(水) 01:39:54.09 ID:hZeM7um0

>>26
釣りかなぁ?
正規分布が確率変数分布であることしか知らないが。
それで、πとどういう関係か疑問に思うのは別におかしいとはおもわんがね。




29 名無しさん 投稿日:2012/02/01(水) 01:55:40.49 ID:???

>>28
>>20で早々に理由が書いてあるだろ
正規分布の分布関数がどんな形をしてるか、wikiで確かめてみろ




44 132人目の素数さん 投稿日:2012/02/02(木) 08:41:08.52

しゃーないやっちゃな。これ以上荒れても困るので解説。

・流れ
質問:>>19
回答:>>20
質問者は>>20が回答であることを理解できず迷走

・解説
正規分布の確率密度関数をφ(x)とすると確率密度関数の性質から
∫φ(x) dx = 1 が必要。
質問者はφ(x)がどんな形かは知っているようなのでそれと>>20
見比べてよく考えてください。(μ=0, σ=1で考えれば十分)
なお、>>20の積分をどうやって求めるかは別の話。
そちらが知りたい場合は別途調べてください。




71 132人目の素数さん 投稿日:2012/02/03(金) 11:02:46.16

>>44さん
ありがとう。この先は自分で調べます。こんなに荒れてたとゎ…




77 132人目の素数さん 投稿日:2012/02/04(土) 10:59:14.48

>>71で質問者登場で解決でしょ。後はあらし認定します(オレが)。

どっちにしろ、数学以外の学問の派生として統計学を学んだ人(オレもなんだけど)
にとっては、正規分布の式の内容までは教われないからね。
もちろん式の意味、なぜ釣鐘の形になるか(中心極限定理)とかは教わるけど。
オレもいい勉強になったでし。

ただオレ思うに、車に運転するドライバーが注意すべきことは、エンジンの構造を
知る事よりも、安全に運転すること道路法規を守ることだと思うわけ。
もちろん、車の構造やエンジンの構造を知る事でちょっとしたトラブルを切り抜ける
ことはできるかもしらないけど。
統計技法を車の運転に例えるのは強引だけど。
「正しく標本を取って、そしてデータの意味する事を吟味する。」それが大切で、
あとは先人たちの知識を使って、徹底的にデータを解析させていただく。
そんなつもりで、統計と付き合っております。

後半部分は、オレの考えなのでもちろん押し付けるつもりないからね。




90 132人目の素数さん 投稿日:2012/02/04(土) 15:01:01.25

>>77だけど。
統計学自体は純粋な数学の分野だと思ってるよ。
確かにオレは経済学から統計を学んだけど、
それでも、確率、場合の数、数列(Σの計算)、
実数の微積分、マトリックス行列、ベクトル、理解してなきゃ統計をマスターできなかったと思う。
質問者のレスをたどってみても、あながち数学を理解してないとは思えないし、
質問自体、有意義なもねだと思うけどね。
そもそも、スレタイ自体が「なんでも」だろ。突っ込まれる要素はないと思うけどな。




20 名無しさん 投稿日:2012/01/31(火) 12:21:44.79 ID:???

∫[-∞,+∞] e^(-x^2/2) dx = √(2π)



30 名無しさん 投稿日:2012/02/01(水) 10:21:45.82 ID:hZeM7um0

要は吊り鐘の形になるために、πが必要だったという事かな。
手元の統計の参考書みても式は載せてあっても、式の中身まで解説されて無かったんで。
この先はガウスとか勉強すればいいんだな。二項分布の近似ぐらいしか思って無かったんで。
勉強になりました。あとはwik見ます。




33 猫の方針 ◆MuKUnGPXAY  投稿日:2012/02/01(水) 12:14:50.32 ID:???


今になって私がその話を理解するに:
★★★『数学を理論物理に取っての表現の手段(道具)と認識した場合、
      では理論物理が数学を手段として用いる事の必然性はあるのか。』★★★
という様な事で、「この理由は判らない」とあの田崎晴明さんも何処か
で書いて居られたという記憶です。通常はそういう事は物理学者は疑わ
ないんでしょうが、でも「もし万が一、数学以外にも物理を記述する言
語が存在する」という様な事があれば、ソレは非常に興味深いと私は考
えます。

何故こういう事に私が拘るかというと、もし何かの全く新しい研究対象
が数学ででも物理ででも出現した場合に、では果たして既存の言語なり
既存の道具だけで問題が記述出来て、その問題が解決するかどうかは前
以ては何の保証もないと私が考えるからです。




34 名無しさん 投稿日:2012/02/01(水) 12:21:28.28 ID:???

>>33
そのために拡張してきたのが、物理と近かったころの数学なんじゃないの。

記述できなきゃ、拡張していくだけでしょ。




36 猫は痴漢 ◆MuKUnGPXAY  投稿日:2012/02/01(水) 12:28:29.90 ID:???

>>34
恐らくは概ねそうでしょうね。でも拡張とか延長ではなくて『全く新し
い見方や考え方による方法論』という可能性を排除しない方が学問が面
白くなると私は個人的に思うだけですね。つまり既存の考え方に捕われ
ずに考えたいという事です。






37 132人目の素数さん 投稿日:2012/02/01(水) 17:28:20.77

>>36
でも、それを人間が理解できないと意味ないので、まったく新しい見方や方法論も論理の拡張として数学に組み込めるんじゃないかと思う。






35 名無しさん 投稿日:2012/02/01(水) 12:27:20.42 ID:hZeM7um0

オイラー・フーリエ共にしりません。
聞いたことあるレベル。




40 132人目の素数さん 投稿日:2012/02/02(木) 02:21:28.42

オイラーもフーリエも知らないと書いているのに…
正規分布の式にπがある意味を知りたいだけなの質問に。
質問の内容には答えず、意図的に質問者を見下すレスしか返せないのは、嫌味以外に何があろうか。
オイラーや、フーリエのπの意味を知らなければ、正規分布のπを理解できないと言いたいのなら、オイラーやフーリエと正規分布の関係を示すべきでしょ。

それじゃなければ、ただ無知の人を愚弄したいだけ。

以上。もう書き込まないんで。




64 132人目の素数さん 投稿日:2012/02/02(木) 17:12:16.22

中学生の身長が○cm以上である割合を推定したい
信頼度95%、誤差0.03以下で推定するとき
必要な標本の数はいくつになるって問題なんだけど
これだけの情報で答え出るの?




81 132人目の素数さん 投稿日:2012/02/04(土) 12:07:01.18


信頼度95%、誤差0.03>>64ですから、λには2、dには0.03、pとqには0.5を
それぞれ代入ですね。そうすると求むべき必要標本数:nが算出できますよ。
標本数はどの程度あればよいのですか
http://www.pref.saitama.lg.jp/site/toukeifaq/q1-8.html






99 132人目の素数さん 投稿日:2012/02/04(土) 16:49:27.55


重回帰分析Web学習サイトだと、早大向後准教授『ハンバーガー統計学』の
続編のこちらも、平易で初学者にはお奨めですね。
アイスクリーム統計学にようこそ! 早大人間科学部 向後千春准教授
http://kogolab.chillout.jp/elearn/icecream/
6. 重回帰
http://kogolab.chillout.jp/elearn/icecream/chap6/sec0.html
紙体は、『統計学がわかる【回帰分析・因子分析編】』(技術評論社, 2008/12/9)。




108 132人目の素数さん 投稿日:2012/02/05(日) 12:35:04.24

世論調査の正当性を検定するにはどうやればよいでしょうか?

109 132人目の素数さん 投稿日:2012/02/05(日) 15:45:11.29

>>108
正当性ってどういう意味で使ってますか?
倫理的に許されるのかってこと?
理論的に正確なのかってこと?




110 132人目の素数さん 投稿日:2012/02/05(日) 16:43:08.11

>>109
理論的に正確であることです




111 132人目の素数さん 投稿日:2012/02/05(日) 17:34:50.52

>>110
仮定をおけば検定が可能です。
枠が適切で、抽出方法が適切で、質問が適切であったという、
とんでもない仮定ですが(笑

世論調査においては、
1.どの標本枠を利用したか?(母集団リストのこと)
2.どのように抽出したか?(多段階、層別、無作為など)
3.質問の表現方法は適切か?
などによって結果が異なることが知られています。
ですから、実際のところは、だいたいのところしか判断できません。




112 132人目の素数さん 投稿日:2012/02/05(日) 21:41:34.83

>>111
それってすべてのデータと処理方法が公表されていないということ?






113 132人目の素数さん 投稿日:2012/02/06(月) 14:49:07.47

適切な標本を採ったとしても。
確率だから世論調査の結果が全く正確なわけがわけがない。



114 132人目の素数さん 投稿日:2012/02/06(月) 15:29:44.60

>>113
正確な処理がなされていることを外から検定するしかないでしょう。
統計的な処理なのだから。








119 132人目の素数さん 投稿日:2012/02/09(木) 13:12:43.09

選挙の当確は、優位水準95%なの?
大事な情報なのに、95%だと甘いような。



120 132人目の素数さん 投稿日:2012/02/09(木) 19:32:26.72

>>119
早く当確をだしたテレビ局からインタビューする権利があるとかのルールがあるらしく、急いで出すらしい。

ただ、間違うと問題になるので、その加減で決めてるみたい。




121 132人目の素数さん 投稿日:2012/02/09(木) 21:53:22.83

>>119
当確判断が有意水準95%というのは、何からの情報ですか?
そもそも当確判断に使われる手法は、検定でなく推定では?
有権者数と投票率と投票所出口調査値から、TV局が推定しているのでは?




122 132人目の素数さん 投稿日:2012/02/09(木) 22:08:34.87

>>121
推定という言葉を使うと検定と切り離せない。

単なる予想だよね。




124 132人目の素数さん 投稿日:2012/02/09(木) 22:53:05.27

>>121
統計的な意味の推定なのか、日常語としての推定なのか。





123 132人目の素数さん 投稿日:2012/02/09(木) 22:49:09.43

ごめん。実際に当確の優位水準95%というのは俺の当てずっぽう。
もちろん95%というのは、慣例的に使われている値だから。
違ったらごめんなさい。




125 132人目の素数さん 投稿日:2012/02/09(木) 22:55:32.98

もしかしたら、当確はベイズ使われている?



126 132人目の素数さん 投稿日:2012/02/09(木) 23:40:45.26

開票結果は各投票所で逐次でるのだから可能性としてはあるが、
そんな丁寧なことをしているかだな。




127 132人目の素数さん 投稿日:2012/02/10(金) 00:48:05.79

常識的に95%で当確出してないだろう。
衆参同一選挙だったら誤って10人以上は当確出す可能性がある。
99.9位まで、きっつきつするか。
統計的な手法以外の何かと併用してるんじゃまいか。




128 132人目の素数さん 投稿日:2012/02/10(金) 01:07:35.01

君たちは統計をぜんぜん解ってないようだ。

キム仮説を5%で棄却するかの判断なので、それは当確の確率ではない。





129 132人目の素数さん 投稿日:2012/02/10(金) 08:09:39.98

意味も分からず統計手法を盲信しているところも微笑ましい
情報の本質は情報源にあり、統計はそれを解釈する手法に過ぎない

俺の知ってる例だと当確候補は選挙前の電話調査でほぼ決めておいて
当日の出口調査で大まかに検定して適当なところで見切り発表してた
結局のところ投票率と支持層の関係とか非統計的な要素の影響が
大きいために投票行動モデルのような主観的な補正に頼らざるを得ず、
実際に当確取り消しもちょくちょくある

そんなわけで当確情報は統計屋の仕事じゃなくて政治学者とか社会学者の仕事になってる


131 132人目の素数さん 投稿日:2012/02/10(金) 21:31:47.47

>>129
出口調査で大まかに検定してというのは、どのような検定方法でしたか?




132 132人目の素数さん 投稿日:2012/02/11(土) 08:56:41.47

>>131
話に聞いただけだから詳細は知らんけど
古典的な手法で手堅くやるのが一般的

モデルが恣意的な分、統計手法は単純であるべきだし
統計学者が理論的な研究をする場合を除けば
前衛的な統計手法は手法の妥当性を示すところで躓く
論文読んだら分かるけど、「○○統計パッケージの
××関数を使いました」と書くのが厳密とされる世界だよ

蛇足を承知で言うけど、検定手法を云々する前に
何を検定するのかを考えないと応用上は意味が無い




136 132人目の素数さん 投稿日:2012/02/12(日) 08:06:43.41

>>132
>前衛的な統計手法は手法の妥当性を示すところで躓く・・・・・・
TV局の当確予想方法が、前衛的芸術ならぬ斬新な統計手法に拠るとの意味ですか?
ここ数年TV各局の当確予想時刻が、以前より革命的に早期化されたのは、
どういう新手法が採用されたからなのですか?




133 132人目の素数さん 投稿日:2012/02/11(土) 11:41:53.45

>>131
出口調査値は、誤差が大きすぎて統計的判定の使い物にならないと
統計学者も、供述しておりますよ。
”「出口調査」では、百人の場合で得票率の誤差はプラス・マイナス10%(注)となるが、
これでは誤差が大きすぎ・・・・・・・”
松原望『統計学の眼』 http://www.qmss.jp/qmss/text/supplements/tokei.htm#2






130 132人目の素数さん 投稿日:2012/02/10(金) 20:53:33.43

なるほどな。貴重な情報だな。
当確取り消しは確かにあるが、衆議院議員選挙だと各TV局で0~1名だと思うので
結構慎重に出しているんではないのかな?(大差のものも多いから慎重に判断
しないといけない議員数はそれほど多くないのかもしれないが。)




135 132人目の素数さん 投稿日:2012/02/12(日) 01:02:40.67

その投票所の結果を当てるのなら難しいだろうが、投票所は複数あって
その合計での選挙だから調べている人数はもっと多いと思う。
(すべての投票所で調べるわけではないようだけど合計数はもっと多いだろう。)
何にせよ例えば99%信頼区間で逆転不可とかになっていたら開票直後に
当確とでるのだろうが、そうでない場合は開票状況をどのように使っているのかは
分からないな。




144 132人目の素数さん 投稿日:2012/02/17(金) 07:55:38.70

よく「○○分布に従う」という表現をしますが、なぜ「従う」なんですか?
「○○分布である」ではなぜ駄目なんですか?



146 132人目の素数さん 投稿日:2012/02/17(金) 09:58:28.13

>>144
実際のデータの集まりは、従うはずの分布からずれる(歪む)から、実際のデータは従うはずの分布そのものにはならない。

あるルール、こういう分布になるよね、に従ってるはずのデータの集まりだから。




150 132人目の素数さん 投稿日:2012/02/17(金) 16:50:45.39


あくまでも元の分布(ルール)から(ルールに従うように)発生してる確率変数。

それを説明しようと>>146を書いたけど伝わらなかったみたいね。




151 132人目の素数さん 投稿日:2012/02/18(土) 01:17:01.38

>>145>>146>>149
みんなありがとう。あまり深く考えない方がいいのかもしれないね
>>146はなんとなく納得がいったけど>>148は分からなかった
もうちょっと素人向けに解説してくれると嬉しいです
ちなみに>>147とは別人です




153 132人目の素数さん 投稿日:2012/02/18(土) 07:25:33.33

 

>>146だけど、以下の説明でわかる?
例えば、サンプルを取ってみたら値が3だったとすると、これは分布ではなくて値だよね。
でも、その3という値が、ある確率分布に従って発生したものであれば、背景というか
データを作成している分布を利用して、統計的な処理ができるよね。
(まあ、1個じゃ厳しいけどw)

何かを作る機械(分布)があって、そこに設定(正規分布とか)があって
製品(確率変数)ができるけど、機械や機械の設定と製品は違うでしょ。
(かえって分かりづらいかな)




149 132人目の素数さん 投稿日:2012/02/17(金) 12:19:33.74

>>144
うーむ、ただの慣習かな?
あと、「従う」が、口語として発音が聞き取りやすいってのも
あるかもしれない?
本当の理由は知りません。

あと、区間推定のときに、「95%の区間に落ちる」
とか言うでしょ?
なんで「落ちる」なんだよ!!!
おれが○○大学に落ちたのを皮肉ってんのかゴルァ!!!
とか思ってしまう。。。





145 132人目の素数さん 投稿日:2012/02/17(金) 07:58:40.47

慣習じゃね?
何となくかっこいい言い方だし




147 132人目の素数さん 投稿日:2012/02/17(金) 10:01:16.85

全く質問の答えになっていないんだがw
何故「従う」が質問では?



148 132人目の素数さん 投稿日:2012/02/17(金) 12:01:58.44

「確率変数Xは○○分布である」?
Xは確率変数なのであって、分布ではないだろ
小児的な言葉遣いをするやつと馬鹿にされちゃうよ?




152 132人目の素数さん 投稿日:2012/02/18(土) 01:39:49.71

あ、でも147の言うことも凄い分かります
あんまり小児的なんて言葉で切り捨てて欲しくないなぁ

しかしこういう些細な?ことを何の疑問もなくつまづきもせず理解できる人って凄いね
頭の作りが違うと言われればそれまでだけど、算数から躓いていた自分からすると
統計の勉強の一歩一歩が本当につらいよ




164 132人目の素数さん 投稿日:2012/02/20(月) 19:32:27.08

初学者にすすめられる本を教えてください
・数学を使わず入学した私立文系大学生
・まわりに詳しい人はいない
・時間は確保できる
よろしくお願いします




165 132人目の素数さん 投稿日:2012/02/20(月) 21:25:32.56

>>164
統計学を学ぶ目的は何でしょう?
それによって、数学がどの程度必要となるのか
判断できますので。




167 132人目の素数さん 投稿日:2012/02/21(火) 08:59:54.74

>>165
ありがとうございます
生きていく上で散見される数字、データの意味を正しく理解したいと思いまして学習したいと思っています




171 132人目の素数さん 投稿日:2012/02/23(木) 02:23:44.70

>>167
> 正しく理解したい

マンガ、、、などよりずっと上級ですけど、

「統計学100のキーワード 」松原 望 (編集)

をお薦めします。
amazonでは在庫切れのようですけど(廃刊か?)
古本で14円から売ってますから、
これをまず読んでみてください。

これは、>>167さんのような方にはぴったりの本です。
日本統計学会の会報でも紹介されました。
名著だと思いますよ。




166 132人目の素数さん 投稿日:2012/02/20(月) 23:33:31.59

>>164
165さんと同様で、統計を学ぶ目的や利用したい理由などを
教えていただかないと示しようがありません。




168 132人目の素数さん 投稿日:2012/02/21(火) 10:51:08.65

マンガでわかる統計学

文系学生のための数学・統計学・資料解釈のテクニック

ゼロからわかる確率・統計―100%文系の人のための数学読本

このあたりはどうでしょうか?
書店で見てみてください。




169 132人目の素数さん 投稿日:2012/02/22(水) 22:22:19.79

ありがとうございます
明日みてきたいと思います




170 132人目の素数さん 投稿日:2012/02/23(木) 00:43:26.06

マンガ云々は読んだことが無いので申し訳ないのだが
分かり易い例をひいて説明している本は入門向けに
最適なのでパラパラ中を見て面白そうなのを選ぶと良いよ
時間が有り余っているならブルーバックスとか数学読み物的な
本で統計の歴史みたいなものを探して読むのも一興
なぜそのような概念が必要になったのか背景が分かって面白いよ

逆に教科書的な定義を並べているやつは読まない方が良い
大学のテキストや参考書として有名なシリーズはほとんどが罠


余談だが、某統計教室に遊びに行ったら
マンガで分かる統計学が置いてあった
最近は基礎的な統計概念から話の通じない
学生も多いとかで割と重宝していると聞いた

ちなみにその研究室ではマンガで分かるシリーズが
全巻揃っていそうな勢いで並べてあって時代を感じた
もう5年くらい昔の話ですけどね




172 132人目の素数さん 投稿日:2012/02/24(金) 23:20:22.34

今日話題になってた「平均」がわからない大学生がどうとかの問題の1つです。

1-1
ある中学校の三年生の生徒100 人の身長を測り、その平均を計算すると163.5
cm になりました。この結果から確実に正しいと言えることには○を、そうで
ないものには×を、左側の空欄に記入してください。

(3) 身長を10 cm ごとに「130 cm 以上で140 cm 未満の生徒」「140 cm 以
上で150 cm 未満の生徒」・・・というように区分けすると、「160 cm 以上で
170 cm 未満の生徒」が最も多い。
正解:×

これって「正規分布に従っているとは言えない」からが理由ですかね?




173 132人目の素数さん 投稿日:2012/02/24(金) 23:24:31.39

それだと正確ではない
例えば左右均等でない分布では平均周りが最も多いわけではない




175 132人目の素数さん 投稿日:2012/02/24(金) 23:27:05.37

「正確でない」どころか大間違い

身長の分布は離散分布
正規分布は連続分布

近似で使うのならまだしも、当て嵌めは不可能




210 川上 投稿日:2012/02/29(水) 00:21:01.48

全くの素人が本を見ながら、統計処理してますので、お助けをお願いします
ある処置により、容積Yが変動しました。この容積Vの変動とある検査結果Xが単相関
している所見が得られました。ここで、これらの関連をより明らかにするために
10%以上の増加が意味あるとして、10%以上の増加した群としなかった群と
検査Xの変動の有無で2×2の分割表検定をして、オッズ比をだして、意味があるかどうか
調べるという方法でよいでしょうか?また、これを単変量解析というんですか?
N=20程度です


211 132人目の素数さん 投稿日:2012/02/29(水) 02:20:38.72

>>210

以下のところを見てくださいな。

ttp://www.kogures.com/hitoshi/webtext/stat-2x2/index.html






212 132人目の素数さん 投稿日:2012/02/29(水) 10:51:22.16

統計学について質問があります
Zが標準正規分布N(0,1)に従うとき、次の値を求めなさい
P(0≦Z≦1.23) P(-2.31≦Z≦0)
P(1.38≦Z)
クラスの皆がわからず困ってます
どなたかお教えお願いしますm(__)m



213 132人目の素数さん 投稿日:2012/02/29(水) 11:15:40.45

>>212
正規分布表見て値を拾えばおk
excel等計算機を使う問題じゃないんだよね?




214 132人目の素数さん 投稿日:2012/02/29(水) 11:41:58.99

>>212
標準正規分布に従ってるから一番簡単な問題。
標準正規分布表使えばすぐに求まるよ。
しかもZが0以下か以上の範囲のしかないから更に簡単。

http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm





215 もり 投稿日:2012/02/29(水) 13:10:51.92

多重比較の検定について、どなたか、教えていただけませんでしょうか。

A群:コントロール→介入→非介入、B群:コントロール→非介入→介入、というクロスオーバーデザインです。
1)反復測定分散分析は必須なのでしょうか。

2)ダネットの検定で、A群について、コントロールと介入・非介入を比べる、またB群についてコントロールと非介入・介入を比べる、という作業を別々に行って良いのでしょうか。

3)対応のあるt検定をし、ボンフェローニの方法で補正するのは、検出率が下がる点を無視すれば、手法としては誤りではないでしょうか。
この場合、A群について、2回t検定を行った、B群について2回t検定を行った、という解釈でよいのか、系全体で4回のt検定を行ったと考えるのでしょうか。

用語などあやふやですが、ご容赦ください。宜しくおねがいします。



220 132人目の素数さん 投稿日:2012/03/03(土) 07:35:22.21

>>215
何と何を比較したいのかよくわかりません。
AとBに対して、介入するタイミングの違いが差をもたらすということ?




221 もり 投稿日:2012/03/04(日) 07:04:29.93

>>220
ご指摘ありがとうございます。示したいのは介入の有効性なのですが、そもそも自分が、クロスオーバーデザインというものを十分理解していないことに気付きました。
「クロスオーバー」というからには、A群:処置1→処置2だけでなく、B群:処置2→処置1も自動的に必要なのだと思い込んでいました。
処置1と2を比べるとき、時期効果を排除するためA・B両群必要なのは理解できるのですが、片方が「非介入」や「プラセボ」のとき、「B群」はそもそも必要ないのでしょうか?
ただ、そうすると、群内比較のデザインよりはパラレルデザインの方がよくて、Nがたくさん必要になるのかなと思いました。
改めて教えてください。よろしくお願いします。




228 132人目の素数さん 投稿日:2012/03/04(日) 16:57:13.97


1)必須でないと思います。
2)2群別々でなく、まとめるべきだと思います。
3)これもまとめた上で、対象-介入、対象-非介入の2回だと思います。
ただし、ダネットの方がよいのではないかと思います。
>>221
ほぼおっしゃるとおり。
ただし、クロスオーバーなら2群置く方が普通なので、「普通」に従うべきではないかと思います。
また、パラレルはNを大きくしないといけない、というより、
クロスオーバーはNが小さくてもすむというべきかもしれません。




230 もり 投稿日:2012/03/05(月) 06:30:20.92

>>228
どうもありがとうございました。





216 132人目の素数さん 投稿日:2012/02/29(水) 19:01:29.17


統計学上、ほとんど無視していい事象って100万分の1くらいだっけ?




217 132人目の素数さん 投稿日:2012/02/29(水) 19:04:06.57

そんなこと一概に言えるの?



218 132人目の素数さん 投稿日:2012/03/01(木) 13:52:00.60

検定のことを言ってるのかな?




222 132人目の素数さん 投稿日:2012/03/04(日) 08:00:11.03

分散を求める時、偏差を2乗してから加算しますよね。
その理由として、偏差をそのまま加算すると結果はゼロに
なるからと説明してあります。
偏差の絶対値を加算する方が、計算が楽だと思うのですが
何か深遠な理由が有るのでしょうか?




223 132人目の素数さん 投稿日:2012/03/04(日) 09:03:30.69

自乗して足す方が計算が楽だから



224 132人目の素数さん 投稿日:2012/03/04(日) 11:26:40.23

数学理論で微分などを行うとき絶対値は扱いが困るから。



225 132人目の素数さん 投稿日:2012/03/04(日) 11:38:05.47

劣度、尖度とかモーメントとか考えると二乗は合理的にできてるね



226 132人目の素数さん 投稿日:2012/03/04(日) 16:27:30.46

というより、
そうやって(2乗して和をとる)計算された分散というものが
多用されるのは、どういう理由ですか。
といったことが尋ねたいのではなかろうか。



229 132人目の素数さん 投稿日:2012/03/04(日) 19:15:35.15

>>226
いや、違うと思うよ





227 132人目の素数さん 投稿日:2012/03/04(日) 16:34:04.77

>偏差の絶対値を加算する方が、計算が楽だと思うのですが
絶対値より2乗の方が楽だから、で結論が出てる
後は、L^1ノルムよりもL^2ノルムの方がイメージしやすいとか?




231 132人目の素数さん 投稿日:2012/03/05(月) 11:50:41.38

>> 226
言葉足らずの質問に補足頂きありがとう。
各位の回答を読むと、確かに何も考えず2乗しちゃった方が
簡単ですね。

ばらつきの平均の2乗である分散と、分散のルートを取った
標準偏差を発明するぐらいなら、偏差の絶対値から計算した
ばらつきの平均の方が、(私には)しっくりきます。

2乗してあるデータ(分散)と、ルートを取って元に戻した
データ(標準偏差)と、2種あるのは、単なる計算方法の違い
だけに起因するものなのでしょうか?

統計の本とかを見ても、絶対値から計算する、ばらつき具合は
スルーされてて何の説明もなく、疑問に思った次第です。




232 132人目の素数さん 投稿日:2012/03/05(月) 13:16:11.46

積分とかする際に絶対値だと正負の場合分けを考えたり非常に面倒。
なので普通は二乗で計算しちゃう。

分散のまま計算に使う分散分析などもあるので、標準偏差だけに統一すると二度手間だったりもする。




233 132人目の素数さん 投稿日:2012/03/05(月) 19:08:45.33

平面上の2点(x1, y1), (x2, y2)の距離は√( (x1 - x2)^2 + (y1 - y2)^2 )
しかし、2乗したものの和でなくても、「距離」を表す指標はつくれる
例えば絶対値の和│x1 - x2│+│y1 - y2│でもよい

分散の定義も同じこと
各数値の「平均値からの距離」の平均が、分散であった




234 132人目の素数さん 投稿日:2012/03/06(火) 01:50:39.93

結局のところ正規分布のように自然と母分散が密度関数のパラメータとして
出てくるものがあり、その最尤推定量を求めると標本分散が出てくるところが
ポイントなのかな。




235 132人目の素数さん 投稿日:2012/03/07(水) 20:33:53.20

平均値と相性がいいのが標準偏差、中央値と相性がいいのが絶対偏差。



236 132人目の素数さん 投稿日:2012/03/07(水) 22:37:23.00

STATAを今使用して重回帰分析を行なっているんですが、非標準化回帰係数の95%信頼区間は表示されるのですが、"標準化回帰係数"の95%信頼区間はどうやったら表示されるのでしょうか?
ご存知の方、よろしくお願いします。


237 132人目の素数さん 投稿日:2012/03/08(木) 14:47:34.30

>>236
デフォルトや、オプションでは表示されないでしょう。
各変数の標準偏差や回帰係数から算出はできますが、面倒くさいし、
adoコマンドにもあるかもしれませんが、
最も簡単なのは、分析に使う変数をすべて標準化してからregに投入すればOKです。

しかし、なぜデフォルトやオプションという簡単な方法で出力されないのかを考えてみては?






240 132人目の素数さん 投稿日:2012/03/20(火) 13:42:29.00

ボルトキーヴィッチは著書"Das Gesetz der kleinen Zahlen "(The Law of Small Numbers)において、
プロイセン陸軍の14の騎兵連隊の中で、
1875年から1894年にかけての20年間で馬に蹴られて死亡する兵士の数
について調査しており、1年間当たりに換算した当該事案の発生件数の分布が
パラメータ0.61のポアソン分布によく従うことを示している。


とWikipediaに書いてあったんですが
これは、平均598日に1人の兵士が馬に蹴られて死んだと調査で判ったという事ですか?




241 132人目の素数さん 投稿日:2012/03/21(水) 00:27:46.40

延べ280部隊について1年間に馬に蹴られて死亡した兵士の人数の分布を調べたところ
以下のようになり、ポアソン分布がよく当てはまるということ。

人数    0  1  2  3 4
部隊数 144 91 32 11 2

すなわち、単に平均を求めたのではなく適合度検定したということ。




242 132人目の素数さん 投稿日:2012/03/21(水) 01:26:51.01

そうですか(´・ω・`)
有難うございました




243 132人目の素数さん 投稿日:2012/03/21(水) 01:27:57.62

パラメータの0.61ってどういう手順で出したものですか?


245 132人目の素数さん 投稿日:2012/03/22(木) 02:27:58.85

>>243
Wikipediaの記述が間違っているみたいだね。0.61は構成の違う軍を除いて
10軍に延べ200軍に絞ったときの平均値だ。例に挙げた14軍のときは
平均値0.7だ。どちらであっても適合度自体はよいようだけど。





248 132人目の素数さん 投稿日:2012/04/04(水) 00:50:23.65

質問です。もしよろしければ教えてください。

店のレジからお金を盗んでいる店員がいるのではないかと疑念があり、統計的に当たりをつけようと
考えています。勿論統計分析が正しくない結果を導くことは承知してますので、結果は慎重に扱うつもりです。

質問1.以下の方法でよいですか?
日々の売上げ、天候、曜日・休日、周辺のイベントの有無を重回帰分析により売上げの計算式をもとめる。
その数式で求めた統計上の売上げと、実際の売上げを信頼区間95%で検定する。

質問2.検定のときに使う分散は、エクセルの回帰分析で出力される分散分析表のどの値を使えばいいのでしょうか?

質問3.年間の季節変動や連休などの影響はどのように反映させればいいのでしょうか?
数年間のデータ平均から手で補正したデータを用いて回帰分析すればいいのでしょうか?



254 132人目の素数さん 投稿日:2012/04/05(木) 00:53:18.91

>>248
なんかおかしい。
本当に、実際の店の人間なのか?

いまはどの店でも、他の方法でレジから
金を抜く店員を見つけています。






249 248 投稿日:2012/04/04(水) 01:05:39.40

補足です。
レジを担当するものは20名ほどおり、一日に2人が交代で担当します。
売上げの異常な日を統計的に検出し、長期的に様子を見ていくつもりです。




250 132人目の素数さん 投稿日:2012/04/04(水) 08:28:01.10

レポートの課題なら適当にやっておけと言うところだが
現実に適用するつもりなら考え直した方がいい。

露骨に特定の人物がいる日だけ売り上げが下がるならば
難しい統計はいらないし、微妙な結果になるならば
あなたの考えた恣意的な補正で犯人が決まるだけだから。
質問の内容からして統計だけでなく自分の商材の売れ方すら
碌に分かっていないようだからなお更危うい。

POSいれるなり在庫管理を厳密化するなりして
直接的に盗みを検出できる仕組みを作るべき。




251 132人目の素数さん 投稿日:2012/04/04(水) 09:22:47.59

万札、5千円札、千円札、500円硬貨、とお金の種類ごとの数を日々表にしていけばよろし。2000円札は不要でしょw
それを各人ごとに集計して比率の差の検定。
うまくいくかどうかは保証の限りではなし。

レジから金を盗んでてもすぐには気づかないほどの売上高があって、
レジする人が20人も従業員がいるような規模なら、>>250が言うように、もうちょいしっかり在庫管理とかできてないものなの?
95%信頼区間なんて難しい言葉を知っているのに、検定で分散分析表のどの値を使えばいいのか、ってのも
ちぐはぐな感じを受けます。余計なお世話かもしれませんが。




259 132人目の素数さん 投稿日:2012/04/05(木) 20:37:12.96

在庫管理がきかなくて監視カメラも置けないけど
レジの操作は記録できる
担当は2人の交代制で売り上げに響くくらい横領ができるが
それを指摘することは難しい

どんな仕事なのか気になるな

駐輪所の管理人とかか?




263 sage 投稿日:2012/04/14(土) 15:46:34.26

質問なんですが,
よく移動平均で線形加重とか指数加重が使われるけど、
これを標準偏差に重みをつける時ってどうすればいいの?



270 132人目の素数さん 投稿日:2012/04/15(日) 23:07:29.13

>>263
後で計算した標準偏差ほど重みを増やして、
標準偏差そのものの移動平均を出せばいいだけ。


関連記事
コメントの投稿












管理者にだけ表示を許可する
トラックバック
この記事のトラックバックURL

親サイト
親サイト
薬学部受験生・薬学部学生・薬剤師を目指す人の薬学ポータルサイト
ブログランキング
応援よろしくお願いいたします。 ビジネスブログランキング
にほんブログ村 病気ブログ 薬・薬剤師へにほんブログ村
薬剤師ブログタイムズ ブログランキング参加中! クリックしてこの記事に投票
画像新着記事
最新記事
ページランキング
スポンサード リンク
逆アクセスランキング


上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。