2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

統計学Part15

1 :132人目の素数さん:2013/04/05(金) 23:35:41.08 .net
前スレ

統計学なんでもスレッド14
http://uni.2ch.net/test/read.cgi/math/1326471964/

828 :132人目の素数さん:2014/04/04(金) 20:37:32.94 .net
そう、大きく変わってるからね。
統計に関しても、国内の一つの柱になってる。

829 :132人目の素数さん:2014/04/05(土) 07:41:06.63 .net
>>821
あづまぶる東大じゃ応用統計学を、計数工学と称するのか?関西じゃ
耳にせぬ名称だな。すると計量工学もあるのか?京大じゃ数理工学科、
阪大じゃ基礎工応用数学科だったか。

830 :132人目の素数さん:2014/04/05(土) 09:46:22.65 .net
>>829
「計測+数理」からの造語なんで「計量」の対義語じゃないみたいね。
関西に限らず、たしかに計数工学という科は東大以外あまり聞かないね。
まあ、実務の世界で活躍している人を多数輩出してるので
看板の一つだろうな。 
そういえば工学部自体が世界最古だった

831 :132人目の素数さん:2014/04/05(土) 18:30:56.35 .net
昔は(50年くらい前、今も?)数学が好きで理学部数学科に行きたいが
数学者になれるかどうか不安、とか親が工学部に行けと言うから、
という安全志向に押されてここに行った学生がかなり居た
実際理数卒より生涯収入は平均多いだろう
それぞれの教授になった連中は収入は同じようなもんだが、居心地はどっちがよかったか
まあ、性格は大分違ったね(後天的かもしれんが)

832 :132人目の素数さん:2014/04/05(土) 20:39:10.45 .net
工学系は、他人がやっていない新しいことを探し出しやすいので
そういうのが好きな人は楽しいんじゃないかな。
院の生物統計も(医薬・看護系)で西欧は盛んでも日本には専門が
無いということで、計数工学出身の教授が新たに作りたいという
事から始まったから、新しいもの好きに向きなのかも。、

833 :132人目の素数さん:2014/04/07(月) 22:41:29.72 .net
>>832
生物統計を始めた計数工学出身の医学部教授というのは、
大橋教授のことですね?
東大 医学部健康総合科学科 大橋 靖雄 教授
http://www.hn.m.u-tokyo.ac.jp/teachers/ohashiy.html

834 :132人目の素数さん:2014/04/09(水) 12:12:37.52 .net
すみません、誰か教えてください。

適合度の検定で有意差が出て、どこに差があったのか多重比較を行う場合、
ライアン法を使っても構わないですか?

某オンライン統計サイトでは、自動的にライアン法で多重比較までやってくれますが、
ライアン法は「k×2分割表の比率」のみに使用できる、と書かれている場合もあります。

835 :132人目の素数さん:2014/04/13(日) 20:51:10.51 .net
独学で統計を学びたいのですが、一冊目におすすめの本を教えて下さい。
スレチだったらすみません。

836 :132人目の素数さん:2014/04/14(月) 01:16:37.80 .net
完全独習統計学

837 :132人目の素数さん:2014/04/15(火) 08:49:25.19 .net
誘導されてやってきますた
http://ai.2ch.net/test/read.cgi/math/1395970106/295

838 :132人目の素数さん:2014/04/15(火) 09:01:31.73 .net
日本の大学で教えている確率・統計学じゃ使いものにならない気がするわ
物理の統計力学とかランダム行列とかまでやらないと

計数工学科は数理科学の工学版みたいなもんだろ
工学向けの数学に関する専門学科って感じだな

839 :132人目の素数さん:2014/04/15(火) 09:29:35.41 .net
なぜ統計力学が出てくるのか

840 :132人目の素数さん:2014/04/15(火) 15:54:29.26 .net
言葉が似てるからだろ

841 :132人目の素数さん:2014/04/16(水) 00:06:46.19 .net
>>835
入門は放送大学つかえば?
ちょうど新学期の放送始まったばかりだから

842 :132人目の素数さん:2014/04/16(水) 00:21:04.83 .net
>>841
放送大学良さそうですね。
此方まだ高校生なので理解に足りるかわかりませんが、一度みてみます。

843 :132人目の素数さん:2014/04/16(水) 00:29:59.69 .net
確率・統計 (理工系の数学入門コース 7) 薩摩順吉

これを超える統計学入門書は存在しない。

844 :132人目の素数さん:2014/04/16(水) 01:27:21.12 .net
放送大学の統計はプロ野球の公式戦でのダルビッシュや松坂の投球内容がやたらとデータ化されて教材として使用されてる

845 :132人目の素数さん:2014/04/16(水) 23:39:30.73 .net
それは基礎科目の「身近な統計」の方か
専門科目の統計学はラジオなんだな。知らなかった

846 :132人目の素数さん:2014/04/17(木) 07:34:56.89 .net
区間推定に関して質問です。

正規分布する観測量の平均値を推定するとき、標準化して標準正規分布の数値表から信頼区間を求めますよね。
この時、元になる分布とそれを標準化した標準正規分布の信頼区間が対応するとする根拠はなんでしょうか?

847 :132人目の素数さん:2014/04/17(木) 12:52:37.51 .net
元側の確率変数に対し、同一の母平均の値を引いて、さらに同一の標準偏差で割ったのが、新しく生成された標準化された確率変数なのだから、
信頼区間内に含まれている標本群の特性は何ら変わらずに、標準化前→標準化後にそのまんま引き継がれていて当然なのでは?

848 :132人目の素数さん:2014/04/17(木) 18:39:03.63 .net
平均値が最大値と最小値の間にあること。
中央値が平均値の2倍以下であること。(ただしデータは非負とする)
という2題を証明せよ、という問題なのですが、どういう方針で証明すればいいんでしょうか?

849 :132人目の素数さん:2014/04/17(木) 18:47:21.04 .net
確率変数Xが平均μ分散σ2の正規分布に従うとき、
aX+bは平均μ+b分散a2σ2の正規分布に従う。
これの証明は、簡単で、多くの教科書に載っている。
思弁的な説明は、数学の範囲外にある。哲認定。

850 :132人目の素数さん:2014/04/17(木) 18:52:51.59 .net
>>848
一行目:最大値と最小値を別々に証明すれば良い
二行目:データの半分は中央値より大きい

851 :847:2014/04/17(木) 19:07:33.94 .net
>>847
感覚的にはわかるのですが、数学的に厳密な証明を知りたいです。自分で定積分計算しようともしましたができませんでした。

>>849
aX+bは平均μ+b分散a2σ2の正規分布に従うということと、対応する区間内での積分値が一致することが繋がりません

852 :132人目の素数さん:2014/04/17(木) 19:22:46.16 .net
少しは自分で式を書いてみろ

853 :132人目の素数さん:2014/04/17(木) 19:23:40.64 .net
>>848
なるほど、わけて考えるんですね。
ありがとうございました。頑張って解いてみます。

854 :132人目の素数さん:2014/04/17(木) 22:21:55.63 .net
文系の大学生で基礎統計をやるんですけど
文系数学の知識ではできないところってありますか?

855 :132人目の素数さん:2014/04/17(木) 22:28:23.31 .net
何やるのか知らんが、まともな内容なら、exp(x)ってなあに?だと正規分布すら分からないから無理
たのしいえくせる♪みたいな内容だったら文系だろうが問題ないでしょ

856 :132人目の素数さん:2014/04/17(木) 22:31:58.40 .net
理系も混じってるからがちだと思う
新世社の入門統計解析ってのが教科書


微分積分の勉強すればいい?

857 :847:2014/04/17(木) 23:32:36.87 .net
>>852
ん〜自分でも式書いて証明こころみてるんですが、単純に積分してイコールになるっていう方法以外思いつかないんですよね。
で、積分するにしても∫[0,a]e^(x^2)dxは手計算では不可能らしいということが分かりましたし。。どうにも厳密な証明にたどりつかないんです

858 :132人目の素数さん:2014/04/18(金) 00:06:36.61 .net
本当に書いただけだな

859 :132人目の素数さん:2014/04/18(金) 00:09:47.66 .net
というか母平均を推定するときって標準化するっけ

860 :132人目の素数さん:2014/04/18(金) 01:51:24.32 .net
>>859
そら正規分布表を読んで得られた数値って、標準正規分布という前提で色々計算された結果なんだし

861 :132人目の素数さん:2014/04/18(金) 02:10:51.53 .net
意味も考えず計算するという奴か

862 :132人目の素数さん:2014/04/18(金) 10:28:13.67 .net
うちの教授は統計は理論を理解するより
何度も計算して手続きを覚えろと教えてたな。

863 :132人目の素数さん:2014/04/18(金) 16:02:24.45 .net
それで済む人はここに来る必要はない

864 :132人目の素数さん:2014/04/18(金) 20:12:05.19 .net
そんな高度な議論をしていたとは今まで全く気づかなかった。それは失礼した。

865 :132人目の素数さん:2014/04/19(土) 00:33:31.53 .net
高度だなんて誰が言った?

866 :132人目の素数さん:2014/04/19(土) 00:47:58.52 .net
いやみ、皮肉でしょ

867 :132人目の素数さん:2014/04/19(土) 01:05:05.32 .net
いや、おそらく864が863の意味を反対に捉えてしまったんだろう

868 :132人目の素数さん:2014/04/19(土) 12:54:59.50 .net
どっちの意味でも同じじゃない?

869 :132人目の素数さん:2014/04/19(土) 13:20:42.61 .net
正規分布って誰が発見したんですか?

870 :132人目の素数さん:2014/04/19(土) 13:23:12.23 .net
ガウス

871 :132人目の素数さん:2014/04/19(土) 13:40:05.59 .net
>>870
先生がガウスじゃないって言ってました。
名前は忘れたんですが思い出せなくて。

何人かの数学者が同じ頃に発見していたというように
いってたと思います。

872 :132人目の素数さん:2014/04/19(土) 13:45:08.74 .net
あっ、そう

873 :132人目の素数さん:2014/04/19(土) 14:25:54.78 .net
正規分布の意義を研究したからガウス分布と言うのさ

874 :132人目の素数さん:2014/04/19(土) 14:56:27.60 .net
数学や物理はいつも同時発見が多いのは、発見されることが必然だからさ。

875 :132人目の素数さん:2014/04/22(火) 11:48:02.43 .net
問題ではないのですが表を作る上でわからないことがあるため質問させて下さい。

点数と順位の表を作り、その内容から何点取れば何位程度になれるかという表を作りたいです。

サンプル数は非常に少ないのですが、例えば
40点 120位
65点 50位
というサンプルがある場合、80点取れば何位程度が想定できるかという表を作りたいです。

これはどのように表にすることが出来るでしょうか。

876 :132人目の素数さん:2014/04/22(火) 11:49:37.18 .net
引っ越すならここじゃなくてポエムスレだろ

877 :132人目の素数さん:2014/04/22(火) 15:17:09.10 .net
表とグラフは一応別物だと思っているんだが・・・回帰直線のグラフじゃだめなのかい?

878 :132人目の素数さん:2014/04/22(火) 18:22:23.30 .net
>>875
http://ai.2ch.net/test/read.cgi/math/1395970106/351

879 :847:2014/04/24(木) 05:59:52.08 .net
>>846には答えてもらえなそうですかね〜証明が載ってる本を紹介してもらうだけでもいいんですが

880 :132人目の素数さん:2014/04/24(木) 06:38:39.95 .net
単なる変数変換だから
微積分の教科書読むといいよ

881 :132人目の素数さん:2014/04/24(木) 13:14:10.39 .net
「読者を馬鹿にしてる」と言われそうな本があるんかな
ここで書いても馬鹿にされそうだが

882 :132人目の素数さん:2014/04/24(木) 16:46:02.27 .net
>>879
まさかaを引いてbで割ったものを、bを掛けてaを足したら同じになる根拠はという質問?
標準化した信頼区間を元になる分布に対して見る場合は当然、bを掛けてaを足して元に戻すんだぞ。

883 :847:2014/04/24(木) 23:03:33.44 .net
>>882
いえ、aを引いてbで割ったものが違う値になることはわかっています。

ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね?
たとえば、
f(x)を正規分布する確率変数として、それを標準化したものをg(z)として、
変数xの区間[a, b]に対応する標準化変数zの区間が[z1, z2]だとすると、
∫[a, b]f(x)dx=∫[z1, z2]g(z)dz
が成り立っていなければいけないと思うんです。でもコレの証明を見たことがないということです。
自分で計算しようとしても、どうしても定積分の計算でつまずいてイコールにできません。

884 :132人目の素数さん:2014/04/24(木) 23:20:39.05 .net
確率変数と確率密度関数の定義もわからないでそんなこと考えてるのか

885 :132人目の素数さん:2014/04/25(金) 00:20:57.87 .net
積分のとこ変数変換したら成り立たなくないか

886 :132人目の素数さん:2014/04/25(金) 00:30:57.49 .net
ただ、対応する値の間の区間の積分値は一致していなければこの推定は成り立ちませんよね?

ここなぜそう考えたのかわからないので教えてください

887 :132人目の素数さん:2014/04/25(金) 01:14:35.74 .net
>>883
そのつまずいたという計算を書いてみ

888 :132人目の素数さん:2014/04/25(金) 03:45:10.98 .net
>>886
標準化する前も後も結局は同じ式、正規分布関数なのだから、
きっと、∫[(z1-μ)/σ, (z2-μ)/σ] 、∫[z1, z2]を正規分布関数で解けばいいんだよ。同じになるはず。

889 :132人目の素数さん:2014/04/25(金) 21:24:23.58 .net
これが分からん奴に何を説明しても無駄じゃない?

890 :132人目の素数さん:2014/04/25(金) 21:37:59.38 .net
数学の基本なしで統計やるとこうなる見本だな

891 :132人目の素数さん:2014/04/26(土) 18:49:29.43 .net
最低でも数IIICはしないとダメだなという典型例か
今はCないらしいが

892 :132人目の素数さん:2014/04/26(土) 21:42:21.27 .net
>>888
前半は元に戻すんだから∫[(z1σ+μ, z2σ+μ] だな。
正規累積分布関数なら代入するだけ。(x-μ)/√(2σ^2)の部分に代入するだけで、
簡単に同じ式になることが分る。

893 :132人目の素数さん:2014/04/29(火) 20:47:00.77 ID:i+jeaL/Iz
条件付き確率分布でf(x|y;θ)とf(x|y,θ)という書き方を両方見る気がする
違いはあるのだろうか

894 :132人目の素数さん:2014/04/29(火) 20:49:01.01 .net
条件付き確率分布でf(x|y;θ)とf(x|y,θ)という書き方を両方見る気がする
違いはあるのだろうか

895 :132人目の素数さん:2014/04/29(火) 22:13:14.22 .net
a, b, c という具合に変数やパラメータを並べる際、cだけがaやbとは別種のもののとき、その違いを強調するために a, b; c と書くことがある
云わば「強い区切り」としてセミコロンを使う

896 :132人目の素数さん:2014/04/29(火) 22:15:42.00 .net
数式にそんな曖昧なルールが本当にあるのか?
単純に処理系の違いじゃないのか。

897 :132人目の素数さん:2014/04/29(火) 22:18:55.68 .net
コンピュータに入力するわけじゃないんだから、数式の書き方なんて慣習頼みである程度の表記揺れはあるよ
見ればすぐに分かる程度の揺れだが

曖昧というのとは少し違う

898 :132人目の素数さん:2014/04/30(水) 01:17:19.04 .net
定義は厳密だが表記は人次第

899 :132人目の素数さん:2014/04/30(水) 10:44:14.86 .net
ニュートンの時代の話?

900 :132人目の素数さん:2014/04/30(水) 11:13:14.34 .net
>>899
???

901 :132人目の素数さん:2014/04/30(水) 11:16:19.66 .net
>強調するために a, b; c
ねーよ。

902 :132人目の素数さん:2014/04/30(水) 13:17:34.48 .net
いや、あるよ
別に数学だけの慣習ではなく、英語一般に通じる話なんだけど>強い区切り

903 :132人目の素数さん:2014/04/30(水) 16:14:10.89 .net
高校の英語でも習う話だな

904 :132人目の素数さん:2014/04/30(水) 22:33:27.57 .net
音楽の記号使うか

905 :132人目の素数さん:2014/04/30(水) 22:51:56.80 .net
>>894
そのケースでは、意味に差の無い
単なる「強い区切り」でしょ、たぶん。
楕円関数なんかだと、区切りの書き方によって
パラメータの表示方法が違ったりするから、
一応、文脈に沿った確認は必要だが、
おそらく >>895 の言うとおり。

906 :132人目の素数さん:2014/05/01(木) 19:22:50.13 .net
曖昧に強調するためとかいうから勘違いする奴が出てくる。
ならボールド体や斜体表記でもいいだろということになる。

論理的に明確にコンマと区別したいから使うものだろう。
複数の数列とか行列とかコンマだけなら意味が不明確になる場合に。

907 :132人目の素数さん:2014/05/01(木) 20:33:02.37 .net
アホ現る

908 :132人目の素数さん:2014/05/09(金) 23:26:45.58 .net
統計についてほとんどわからないのですが、
あるゲームの中のイベントが発生する確率を調べたいと思っています。
例えば1000回試して10回起きたとしたら普通に計算すると発生確率1%になりますが
この結果が偏りではなく、実際の発生確率とほぼ同じかどうかを検証する方法ってありますか?

909 :132人目の素数さん:2014/05/10(土) 12:44:30.37 .net
無限回試してみればいい

910 :132人目の素数さん:2014/05/10(土) 13:02:04.24 .net
直感的に無理だと思うが

911 :132人目の素数さん:2014/05/10(土) 13:07:44.85 .net
じゃあ直感で判断すればいい

912 :132人目の素数さん:2014/05/10(土) 15:01:28.79 .net
ランダムは偏る場合もあるし、偏らない場合もある。
それは諦めて普通に推定すればいい。ほぼ同じかどうか知りたいんだから、
信頼度99%とかで発生確率を推定すればいいだろう。

913 :132人目の素数さん:2014/05/10(土) 16:34:37.71 .net
>>912
>信頼度99%とかで・・・・・・・・・・・・・・・・
モンテカルロ法で発生確率>>908をシミュレーションするとして、推定に
適用する信頼水準は、常用する99%でも95%でもなく、常用しない80%とか
60%にすると推定理論上何か問題があるのでしたっけ?

914 :132人目の素数さん:2014/05/10(土) 19:01:25.62 .net
何の問題もないよ。信頼度を落とせば、信頼区間は狭くなるだけ。
試行回数1000回を1万回にすれば精度もあがる。お好みでどうぞ。

915 :132人目の素数さん:2014/05/11(日) 06:24:42.58 .net
>>914
お好みでと言われるが、信頼区間幅を狭くして推定精度を上げても
その信頼度が60%なり50%なりだと、2回に1回はその推定値範囲内に
入らないわけで、算出はできるが実用にならないのではないか?

916 :132人目の素数さん:2014/05/11(日) 12:35:09.39 .net
それこそお好み

917 :132人目の素数さん:2014/05/11(日) 18:09:00.07 .net
このようなものは、χ^2検定が一般的
発生確率をp、試行回数をNとすると、
期待される成功回数はNpで、これをAと表すことにします。
失敗回数はN(1-p)で、これをBと表すことにします。
そして、実際試してみての成功回数がaで、失敗回数がb(=N-a)の時、χ^2と呼ばれる次の量
χ^2=(A-a)^2/A + (B-b)^2/B
を計算します。期待される量と、実際の回数が等しい場合は0になり、それからずれるほど
大きな値になるものです。これが、ある一定量を超えると、pがおかしいんじゃ無いかといえ、
今回の場合は自由度が1なので、3.84より大きいと危険度5%でおかしいといえるし、
6.63より大きくなると、危険度1%でおかしいといえる。

実際の計測が、1000回中10回ということなので、
発生確率を1%とすると、当然、χ^2=0で、おかしくない。
発生確率を1.5%とすると、χ^2=1.69で、おかしくない。
発生確率を2%とすると、χ^2=5.1で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
発生確率を0.5%とすると、χ^2=5.025で、危険度5%ならおかしいといえるが、危険度を1%にするとあり得る範囲となる。
...
と、こんな感じで、危険度をある一定の値で決めれば、それに対応する発生確率の範囲を狭めることができる。

918 :132人目の素数さん:2014/05/12(月) 17:19:53.25 .net
これはカイ自乗分布に従わないですね。

919 :132人目の素数さん:2014/05/12(月) 20:35:09.37 .net
>>915
信頼度には、常用される99%か95%を採用すべきだろ。類似ケース例と
比較し易いから。
しかし99%か95%が常用値にされたのは、どういう根拠からなんだろ?
根拠を書いた統計本を、未だ見たことがない。

920 :132人目の素数さん:2014/05/12(月) 20:53:25.98 .net
キリがいいし、人間の心的傾向による区分だよ。
1%で起こる確率は人はめったにない、めずらしいこととか感じる。
5%ぐらいになると、たまにある、時々あると感じる。
σ=1の中ならだいたいそんな感じ、ふつうにあるみたいな。

921 :132人目の素数さん:2014/05/12(月) 21:58:23.85 .net
根拠はないだろう
1・5・10はちょうどいいってだけで気にしなくてもいい
目的に応じて調節すれば問題ない

922 :132人目の素数さん:2014/05/12(月) 22:38:00.70 .net
根拠は明白。きりがいいから。

94.133%とか99.273%とか使う馬鹿はいない。誰が見てもきりが悪い。

923 :132人目の素数さん:2014/05/13(火) 06:44:07.04 .net
>>921
1・5・10はちょうどいいと、最初に用いたのはピアソンだったっけ?

924 :132人目の素数さん:2014/05/13(火) 23:09:59.99 .net
その年一番よかった曲を投票で決める際、一人が好きな曲を1位〜5位として投票することができる
投票した5曲は1位として選ばれたら10pt、5位なら6pt。と重み付けされて集計されて、
投票が終わったときに全員分のポイントが合計され、合計ポイントが高い順にランキングになる

こういう投票システムで、自分の選んだ曲を上位にするために多重投稿している奴がいてランキングが狂ってしまう場合
これを統計的に見破るにはどうしたらいいだろうか

1.多重投票者は特定の同一曲に複数回投票し、残りの曲をどうでもいい曲で埋める
2.多重投票者は同じ日、あるいはかなり近接した日に連続して投票する
3.多重投票する必要のない曲(多くの人が投票する曲)は多重投票する意味がないので投票されない

等、経験的な分析は考えられるもののいい処理の方法がわからん
何かうまい方法はないだろうか

925 :132人目の素数さん:2014/05/13(火) 23:13:28.64 .net
系列毎に決めればいいじゃないか。もちろん貢献度を考慮して。

926 :132人目の素数さん:2014/05/20(火) 06:47:53.93 .net
確率とか統計とか知りたいんですけどwikipediaの正規分布の項を見ても理解できないので
初歩の初歩だけでも教えてほしいのですが

エクセルで(1/6)^x*(5/6)^(1000-x)*COMBIN(1000,x)の式を
x=110〜220で計算してこのグラフを作りました
http://i.imgur.com/2N8bCXo.jpg
意味としてはサイコロを1000回振った時の1の出る回数の確率分布って感じなんですが
きれいな正規分布のように見えるのですがμとσがここからどう求まるのかが分かりません

このグラフ又は式からμ及びσの求め方を教えてください

927 :132人目の素数さん:2014/05/20(火) 08:17:46.77 .net
muは1000*1/6
sigmaはsqrt(1000*1/6*5/6)で近似できるだろうね
最尤推定で正規分布なら推定量は
muは標本平均
sigmaは標本標準偏差になるかな

928 :132人目の素数さん:2014/05/20(火) 08:41:47.56 .net
即レスありがとうございます
計算するとμ=166.7 σ=11.785くらいですね
なんとなくそれくらいなのはわかります
二項分布の公式のようなものが有るみたいですね
少し調べてます

総レス数 1001
231 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver.24052200