2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

統計学Part15

1 :132人目の素数さん:2013/04/05(金) 23:35:41.08 .net
前スレ

統計学なんでもスレッド14
http://uni.2ch.net/test/read.cgi/math/1326471964/

728 :132人目の素数さん:2014/03/04(火) 17:25:47.21 .net
逆だな
絶対値<ニ乗<四乗<六乗<八乗てか

729 :132人目の素数さん:2014/03/04(火) 20:29:50.26 .net
>>647, 685
>絶対値だと1、2、3、4、5も0、3、3、3、6も同じになる
??
分子のみだけど、
> sum(abs((1:5)-mean(1:5)))
[1] 6
> sum(abs(c(0,3,3,3,6)-mean(0,3,3,3,6)))
[1] 15
そもそも全然違うのだけど。

730 :132人目の素数さん:2014/03/04(火) 20:39:33.89 .net
おいw

731 :132人目の素数さん:2014/03/04(火) 20:40:12.36 .net
>>729
なにそれ。

732 :729:2014/03/04(火) 20:55:18.23 .net
ごめん、やっぱり合ってたわ。タイポした。
> sum(abs(c(0,3,3,3,6)-mean(c(0,3,3,3,6))))
[1] 6

733 :132人目の素数さん:2014/03/04(火) 21:14:50.53 .net
数学会の世界を揺るがす小保方さん出現か!とおもった。

734 :132人目の素数さん:2014/03/04(火) 21:19:30.65 .net
このスレのレベルをよく表しているじゃないか

735 :132人目の素数さん:2014/03/05(水) 08:08:36.75 .net
誰か>>702の解答おねがいしまう

736 :132人目の素数さん:2014/03/05(水) 08:28:22.52 .net
緑本は知らんが特異点を持つ変換は嫌われる

737 :132人目の素数さん:2014/03/05(水) 14:33:28.95 .net
いろんな問題集があるんだね

738 :132人目の素数さん:2014/03/05(水) 16:47:51.75 .net
記述統計の側から眺めていても、
なぜ絶対偏差でなく2乗なのか
なぜ3乗や4乗でないのかの
スッキリした説明は出てこない。

標準偏差の生まれは正規分布のパラメータであって、
標本標準偏差はデータを正規分布からの標本と
見た場合の正規分布の推定量と考えれば、
2乗でなければいけない理由づけができる。

正規分布が登場する理由は、中心極限定理。

739 :132人目の素数さん:2014/03/05(水) 17:31:04.61 .net
だとすると、
大学で統計入門時によく使われる説明、
「絶対値は扱いづらから」という旧来の説明は
必ずしも正しくないということになるのかな?

740 :132人目の素数さん:2014/03/05(水) 17:37:10.17 .net
えっ、何がどうして「だとすると」になるの

741 :132人目の素数さん:2014/03/05(水) 17:54:16.48 .net
上の方で、「絶対値は扱いづらい」からと言っている
流れから。おかしいかな?

742 :132人目の素数さん:2014/03/05(水) 17:58:31.69 .net
すごくおかしい

743 :132人目の素数さん:2014/03/05(水) 18:03:32.98 .net
不偏標準偏差でなく標本標準偏差を使う理由とか
計算が楽だからとしか言いようがない部分もあるが、
なぜ2乗か?に必然性を持たせようとするならば、
正規分布を経由したほうが物語性があるだろう。
「歴史的経緯で」じゃ、あまりにもツマラナイし。

744 :132人目の素数さん:2014/03/05(水) 18:07:35.69 .net
なんで、言葉に、引っかかってるのがわからない。
あなたの言っている通りでしょ。

だから、絶対値は扱いづらい。という言葉で済ますのは良くないし
歴史的経緯で済ますのは良くないでしょ。

どこに引っかかったの?

745 :132人目の素数さん:2014/03/05(水) 18:13:11.35 .net
>>743
言っていることは正しいと思うんだけど
困ったことに、正規分布は歴史的に後から出てきてるよね。
正規分布にこだわらずなんじゃないだろうか。

746 :132人目の素数さん:2014/03/05(水) 19:53:37.14 .net
標準偏差だの正規分布だのが
アリガタがられる理由は、
中心極限定理以外に
思いつかないんだがなあ。

747 :132人目の素数さん:2014/03/05(水) 19:56:29.40 .net
もう諦めて答えを見てはどうか。

748 :132人目の素数さん:2014/03/05(水) 20:10:58.60 .net
歴史的には標準偏差の方が、正規分布や中心極限定理より後に出てきたらしいが。
正規分布や中心極限定理は、ド・モアブル、ラプラス、ガウスあたり。
標準偏差はピアソン。

749 :132人目の素数さん:2014/03/05(水) 21:43:27.00 .net
二乗にも、いろいろ事情があるもんだ

750 :132人目の素数さん:2014/03/05(水) 22:58:24.62 .net
ざぶとん

751 :132人目の素数さん:2014/03/05(水) 22:59:49.30 .net
いくつぐらいになったらオヤジギャグに笑えるようになるかという統計データがほしいです。

752 :132人目の素数さん:2014/03/05(水) 23:55:00.73 .net
ここは
この板のレベルが分かる書き込みだな
だろう

753 :132人目の素数さん:2014/03/06(木) 00:12:31.79 .net
>>749
数学において難解な二乗は
「愛の事情」
弱ったことにマイナスしか出てこない

754 :132人目の素数さん:2014/03/06(木) 23:29:11.45 .net
平均値と、中央値、(もしくは最大値、最小値も加えて)から
最頻値mode を推定することができますか?

755 :132人目の素数さん:2014/03/07(金) 00:42:33.41 .net
無理

756 :132人目の素数さん:2014/03/07(金) 01:00:44.42 .net
>>754
分布がわかってれば
できることもあるけど

757 :132人目の素数さん:2014/03/07(金) 01:19:19.24 .net
正規分布でも仮定するんだろ
母集団平均の推定と同じだが

758 :132人目の素数さん:2014/03/07(金) 01:55:46.82 .net
まさか平均0で標準偏差1の場合だったりして

759 :132人目の素数さん:2014/03/07(金) 03:18:38.62 .net
>>757
エスパーさんか

760 :754:2014/03/07(金) 13:02:30.53 .net
ありがとうございます。やはり無理そうですかねえ。
分布は正規分布ではないですが、偏りのある一峰の山のある分布を前提としています。

何故、このようの事を考えているのかといいますと。
Rで計算をしていますが、modeが標準の関数にないということ。(パッケージがあるのは承知しています)
正しくmodeを計算するには、ヒストグラム(度数分布)を求めないといけなくて、サンプルセット数(サンプル数でなく)
が多くて計算量が多くなりすぎること。ビン幅も個別に設定しなければならないこと。

以上のことから、もっと簡易にmodeが求められたらいいのにと思った次第です。
すくなくとも、(最大値-中央値)=Aか、(中央値-最小値)=Bとすると、AかBかの
小さい方の範囲にmodeがあるはずです。
また、平均値と中央値の差が大きければ、modeも中央値より離れていると想定できます。

そのあたり何かアイデアがないでしょうか。

761 :132人目の素数さん:2014/03/07(金) 14:07:00.02 .net
ヒストグラムなんぞ使うな、累積分布にしとけ
累積分布ならビン幅などいらんぞ
ヒストグラムより本質的な累積分布を軽視するのは教育の欠陥だ

762 :132人目の素数さん:2014/03/07(金) 18:31:15.29 .net
すきにすればいいだろ

763 :132人目の素数さん:2014/03/07(金) 19:22:54.06 .net
当然だ、自業自得にすぎん

764 :132人目の素数さん:2014/03/07(金) 20:09:37.43 .net
>>761質問の意味解っているなら、答えてやれよ。

765 :132人目の素数さん:2014/03/07(金) 20:32:45.80 .net
これ結構難しいんじゃないの

766 :132人目の素数さん:2014/03/07(金) 23:01:01.56 .net
様々な一峰の分布を調べて、
(最頻値-中央値) と (中央値 - 平均値) の相関を求めて、相関があるといえるなら、
(最頻値-平均値) ÷ (中央値 - 平均値) を計算しそれをAとする。
求める 最頻値 は、A × (中央値 - 平均値)

でどう?

767 :132人目の素数さん:2014/03/07(金) 23:35:21.81 .net
>>760
平均値と中央値と最頻値は独立に指定できる

768 :132人目の素数さん:2014/03/08(土) 00:49:52.87 .net
モードのオンライン更新ってできまいのかな

769 :132人目の素数さん:2014/03/08(土) 09:38:56.41 .net
例えば1,2,2,1,1,2,2,...みたいにモードが収束しないサンプル列に対して
何らかの意味で効率的なオンライン更新則が作れるか考えてみたらいい

770 :132人目の素数さん:2014/03/15(土) 07:25:39.51 .net
大学の数学の教科書、あまりの誤植の多さはポアソン分布に従っているとはとてもじゃないけど思えない。
刊行後も出版社のサイトで気軽に正誤表をアップできちゃえるからって、著者も出版社側も書籍作りに対して甘え過ぎだ。

771 :132人目の素数さん:2014/03/15(土) 13:26:29.01 .net
身内の個人出版感覚なのかもシレン
教授が執筆した小部数書籍に校閲のプロを雇うのは予算的に無理だろうし

772 :132人目の素数さん:2014/03/15(土) 13:51:50.89 .net
大学数学レベルだと正誤を判断できる人が少ないしなぁ
出版前にミス減らすのは難しいだろう

773 :132人目の素数さん:2014/03/15(土) 14:57:44.21 .net
>>770
tex使って書いて、校正も自分でやってるんじゃないの?

774 :132人目の素数さん:2014/03/15(土) 16:10:52.76 .net
大学の数学関係なく、日本の出版は誤植だらけ。
大半がマカーだから仕方がない。

775 :132人目の素数さん:2014/03/15(土) 22:24:51.54 .net
つめが甘いのは、糖尿病だからだ。
研究職の人は、運動しないから。

776 :132人目の素数さん:2014/03/16(日) 03:08:27.56 .net
アル中かニコチン中だから集中力が続かないんだよ。

777 :132人目の素数さん:2014/03/16(日) 22:46:25.66 .net
アルコール中毒と
アルコール依存症は
別のもの。

778 :132人目の素数さん:2014/03/17(月) 10:34:44.88 .net
比較的易しめな教科書を使って統計学を自習してるんだが、天下り的に書いてあることが、「定理」なのか「法則」なのか「経験的にうまくいく手法」なのか書いて無くてもやもやする。
例えば、「母分散が未知な商標本の推定/検定にはt分布を用いる」と書いてあって、それはt分布はそのような推定を正しく行えるという定理なのか?それともt分布を使うとうまくいくと経験的に知られているということなのか?

数学的に厳密な本を読めばちゃんと書いてあるのかな?

779 :132人目の素数さん:2014/03/17(月) 10:35:43.41 .net
あ、改行してなかったごめん

780 :132人目の素数さん:2014/03/17(月) 13:47:43.56 .net
書いてあるわけねー
定理は書いてるだろうが、定理と法則の違いは何だ?

781 :132人目の素数さん:2014/03/17(月) 18:34:18.60 .net
定理じゃないか

782 :132人目の素数さん:2014/03/18(火) 00:13:43.73 .net
ちゃんと書いてあるよ

○○が正規分布に従うとき××はt分布に従う
自由度nのt分布はn→∞で正規分布に弱収束する

とかね
予備知識として測度論を仮定するけど

783 :132人目の素数さん:2014/03/18(火) 00:51:57.22 .net
すっきりしたいならルベーグ積分まで勉強してから吉田朋広の数理統計学を読むといいぞ

784 :132人目の素数さん:2014/03/19(水) 14:56:35.88 .net
例えば、0〜100の範囲の実数を考えます。

Aは、1,5,10,12,40,42,43,70,75,76 (10個)
Bは、2,4,6,10,12,41,43,74(8個)
Cは、5,6,22,23,50,51,52,55,62,63,70(11個)

以上のようなデータがあります。
これらABCのデータの相関関係を調べたいのですが
それぞれのデータ総数はことなっています。

ですのでエクセルでいうところのcorrel関数は
使えません。
だからといって、それぞれ相関がないとも言えません。
AとBの方が、AとCの相関より高い気がします。

こういったデータの数の異なる場合の相関の求め方を教えてください。
または、Rでの関数がありましたらお教えください。

785 :132人目の素数さん:2014/03/19(水) 15:31:28.09 .net
個数が違うのに相関がある…?
別の分析方法を模索すべきでは

786 :132人目の素数さん:2014/03/19(水) 15:41:10.68 .net
なるほど、相関とは言えないのですね。
各ABCがそれぞれ似ている度合を調べたいのです。
どういう方法がありますでしょうか?

787 :132人目の素数さん:2014/03/22(土) 01:24:58.62 .net
似ているとは何か

788 :132人目の素数さん:2014/03/22(土) 23:51:23.93 .net
>>787
質問に質問返しとな?あほですか。

>>784
とりあえず、ABCの集合について、0から100を10で区切り、
ヒストグラムを求める。
10で区切った分布の数を、ABCで相関係数で求める。
以上。

789 :132人目の素数さん:2014/03/23(日) 13:07:48.14 .net
>>784
A,B,Cのそれぞれの近さを見るとしたら
分布の類似度を見るということにして
カルバックライブラーあるいはエントロピーあたりの
情報量を利用したほうがいいんじゃないだろうか。

790 :132人目の素数さん:2014/03/24(月) 15:46:49.50 .net
質問です。
ロジスティック回帰と二項ロジットモデルの違いについて教えてください。
同じ、としているものや微妙に違う、としているものがあって困ってます。

791 :132人目の素数さん:2014/03/25(火) 00:19:26.68 .net
同じでいいと思う派
あえて言うならロジスティクス回帰の一つに二項ロジットがあるって感じかな

792 :132人目の素数さん:2014/03/27(木) 21:52:46.28 .net
質問です。

AグループとBグループの2つのグループがあるとします。
それぞれのグループの2種類の要素を抜き出し、
その要素間を比較した際に、ABグループに
有意差があるかどうかを見たいのですが、
正規分布するかどうかは予想できない物として、
どのような検定が見合っているのでしょうか?

設問が抽象的なのでもうちょっと具体的な例示をすると、


和食(Aグループ)と洋食(Bグループ)で、
それぞれ「食事量」「怪我の治る日数」という要素を抜き出し、

「食事量が多いほど、怪我の治りが早い。
 特に洋食グループほうが、やや治りが早い」

というように、ABグループのもつ要因(食事量)が、
最終的に「怪我の治り」に影響するかどうか、
みたいなことを調べたいのです。

793 :132人目の素数さん:2014/03/28(金) 14:34:03.30 .net
学部1年からやり直しなさい

794 :132人目の素数さん:2014/03/28(金) 14:48:15.29 .net
>>792
>具体的な例示をすると、
めちゃくちゃ

795 :132人目の素数さん:2014/03/28(金) 15:27:23.57 .net
めちゃくちゃ、とか書かれても何のヒントにもならないんだけど、
例が悪いってことかな?


じゃあ、別の例を設定すると、

ある遺伝病を持つグループ(Aグループ)と持たないグループ(Bグループ)があり、
ある程度相関認められている第一要因と第二要因について、
特定の治療後に第一要因と第二要因を測定した場合、
Aグループの第二要因の平均改善率のみ高いとする。

この場合に、その上昇を誤差であるのか、有意差であるのかを検定する場合に
どんな検定法が考えられるのか、が知りたいのです。

遺伝病の有無をダミー変数化して、3要因に対してフリードマン検定をかけ、有意差が拾えた場合に多重比較する、という手順であってますか?


上司の論文用のデータを揃えるために統計学を今年から独習し始めたのですが、
完全独習なので周りに先生といえる人が存在せず(上司自体も統計が得意ではない)、
自分のロジックがあっているのかどうかが判断できなくて困ってるんです。

796 :132人目の素数さん:2014/03/28(金) 17:13:15.83 .net
めちゃくちゃなのは君の上司w

797 :132人目の素数さん:2014/03/28(金) 19:03:29.63 .net
exactly

798 :132人目の素数さん:2014/03/29(土) 10:38:04.02 .net
>>792
件数がどれくらいかわからないけど、
クロスとってカイ二乗の値みて、違いの有無を
判断したらどう?
データ件数が、すご〜く多いと、なんでも有意になっちゃうけど。

799 :132人目の素数さん:2014/03/29(土) 10:42:50.93 .net
上司に相談してセミナーに参加するなり、大学の先生を紹介してもらえ
そうしないと今流行の捏造になります、といえば

800 :132人目の素数さん:2014/03/29(土) 21:16:16.26 .net
>>798
結局、第一要因と第二要因の比率をとり、
A群、B群間の比率を比較することにしました。

ありがとうございました。

801 :132人目の素数さん:2014/03/29(土) 21:49:47.78 .net
>>800
まあ、同じことですね

802 :132人目の素数さん:2014/03/31(月) 00:49:09.14 .net
overall standard deviationとwithin standard deviationとの違いを教えてください

803 :132人目の素数さん:2014/04/01(火) 00:39:27.60 .net
>>802
名詞句と副詞句

804 :132人目の素数さん:2014/04/01(火) 07:15:16.63 .net
e+πが無理数であることを証明できた!!!苦節5年ううう

805 :132人目の素数さん:2014/04/01(火) 07:28:53.06 .net
>>802
まさに言葉のとおり

まとめて見るか
グループごとに見るか

806 :132人目の素数さん:2014/04/01(火) 08:53:52.96 .net
>>804
俺には、むりっすう

807 :132人目の素数さん:2014/04/01(火) 13:10:38.57 .net
>>804ええ?e+πが無理数であることを証明?eが有理数であろうが無理数であろうが、πが無理数なら足せば無理数なのは自明ではないか?

808 :132人目の素数さん:2014/04/01(火) 13:21:06.67 .net
無理数+無理数は有理数にもなる

809 :132人目の素数さん:2014/04/01(火) 13:57:59.68 .net
>>807
e+π:無理数は未だに証明されてないんだ.
たしか証明されているのは,e+π,eπの少なくとも一つは超越数であるということだけ.

810 :132人目の素数さん:2014/04/01(火) 14:05:17.36 .net
今日はエイプリル・フールということもあり、真に受けない方がいいぞ。
統計のスレで数論の話がいきなり出ることは何か不自然だろ。

811 :132人目の素数さん:2014/04/01(火) 14:15:02.77 .net
群論から統計に来た先生知ってる

812 :132人目の素数さん:2014/04/01(火) 14:17:13.06 .net
エイプリル・フールって本当はエイプリルフールという表記でいいのか。
「・」が必要なのかと思ってた。

813 :132人目の素数さん:2014/04/01(火) 14:22:50.91 .net
>>811
多分、グラフ理論とか組合せ論の間違いだろ。
組合せ論関係なら、有限群関係で大多数の人が組合せ論に移ったという事実がある。

814 :132人目の素数さん:2014/04/01(火) 14:30:25.95 .net
>>813 中学生の時に通ってた有名高校受験塾でやらされた青チャート数学T(現在の赤チャート)で順列組み合わせをやって、面白いパズルみたいだと思ったことがある。

815 :132人目の素数さん:2014/04/01(火) 14:32:03.82 .net
有名高校受験塾に通ってたんですか
それはようございましたね

816 :132人目の素数さん:2014/04/01(火) 14:37:03.95 .net
>>814
本格的な組合せ論になると、有限群の表現論とか解析とか用いるようになる。
受験数学とは感覚が全く異なる。
色々なモノを用いる数学というか何というか。

817 :132人目の素数さん:2014/04/01(火) 17:54:37.06 .net
>>804
エイプリルフールの誤爆でした

818 :132人目の素数さん:2014/04/02(水) 09:37:15.52 .net
>>811
>>804
エイプリルフールの誤爆でした

819 :132人目の素数さん:2014/04/02(水) 21:10:24.91 .net
>>412
>最強の「学問」だ・・・・・・・・・・・・・
と、2013年に吹聴した東大医学部卒だが医学科でなく生物統計学専攻とか
のたまう胡散な御仁が、今度は『全国民のための統計解析』を宣教し
始めたようだが、傾聴に値するのかな?
1億人のための統計解析 仮説は最初に立てるな!  2014年3月25日
http://business.nikkeibp.co.jp/article/opinion/20140324/261652/

820 :132人目の素数さん:2014/04/02(水) 23:22:43.98 .net
医学科にいたら統計なんて下々の学問に手を染めたりしないだろうから
経歴としてはむしろ妥当なんじゃないかと思うが、読むに値するかは知らん。
ビジネス啓蒙書なら整理術とか記憶術とかと同じ枠で考えて判断すれば?

821 :132人目の素数さん:2014/04/02(水) 23:28:29.86 .net
>>819
医学部だった?学部の時は計数工学あたりかと思ってた。

822 :132人目の素数さん:2014/04/03(木) 09:35:01.29 .net
>>819
医学部「保健学科」

823 :132人目の素数さん:2014/04/03(木) 15:32:48.45 .net
>>822
医学部看護学科だよ。

824 :132人目の素数さん:2014/04/03(木) 19:17:35.95 .net
衛看か、俺の頃は唯一女子学生しか居ないところだったが

825 :132人目の素数さん:2014/04/03(木) 19:30:48.01 .net
八田ちゃんか

826 :132人目の素数さん:2014/04/03(木) 22:03:16.05 .net
>>823
東大看護学科卒ということは、八田亜矢子、小正裕佳子同様に理U
入学組ということか?

827 :132人目の素数さん:2014/04/04(金) 09:30:25.66 .net
>>824は多分大昔の話、理?、文?とか別枠で衛生看護学科(4年生)
入学資格女子のみ、ただし最初の2年は駒場で一般教養をやってたから
女性の少ないあの頃の東大生は初恋の相手が彼女達というのが多かった。
詳しくはwikiへ

828 :132人目の素数さん:2014/04/04(金) 20:37:32.94 .net
そう、大きく変わってるからね。
統計に関しても、国内の一つの柱になってる。

総レス数 1001
231 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver.24052200