2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

統計学Part15

1 :132人目の素数さん:2013/04/05(金) 23:35:41.08 .net
前スレ

統計学なんでもスレッド14
http://uni.2ch.net/test/read.cgi/math/1326471964/

113 :132人目の素数さん:2013/07/11(木) NY:AN:NY.AN .net
>>112
Rですか、使ったことがないです。
コマンドラインで動くからちょっとこれだけやりたい、というには難しそうですね。
とりあえずRスレに行ってみます。

114 :132人目の素数さん:2013/07/12(金) NY:AN:NY.AN .net
線形変換って何の為にあるの?

115 :132人目の素数さん:2013/07/13(土) NY:AN:NY.AN .net
例えば平均μ,分散σ^2の正規分布から平均0、分散1の標準正規分布に変換するのだって
線型変換だし他にもいろいろ使い道あるんじゃない?多変数になってくると特に
嘘だったらごめんね☆

116 :132人目の素数さん:2013/07/16(火) NY:AN:NY.AN .net
味噌汁の味見のように一事をもって万事を量るのが統計学の任務ですが、
世論調査などではちゃんとかき混ぜているのでしょうか?

117 :132人目の素数さん:2013/07/16(火) NY:AN:NY.AN .net
>>116
そんなものは調査デザインによる。
固有の調査名とその調査デザインが提示されない限り、
意味のない質問。

118 :132人目の素数さん:2013/07/17(水) NY:AN:NY.AN .net
測度論を使ってないから分りやすい統計学の本っていうけど
測度論を使った統計学の本なんてみたことないんだけど
本当にあるの?

119 :132人目の素数さん:2013/07/17(水) NY:AN:NY.AN .net
測度論そのものかは知らないけどLebesgue–Stieltjes integrationとかなら普通にあるんじゃね?
ただ理論そのものは俺も見たことはないなあ(^q^)オワッ

120 :132人目の素数さん:2013/07/18(木) NY:AN:NY.AN .net
コルモゴロフ本は確率を測度で定義してたと思うが不満か?

121 :132人目の素数さん:2013/07/18(木) NY:AN:NY.AN .net
確率論と統計学は違うだろ。

122 :132人目の素数さん:2013/07/18(木) NY:AN:NY.AN .net
>>119
マジかよ。その本教えろよ。
ルベーグステルチェス積分ってリーマンステルチェス積分とは違って
ルベーグ積分のステルチェス測度を使った積分だぞ?

123 :132人目の素数さん:2013/07/18(木) NY:AN:NY.AN .net
7/4宵、NHK「クローズアップ現代」曰く、目下統計学ブームだとか。番組冒頭には、狩野裕
阪大教授の講義光景が出てきた。統計家に企業求人が引く手数多というのは本当なのか?
”統計学を使いこなす「データサイエンティスト」が、多くの企業から引く手あまたの状況・・・・・・・・・・”
クローズアップ現代 「数字のカラクリ・データの真実〜統計学ブームのヒミツ〜」
ゲスト:サイエンス作家…竹内薫,成蹊大学教授・統計学者…岩崎学  キャスタ:国谷裕子
http://www.nhk.or.jp/gendai/yotei/#3375

124 :132人目の素数さん:2013/07/19(金) NY:AN:NY.AN .net
最近ビッグデータビッグデータって喧しいけど
データ分析で使う統計学に何か本質的な違いあるんですか?

125 :132人目の素数さん:2013/07/19(金) NY:AN:NY.AN .net
IT屋のビジネスだよ。
おまけでログのテキスト分析が付いていてそっちは原則統計だね。
ただ学術的に怪しい式が結構混じってる。

126 :132人目の素数さん:2013/07/19(金) NY:AN:NY.AN .net
>>125
ビッグデータビッグデータと喧伝し始めたのは、IT企業でなく
マーケティング業界でなかったか?
SNS上やInternet上に溢れるカテゴリデータを、商売にどう使おうかと。
学術的に怪しい式というのは、何を求める式のことなの?

127 :132人目の素数さん:2013/07/21(日) NY:AN:NY.AN .net
7/21NHK7時のニュースで臙脂色ワンピミニスカ江崎史恵アナが、国内宿泊旅行
統計棒グラフを指し示して、ここ10年で国民の国内宿泊旅行回数が年平均
1.5回から1.2回に漸減し続けており、その原因が斯く斯く然々と微笑みながら
説明していた。その棒グラフには、年代別折れ線グラフが重ね描きされた。
こういう統計って、誰がどのように採っておるのだろ?
Web検索すると、観光庁の「宿泊旅行統計調査」がhitしたんだが、調査対象が
旅館・ホテル事業者とあってニュースのとは違っていた。  

128 :132人目の素数さん:2013/07/21(日) NY:AN:NY.AN .net
旅行・観光消費動向調査

129 :132人目の素数さん:2013/07/23(火) NY:AN:NY.AN .net
朝倉書店の「ロジスティック回帰分析―SASを利用した統計解析の実際」を読むと、プロファイル(変数の組み合わせパターン別の発生件数とか)を作ってから係数を最尤推定するとあります。
一方Rのglm関数ではプロファイルは作らず観測値からIRLSで係数を推定するとありますが、この2つの方法での推定値って一致するんでしょうか?

130 :132人目の素数さん:2013/07/23(火) NY:AN:NY.AN .net
自分でやればわかるやろ

131 :132人目の素数さん:2013/07/23(火) NY:AN:NY.AN .net
2、 区間推定(分散):地域経済
我が国の都道府県別納税者1人当たりの課税対象所得額(万円/人)は正規母集団N(μ、σ2)を呈することが予想されている。いま任意の10都道府県についてこの値を調査したところ下記の数値を得た
 199.4, 177.9, 190.8, 241.9, 246.8, 213.9, 224.4, 226.1, 184.0, 200.5
1)このとき、全国平均μが未知であるとして母分散σ2を信頼係数95%で推定せよ
2)また、全国平均μが207.2万円であるとして母分散σ2を信頼係数95%で推定せよ

お前らの力を見せてみろ

132 :132人目の素数さん:2013/07/23(火) NY:AN:NY.AN .net
ふと思ったんだけど、中央値の逐次更新(オンライン処理)ってどうやるんだろう?
平均値とか分散ならちょっと計算したら漸化式にできるけど

133 :132人目の素数さん:2013/07/23(火) NY:AN:NY.AN .net
過去データ全部抱えていないと無理でね?

134 :132人目の素数さん:2013/07/23(火) NY:AN:NY.AN .net
収束する前提なら適当に分散推定しながら
中央付近のビンだけ更新しとけばできそうだな

135 :132人目の素数さん:2013/07/23(火) NY:AN:NY.AN .net
ある企業の発売以降の月次売上数(金額ではない)が、基本、対数近似を描くようだが、そんなこと、一般的に証明する方法はありますか?

136 :あぼーん:あぼーん.net
あぼーん

137 :132人目の素数さん:2013/07/24(水) NY:AN:NY.AN .net
>>131
なんだこのカス問は
>>136
ヤりたいですぅ!!

138 :132人目の素数さん:2013/07/24(水) NY:AN:NY.AN .net
対数近似を描くってなんぞ

139 :132人目の素数さん:2013/07/24(水) NY:AN:NY.AN .net
1月から4月までの売上数があれば、一年先の売上数が、対数近似を使うことである程度予測で来る

140 :132人目の素数さん:2013/07/24(水) NY:AN:NY.AN .net
>>135
>>139を過去のデータ使って確かめたらええやん

141 :132人目の素数さん:2013/07/24(水) NY:AN:NY.AN .net
過去データはエクセルで調べた
だいたい(9割程度)が対数近似のグラプに準ずる(一部累乗近似、線形も)

これって『統計学的に対数近似のグラフを描く』と言ってもいいのだろうか?

142 :132人目の素数さん:2013/07/24(水) NY:AN:NY.AN .net
対数近似って対数とると線形になるってことかな

143 :132人目の素数さん:2013/07/24(水) NY:AN:NY.AN .net
y = a × ln(x) + b
かな

144 :132人目の素数さん:2013/07/27(土) NY:AN:NY.AN .net
誰かいますか?

145 :132人目の素数さん:2013/07/27(土) NY:AN:NY.AN .net
>>141
予測区間の決定係数がその位なら問題ないだろ

146 :132人目の素数さん:2013/07/28(日) NY:AN:NY.AN .net
>>145
ありがとう!

147 :132人目の素数さん:2013/07/29(月) NY:AN:NY.AN .net
2つの母平均の差の検定で分散未知ですがn>30以上ならば、σの代わりに普遍分散で代用してZ検定するのと、等分散でなかった場合に用いるウェルチの検定の式は同じでしょうか?

Z=XbarA-XbarB/√SA2/nA+SB2/nB  →SA2はAの不偏分散です

そうすると、大標本であった場合は、先に等分散の検定をしなくてもこの公式に当てはめて計算してもかまわないのでしょうか?

148 :132人目の素数さん:2013/07/31(水) NY:AN:NY.AN .net
χ二乗検定の際に各セルの値が小さいとき連続修正を行う
とありますが、セルの期待度数が小さいとモデルへの当てはまりが悪いためであり
この修正によってモデルへの当てまりがよくなると言うことでした。
なぜ当てはまりがよくなるんですか?
統計素人なんでもしかすると超絶基本を聞いているかもと恐れながらも質問してしまいます。
どなたかよろしくお願いします

149 :132人目の素数さん:2013/08/01(木) NY:AN:NY.AN .net
一般論としてサンプル数が小さいとばらつきが大きい
つまり、たまたま外れる確率が高くなるということ

さらにサンプル数が小さいと分解能が悪いから精度が下がり易い
期待度数が0.5回なら観測頻度が0回でも1回でも誤差50%

150 :132人目の素数さん:2013/08/22(木) NY:AN:NY.AN .net
些細な名称とかに拘らず独自の統計学をとれば良いと思うんだよね
習った知識ばかりじゃカチンコチン過ぎて統計学止まりだね
統計で思考停止したいなら良いけど

151 :132人目の素数さん:2013/08/23(金) NY:AN:NY.AN .net
>>149
>さらにサンプル数が小さいと分解能が悪いから精度が下がり易い・・・・・・・・・・・・
サンプル数ってサンプルサイズ?分解能が悪いって、使用計測器の
性能問題?何が言いたいの?いったい何番の質疑へのレスなの?

152 :132人目の素数さん:2013/08/24(土) NY:AN:NY.AN .net
8/24NHK朝7時のニュースで鮭肉色膝上丈ワンピスカ江崎史恵アナが、国民の
スポーツ習慣統計調査の年代別頻度結果を円グラフ・帯グラフを使って
紹介していた。国が、国民3000人に訊ねて1800余人から有効回答の結果とも。
この手のアンケート調査の抜取標本数は、どういう計算式で決めているのだろ?

153 :132人目の素数さん:2013/08/26(月) NY:AN:NY.AN .net
ある無限集団のサンプルとしてなら3000で十分だと思うが、その調査で3000は意味が無いな。

おそらくは、老若男女、収入や労働環境、地域性や病気の有無、季節性その他で、
スポーツ習慣は違ったものになってしまうだろうからな。

そしたものを全部一緒にして年代だけ分けてドヤ顔するのは偏向報道のチョンNHKらしいな。

154 :カナリア:2013/08/26(月) NY:AN:NY.AN .net
質問させてください!
正規分布していないデータ(単純反応時間など)と正規分布しているデータ(IQなど)の相関を出そうとした場合、ピアソン積率相関係数ではだめですよね???
でも結構それで論文でてたりするんですが、いかがなものですか?
厳密にいうとだめってレベルなのでしょうか?
教えてくださーい

155 :132人目の素数さん:2013/08/27(火) NY:AN:NY.AN .net
>>153
無限集団というのは、幾つ以上をいうのですか?スポーツ習慣統計
調査>>152の場合、母集団は10代以上の日本国民ですから1億人以上
ですが、1億人では有限集団ということですね?
なお調査機関は、NHKでなく国と江崎史恵アナは云っておりました。

156 :132人目の素数さん:2013/08/28(水) NY:AN:NY.AN .net
統計学って全てのサンプルを調べられて
パソコンで計算可能なら確率論でしかないですよね?

157 :132人目の素数さん:2013/08/28(水) NY:AN:NY.AN .net
>>156
それのどこに確率的な要素があるの?

158 :132人目の素数さん:2013/08/28(水) NY:AN:NY.AN .net
平均値、標準偏差ね。
つまりヒストグラム=確率分布となるわけだよね。

159 :pH7.74:2013/08/29(木) NY:AN:NY.AN .net
SPSSによるロジスティック回帰の出力について質問失礼します(SPSS&元データ非所持)
(例) 応答変数:発病するか否か、説明変数:体重(量的変数)、場所(質的変数)
       B   標準誤差  Wald  自由度 …
体重   .087    0.44   3.858    1
場所               14.294   2
場所(1) 1.435   .461    9.687   1

場所のWaldの欄にある統計量は一体何でどのように算出されたものなのか、教えていただけますと幸いです

160 :132人目の素数さん:2013/08/29(木) NY:AN:NY.AN .net
>>159
「Wald検定量 ロジスティック回帰」で検索してはいかがでしょうか。
算出方法など詳しい解説がすぐに見つかると思います。

161 :132人目の素数さん:2013/09/01(日) 23:20:52.89 .net
あんまり数学がわかっていない人間ですが、質問させてください。
ある、時系列データがあり、過去の変動が次の変動にどのような影響を与えるか推測する方法はどんなものが基本でしょうか?
よろしくお願いいたします。

162 :132人目の素数さん:2013/09/01(日) 23:40:01.31 .net
ノバルティスの問題も、つまるところ当該の医学者に統計学の素養がないことが発端だろ?
迷惑だから、統計学勉強しないで税金使って論文書くの本当にやめて欲しい。
学問として論文を書くのであれば、測度論とまでは言わないが、統計学の前提となる確率論、確率論の前提となる積分ぐらい勉強すべき。これ、語学とおなじくらい重要と思うのだが。

163 :132人目の素数さん:2013/09/01(日) 23:40:16.75 .net
自己回帰モデル

164 :132人目の素数さん:2013/09/02(月) 01:12:02.14 .net
>>161
自己相関

165 :159:2013/09/02(月) 11:41:26.81 .net
>>160
返信遅れまして申し訳ございません、少し説明不足でした

体重や場所(1)のWaldに関しては、傾きや切片の推定値がゼロと
異なっているかを推定するためのWald統計量ということで理解できるのですが、
場所のWald欄にある統計量が一体何なのかが解らず困っております
私自身は解析にRを用いているのですが、その場合カテゴリカル変数一つに対して一つの
Wald統計量が算出されるため、上記のような統計量と遭遇したことがなく、どなたか教えていただけますと助かります

166 :159:2013/09/02(月) 15:10:19.98 .net
>>159下から2行目訂正失礼します
カテゴリカル変数一つに対して一つの > カテゴリカル変数の各水準に対して各一つずつの

167 :132人目の素数さん:2013/09/03(火) 15:24:35.67 .net
>>165-166
自己解決しました
Wald統計量は自由度2以上でも普通に算出できるのですね、失礼しました

168 :132人目の素数さん:2013/09/06(金) 18:54:39.01 .net
ときお
まどりっど
イスタンプール

169 :カナリア:2013/09/08(日) 17:23:02.99 .net
グラフにエラーバー(SD)をつけました。
縦軸に正答率をとると、80~90程度の平均値ですので、エラーバーが100を超えます。
個人的には100でとめたいのですが、だめっていう意見もあります。
皆さんの意見をお聞かせください。

170 :132人目の素数さん:2013/09/22(日) 16:02:21.69 .net
DCC-GARCHについて勉強したいのですが、日本語で詳しく説明されている論文、テキストなど教えてください。

171 :132人目の素数さん:2013/09/22(日) 16:32:33.61 .net
日本語あてにしてたらアカンやろ

172 :132人目の素数さん:2013/09/23(月) 00:46:34.67 .net
すいません初学者なのですが、2つの水準の平均値差を検定する場合に、t検定を行った場合と、分散分析を行った場合では、意味合いは違うと理解してよろしいのでしょうか?(教科書では分散分析は3群以上比較する場合に使うと書いてありますがあえて2群でやった場合です)
t検定のtと、分散分析のFは、計算式も違いますし分布の形状も違いますが、いくつかのサンプルデータで統計ソフトをつかって計算したところ、t検定でも分散分析でも有意確率が同じ値になりました。これはたまたまでしょうか?

173 :132人目の素数さん:2013/09/23(月) 10:25:13.75 .net
現実的な最低点は、max(0,70-3.5*10)

174 :132人目の素数さん:2013/09/26(木) 00:59:32.90 .net
おまえら
シグマっていったら。

やっぱり
σ の方か?

175 :132人目の素数さん:2013/09/27(金) 22:32:18.33 .net
大文字小文字両方

176 :132人目の素数さん:2013/09/27(金) 22:37:19.24 .net
ttp://www.bun-eido.co.jp/publish/high/series/sigma_bq.html

177 :132人目の素数さん:2013/09/28(土) 00:26:45.06 .net
統計学に必要な数学の知識ってなに?

微積分と線形代数学分かってればいいの?

178 :132人目の素数さん:2013/09/28(土) 03:13:21.26 .net
大学1年レベルの微積と線形代数わかってるとかなり便利
もちろんもっと高度な知識も必要な場合もあるけど目的次第かな

179 :132人目の素数さん:2013/09/28(土) 03:36:38.64 .net
>>178
ありがとう
こちとら文系で数2Bしかやってないもんだから
今から小島寛之の微積分と線形代数やろうかなぁと思いまして
本当はチャートとか高校生が使うようなもので勉強した方がいいのかな?

180 :132人目の素数さん:2013/09/28(土) 03:48:33.82 .net
>>179
高校数学はIIICまではある程度理解しておいたほうがいいのは確か
でもチャートとかは量が多すぎるからなぁ…
IIBやってたなら小島寛之の本にもついていけるかも

181 :132人目の素数さん:2013/09/28(土) 10:15:04.78 .net
>>177
そんなあなたにマセマ

182 :132人目の素数さん:2013/09/28(土) 17:39:01.41 .net
 
統計学って数学じゃないだろコレ

183 :132人目の素数さん:2013/09/28(土) 18:54:23.30 .net
「プログラミングのための確率統計」(オーム社)これ、近年まれにみる良書。
タイトルからのイメージとは全く異なり、プログラム技法は何も記されていない。
しかし、初学者に確率統計のかんどころを理解させようとする著者の工夫と執念を感じる。

184 :132人目の素数さん:2013/09/28(土) 20:52:19.06 .net
>>182
統計学は数学じゃなく算数だね 経験則

185 :132人目の素数さん:2013/09/29(日) 05:19:32.19 .net
吉田朋広の数理統計学ぐらいだと普通に数学と思うけどなぁ

186 :132人目の素数さん:2013/09/29(日) 19:23:38.93 .net
統計学は数学を使う

187 :132人目の素数さん:2013/09/29(日) 20:14:45.15 .net
応用算数でしょ普通の統計学は

188 :132人目の素数さん:2013/10/01(火) 01:25:11.85 .net
算数レベルで公式が出せるか

189 :132人目の素数さん:2013/10/01(火) 01:57:19.89 .net
算数レベルの統計しか知らないってことか

190 :132人目の素数さん:2013/10/01(火) 04:21:56.72 .net
標本数の少ない2項分布の母集団の差の検定ってどうやればいい?
標本数少ないから正規近似が出来ないのだけど。

191 :132人目の素数さん:2013/10/01(火) 07:55:34.87 .net
>>190
マクネマー検定でいいんじゃない。

192 :132人目の素数さん:2013/10/02(水) 00:24:59.73 .net
 
古典統計学⊂ベイズ統計学 だよね?

193 :132人目の素数さん:2013/10/02(水) 13:16:11.78 .net
東京大学教養学部統計学教室編『基礎統計学』(全3巻)はどうですか?

194 :132人目の素数さん:2013/10/02(水) 23:23:36.53 .net
>>193
全部買って読んだけど、独学するには解説が足りない気がするが、ネットで調べながらならOKだと思う
個人的には第2巻いらんかった。

195 :132人目の素数さん:2013/10/03(木) 10:43:02.09 .net
全三巻じゃないし・・・・
バラバラに買うやつだろ。

196 :132人目の素数さん:2013/10/11(金) 13:15:08.34 .net
ポアソン分布とかガンマ分布とか出てくるけど、あれも算数?

197 :132人目の素数さん:2013/10/11(金) 15:32:38.62 .net
学校の課題で会計士への連絡内容書くやつあるんだけどどうな風に書けばいいの?
ぐぐっても分からないので教えてください

例題
会計士にアイスの平均販売個数の値を連絡する

198 :132人目の素数さん:2013/10/11(金) 17:01:30.33 .net
>>197
10月11日 今日は暑かったのでアイス100個売れました。

199 :132人目の素数さん:2013/10/12(土) 19:52:25.56 .net
http://kohada.2ch.net/test/read.cgi/part/1355033626/574

偏差値の部分、勢いで書いちまったんだけど、間違ってないよな?

200 :132人目の素数さん:2013/10/12(土) 20:45:28.23 .net
偏差値50=平均値ってこと?あってるよ

201 :132人目の素数さん:2013/10/12(土) 21:39:14.58 .net
だよな?
偏差値50は平均だから、偏差値50レベルの大学には半分が受かるってことでいいんだよな?

202 :132人目の素数さん:2013/10/12(土) 22:07:16.12 .net
分布に偏りがある場合は偏差値50でも半分受からないことはあるぞ

203 :132人目の素数さん:2013/10/12(土) 22:17:47.12 .net
平均と中央値は違うからね

204 :132人目の素数さん:2013/10/12(土) 22:19:59.01 .net
>>199
そのスレの581の方が正しいな
対称正規分布とかいう言い方は意味わからんけど

205 :132人目の素数さん:2013/10/12(土) 22:43:27.86 .net
対称でさえあれば正規分布である必要はないけどな

206 :132人目の素数さん:2013/10/13(日) 16:00:01.08 .net
偏差値は母集団が正規分布に近いときに有効だからかな
変な分布なら偏差値を使う意味が薄れる

207 :132人目の素数さん:2013/10/13(日) 18:16:36.27 .net
最近の学力の分布は二極化が激しいからなあ
偏差値50で等分できるかは怪しいぞ

208 :132人目の素数さん:2013/10/13(日) 18:27:16.35 .net
???

209 :132人目の素数さん:2013/10/16(水) 09:23:56.28 .net
http://ebsa.ism.ac.jp/
統計学の絶版の本が無料で沢山読める
ホームページ見つけたよ。
お礼はいいからね。

210 :132人目の素数さん:2013/10/16(水) 09:34:53.46 .net
danke

211 :132人目の素数さん:2013/10/16(水) 12:52:45.86 .net
なにこれめっちゃいいじゃん

212 :132人目の素数さん:2013/10/18(金) 00:04:58.09 .net
「古典統計学⊂ベイズ統計学」ということでいいの?

総レス数 1001
231 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver.24052200