なぜ私たちは学生のために統計をそんなに難しくするのですか?

X

プライバシー&クッキー

このサイトはクッキーを使用しています。 継続することにより、あなたはそれらの使用に同意します。 Cookieの制御方法など、詳細についてはこちらをご覧ください。

広告

(警告:長くてややウォンキッシュ)

あなたが私のような人なら、学部生が統計を理解するのに苦労しているという事実に絶えず不満を抱いています。 実際には、それは穏やかにそれを入れている:学部生の大部分は、単に統計を理解することを拒否し、あなたのコースで統計データ分析のための要件を言及し、あなたは目を転がす、うめき声、または(それは学期に十分に早い場合)コースドロップの発疹を取得します。

統計なしでは科学で推論を行うことはできないので、これは私を気にします*。 なぜ学生は非常に重要な何かにとても受容しないのですか? 無防備な瞬間に、私は統計が数学であり、彼らは数学を行うことはできませんことを、先験的に、自己実現の予言で決定したために学生自身にそれを責 私は数学を鈍くするために高校の数学の教師にそれを非難しました。 私は、彼らが数学を好きではない場合、彼らは生物学専攻になるべきであることを学生に伝えるための高校の指導カウンセラーにそれを非難しました。 私は彼らの子供が数学を嫌うことを可能にするために両親にそれを非難しました。 私もブギー**にそれを非難しました。

これらの当事者(ブギーを除く)はすべて有罪です。 しかし、私は私のリストがすべての中で最も有罪の当事者を除外したことを理解するようになりました:私たち。 「私たち」とは、数学の学科、統計の学科、または生物学の(gasp)学科にいるかどうかにかかわらず、統計を教える大学の教員を意味します。 私たちは学生のために統計を不必要に困難にしていますが、なぜ私は理解していません。

問題は上の画像–ウェルチのt検定を計算するために必要な式にキャプチャされています。 それらは算術的に少し複雑であり、ある特定の状況で使用されています: サンプルサイズと分散が等しくない場合の2つの平均の比較。 3つの平均を比較したい場合は、別の数式のセットが必要です。ゼロ以外の傾きをテストする場合は、別のセットが必要です。2つのバイナリ試行で成功率を比較したい場合は、別のセットが必要です。 そして、数式の各セットは、データに関する独自の特定の仮定のセットの正しさを与えられた場合にのみ機能します。

これを考えると、統計が複雑であると考える学生を責めることができますか? しかし、我々は彼らがそれがあると思うさせるために自分自身を責めることができます。 私たちは一貫して統計に関する単一の最も重要なことを強調していないので、彼らはそう考えています:この合併症は錯覚であるということです。 実際には、すべての有意性検定はまったく同じように動作します。

すべての有意性検定はまったく同じように動作します。 私たちは最初にこれを教え、頻繁に教え、大声で教えるべきです。しかし、私たちはそうではありません。代わりに、私たちは大きな間違いを犯します:私たちはそれによってwhizし、テストの後にテストを教え始め、テストの統計と分布の導出で学生に衝撃を与え、彼らの重要で根本的なアイデンティティよりもテスト間の違いにもっと注意を払います。 学生が統計を憤慨するのも不思議ではありません。

「すべての有意性検定はまったく同じように機能する」とはどういう意味ですか? すべての(NHST)統計的検定は、2つの簡単な手順で1つの問題に応答します。

:

  • 私たちは明らかなパターンを見ていますが、私たちのデータは騒々しいので、それが本当だと信じるべきかどうかはわかりません。

:

  • ステップ1. 私たちのデータのパターンの強さを測定します。
  • ステップ2。 自分自身に尋ねると、このパターンは信じられるほど強いですか?

問題を教えることは、そもそも統計の使用に動機を与えます(多くの数学で教えられたコース、およびほぼすべての生物学で教えられたコースは、これ 二つのステップを教えることは、学生に任意の仮説をテストするためのツールを提供します–それは彼らの特定のデータのための右の算術を選択するだけの問題であることを理解しています。 これは私達が落ちるようであるところである。

ステップ1は、もちろん、テスト統計量です。 私たちの仕事は、任意のパターンの強さを測定する数を見つける(または発明する)ことです。 そのような数を計算する詳細が、測定したいパターン(2つの平均の差、線の傾きなど)に依存することは驚くべきことではありません。 しかし、これらの詳細には、パターンの「強さ」の一部であると直感的に理解できる3つのことが常に含まれています(下図):見かけの効果の生のサイズ(Welchのt、2 あなたは、これらがウェルチの式で動作することを検査することによって見ることができます:平均が遠く離れている場合、tは大きくなり、サンプルは 残りはすべて面白くない算術的な詳細です。

推論比較

ステップ2はP値です。 つまり、仮定が満たされているか(ルックアップテーブルを使用できるか)、そうでないか(ランダム化を使用するか、別のテストに切り替える必要があります***)を知る必要があります。 すべてのテストでは異なるテーブルが使用されますが、すべてのテーブルは同じように機能するため、違いは算術的なものにすぎません。 任意のテストのP値は、真の根本的な効果がない場合に、私たちのものと同じくらい強い(またはより強い)パターンの確率です。 これが低い場合、私たちのパターンは驚異的な偶然の一致から生まれたと信じるよりも、実際の生物学から生まれたと信じたいと思います(Deborah Mayoはこ

もちろん、テスト間の違いには多くの詳細があります。 これらは重要ですが、二次的な方法で重要です:すべてのテストがどのように機能するかの根本的な同一性を理解するまで、違いを心配する意味はあ そして、それでも、違いは私たちが覚えておく必要があるものではなく、必要なときに調べるために知っておく必要があるものです。 そのため、1つの統計的検定–1つの統計的検定–を行う方法を知っていれば、それらのすべてを行う方法を知っています。

これは私が”料理本”の統計を教えることを提唱していることを意味しますか? はい、しかし、私たちが比喩を慎重に使用し、軽蔑的に使用しない場合に限ります。 料理本は調理についての全く何も知らない誰かに少し使用である;しかし一握りの基本原則を知っていれば、料理本はたくさんの異なった原料および異なった目的のための調理の状態によって、導く。 すべての料理人は料理本を所有しています。

だから、統計をすべて間違って教えているのであれば、ここでそれを正しく行う方法があります:基礎となるidの周りのすべてを整理します。 それから始め、それに多くの時間を費やし、計算ではなく、そのテストが2つのステップをどのように取るかについて、詳細な注意を払って1つのテス 「すべての学部生が知っておくべき8つのテスト」をカバーしようとしないでください。 統計的な問題を提供する:いくつかの実際のデータとパターンを提供し、その問題に対処するためのテストをどのように設計するかを学生に尋ねます。 正しい方法は一つもなく、あったとしても、根底にあるアイデンティティのステップを通して考えることの練習よりも重要ではありません。

: なぜ講師は、根本的なアイデンティティではなく、違いについての統計を作るのですか? わからないと言ったが推測できる

統計が数学者によって教えられているとき、私は誘惑を見ることができます。 数学的には、テスト間の違いは興味深い部分です。 これは数学者が彼らのチョップを示す場所であり、彼らは新しい状況で新しい食材から信頼できる結果を調理するために新しいレシピを発明する しかし、統計のユーザーは、数学者が巧妙であり、私たちは皆彼らに感謝していることを明記して喜んでいるので、私たちがする必要がある統計を行う仕事

統計が生物学者によって教えられているとき、謎はより深い。 私は思う(私は願っています!)統計を教える私たちのものは、すべてのテストの根底にあるアイデンティティを理解していますが、それはテストのパレードのアプローチから私たちを 一つの仮説: 私たちは、彼らのユニットの外で教えられている統計を不承認にすることができ、それがあるときに不十分な数学的厳しさを主張するために迅速で 数学的な詳細の多くに焦点を当てると、明らかな厳しさのベニヤが得られます。 私の仮説が正しいかどうかはわかりませんが、私は確かにそれと一致していた数学部門との議論の一部でした。

理由が何であれ、統計を複雑にすると生徒に本当のダメージを与えています。 そうじゃない 覚えておいて、すべての統計的なテストはまったく同じように動作します。 今日の学生に教えてください。

注:cookbook-statsメタファーに関するかなり異なるテイクについては、Joan Strassmannの興味深い投稿を参照してください。 私は部分的にしか彼女に同意しないと思うので、あなたも彼女の作品を読むべきです。

Christie Bahlaiによる別の関連作品はここにあります:「ねえ、統計についてリラックスしましょう」–しかし、分野を超えたNHSTについてのより広範なメッセージがありこんにちはあります。

最後に、統計を愛することを学んだ二人の生態学者の話です–そしてそれはたくさんの楽しみです。

©Stephen Heard([email protected])十月6, 2015

*^この記事では、頻度論的推論統計、または伝統的な「帰無仮説有意性検定」について説明します。 ベイズ法が優れているかどうか、およびP値が誤って適用されるかどうかについての議論はさておきます(P値の私の防衛を参照してください)。 私たちは推論的な統計をまったく必要としないという主張で嘲笑的に鼻を鳴らすことを控えるつもりです。

**^OK、実際にはそうではありませんが、そこにそれをスリップすると、これにリンクすることができます。 同様に、私はそれを雨のせいにし、カインのせいにし、ボサノヴァのせいにし、リオのせいにするように誘惑されています。 わかりました、私は今停止します;しかし私が逃したものを持っていれば、応答のリンクを落とさないためになぜか。

***^データを「別のテストに切り替える」として変換することも含めますが、そこに区別を付けたいのであれば、それは問題ありません。

コメントを残す

メールアドレスが公開されることはありません。

Previous post La Noche de los Rábanos:The Night of The Radishes
Next post 家族の夕食の重要性