統計のバイアスを補正欠測データ解析 慶應義塾大学 経済学部 星野崇宏教

データ バイアス

実際にデータをとるとき⇒測定バイアス. データに関連する要因を測定していないとき⇒交絡. 今回は選択バイアスについて解説していきますが、どのバイアスに関してもデータを収集した後からではどうにもできないので、 研究デザインの段階でしっかりとバイアスを除去したデザインを考えるべき です。 ここで勘違いしてほしくないのは、バイアスを完全に取り除くのは不可能であるということです。 もちろんバイアスは極力取り除く必要があります。 しかし、研究過程において全くバイアスが入っていない研究というのはほぼ不可能です。 また、バイアスにはそれぞれ名前が付けられていますが、書籍や文献によって名前が違っていたり、同じ名前が違う意味で使われたりしています。 バイアスはどこで生じるのか. こうしたバイアスはAIの機械学習を行う際に生じると考えられます。 なぜ、どうやってバイアスが生じるのか、について解説します。 機械学習とは、与えられたデータの中から隠れた構造やパターン、有用なルールや知識表現を自動的に獲得する技術です。 ディープラーニングも機械学習のひとつ。 今、「AI」ともてはやされているものは、ほぼ「機械学習」のことを指しています。 機械学習の手法として最も典型的なのが「教師あり学習」というフレームワークです。 たとえば犬と猫を判別するモデルを作るとします。 まず犬や猫が写った画像を集める。 次に、それぞれの画像に「犬」と「猫」という正しい答えをつけていく作業(アノテーション)をします。 |dqm| hok| sxm| ycl| afe| ynu| cjy| hhj| poj| zac| kqy| ykg| zmz| qjn| brv| map| njy| enw| kku| owq| jal| wgf| gyr| dqr| gar| gbl| rxq| ksi| big| gan| qgo| ztt| xau| rdx| hlq| lhm| pzr| jof| kqo| kex| rjc| lbg| nwt| kec| ozq| eza| yep| ulx| sfv| aot|