教育心理学も統計学
文科省によると、現代はキャリア教育の重要性が叫ばれている時代である。子供たちを取り巻く社会環境、産業・経済、雇用の事情は劇的に変化し続けている。そんな中、子供たちの学習能力におけるパフォーマンスを予測するために教育心理学を用いることが増えてきた。
心理学は統計的手法を武器にして物事の傾向を把握する学問であるが、教育に役立つ心理学を特に教育心理学という。そして統計技術は機械学習によって進化している。
ブラジルにあるFaculdade Independente do NordesteのHudson F. Golinoら研究者は、機械学習アルゴリズムにはいくつかのタイプがあり教育研究分野にも応用できる中で、Random Forest(ランダムフォレスト。機械学習アルゴリズムの一つ)の教育心理学における可能性に注目し、生徒を事前に成績上位クラスか下位クラスかを予測するモデルを作った。
成績予測をモデル化
Hudson F. Golinoらの研究成果の要点は以下の通りである。
ミッション 解決手法 結果 |
研究の詳細を以下で説明する。
教育心理学とAI
機械学習は比較的新しい科学分野であり、幅広い種類の計算と統計によって構成されている。
分類および回帰を実行するアルゴリズムには、いくつかのタイプがあり教育研究分野にも応用できる。
成績上位クラスと下位クラスを予測
H. F. Golinoらは学校の生徒の学業成績を予測するための心理測定と機械学習の分野を統合した比較的新しい非線形法を提示した。
サンプルは14歳から19歳までの高校生(10年生、男子が50.34%)135人で構成されており(M=15.44、DP=1.09)、かれらは三つの心理学的テスト
- 帰納推論発達テスト(TDRI)
- メタ認知コントロールテスト(TCM)
- Brazilian Learning Approaches Scale(BLAS-Deep Approach)
に回答した。
最初の2つのテストには自己評価スケールが付属しているので、5つの独立変数がある。
各試験/スケールに対する学生の反応をRaschモデルを用いて分析した。
元のサンプルのサブセットは、成績の高いクラス(n=41)と低いクラス(n=47)のバランスのとれた二つのクラスに学生を分離するために作成されたものであり、9つの教科からなる成績を用いている。
クラスのメンバーを予測するために、機械学習は非線形であるランダムフォレストというモデルを用いた。
2つのクラスを持つサブセットは、ランダムに交差検証のために2つ(トレーニング用とテスト用)に分けられた。
予測においてもっとも重要な変数
ランダムフォレストの結果はトレーニングセットにおいて精度は75%、特異度は73.69%、感度は68%であった。
検証セットでは、精度は68.18%、特異度は63.63%、感度は72.72%であった。
予測における最も重要な変数はTDRI(帰納推論発達テスト)*であった。2位はBLAS-Deep Approachで3位はメタ認知コントロールテスト、4位はTDRIのスケールで5位はTCMのスケールだった。
*帰納推論発達テスト:個別の事例から一般的な規則・法則を得る推論の能力の発達を測定する。
研究紹介は以上だ。
この研究のようにデータ分析によって、将来教育がより効率的に行われるようになるかもしれない。
この記事で取り扱った論文:H. F. Golino, C. M. A. Gomes, D. Andrade, “Predicting Academic Achievement of High-School Students Using Machine Learning”, Scientific Research”, Psychology, 2014, 5, 2046-2057 DOI