山口一大 計量心理学・教育測定学・ベイズ統計学 やま ぐち かず ひろ 公正さとテスト みなさんは、テストといえば、何をイメージするでしょうか。私は正直あまりテストが好きではありませんし、人に自分のことを評価されるのはあまり気分がいいものではないです。しかし、学校では定期テストがあり、模試があり、大学入試があり、社会に出てからも英語能力を示すテストや、様々な資格テストにあふれています。いずれのテストもテストを受けた人の特定の「能力」がどれくらい高いか低いかを見積もるために使われています。みなさんがこれまでに受けたテストでは、合計得点というものが、能力の高低を反映するものとして扱われていたのではないでしょうか。テストの得点に一喜一憂した経験は誰しもあることだと思います。 しかし、考えてみれば、テスト得点というのは不便なもので、違うテストをうけた人たち得点は比較できません。使っている問題が違うので当然です。しかし、「公平に能力を評価したい」と考えた場合このことは、問題になってきます。例えば、英語の能力の高さが就職を決めたり、収入を決め62 つくばの心理学 2023 研究アラカルト for 学ぶ人に優しいテストを目指して るとしたらどうでしょうか。異なったテストを受けた人たちを同じように評価することができるのでしょうか。実は、ある一定の条件がそろえば、テストの問題が違ったとしても、能力の比較ができるようになるのです。 そんな魔法のようなことを可能にするのが、「項目反応理論」とよばれる教育測定学の方法論です。項目反応理論は、PISA (Programme International Student Assessment) といった世界的な学力調査にも使われていますし、実はみなさんの身近なテストにも使われています。項目反応理論によって、異なったテストを使っても能力の比較が可能となり、学力の経時的な変化を追えるようになるといった可能となりました。この他にも項目反応理論により、コンピュータを使った効率的なテストの実施やテスト項目から能力を推定したときの不確実さをも含めて評価することができるようになりました。 序列化のためのテストと診断的なテスト しかし、項目反応理論は、基本的に能力の高低を精緻に検討するための方法論であ
元のページ ../index.html#64