強化法と消去法の優劣
高校1年の長男は最近毎日の通学で疲れているのか、夕食のあとリビングでずっとスマホをいじっていて、そのままうたた寝をしてしまうことがよくあります。
高校では生徒の1日の学習時間が平均3時間だそうで、その時間を目標に勉強を組み立てているのですが、うたた寝をしてしまうと勉強どころかお風呂に入って寝るのが精いっぱいになってしまいます。
それを見ながら、昔読んだヘキサポーンの話を思い出しました。
ポーンというのは将棋で言ったら歩にあたるチェスの駒で、前に一つだけ進めます。
ただ取るときは前に進む歩と違って左右斜め前の相手の駒を取り、取ったあとの場所に斜めに進みます。
そのへんは将棋とちょっと違います。
ヘキサポーンと言うのは3X3のマス目でお互いの側にポーンを3個ずつ配置してスタートし、最初に相手の陣地(相手側の3マス)に入ったら勝ちという単純なゲームです。
思い出した話というのは、ヘキサポーンで強化法と消去法、どちらの手法が早く強くなれるかという実験の話です。
思考システムとしてマッチ箱を使います。
考え得るすべての盤面を貼ったマッチ箱がお互いの側に用意されています。
そしてマッチ箱にはその盤面で指しうる手のビーズが入っています。
たとえばA、B、Cの手があるならA色10個、B色10個、C色10個のように。
目をつぶって1個のビーズを取り出し、その手を指すわけです。
そういう同じマッチ箱システムを使って、甲と乙は違うやり方で強くなろうとします。
甲(強化法):その手で勝ったらその色のビーズをマッチ箱に追加する。負けた場合はなにもしない。
乙(消去法):その手で負けたら、その色のビーズをマッチ箱から取り去る。勝った場合はなにもしない。
どっちが早く強くなったでしょうか?
結果は消去法の乙がより早く、強いプレイヤーになりました。
最適化を図るとき、良手を強化するより悪手をやめるのが早道だということです。
長男も、勉強をしなければ、とただ焦るよりは平日はスマホは基本触らない、というような消去法を採ったほうが早く好ましいスタイルに近づけるのではないかと感じたわけです。