cocolog:91662496
以前述べた第一マシン・第二マシン・第三マシンによる学習のアイデア。まず実験してみた。逆伝播を学習するアイデア、「負の学習」を応用するアイデアはまずまずうまくいったが、結局、ランダムで単純な学習には負けてしまってショックを受けた。 (JRF 0835)
JRF 2020年2月 7日 (金)
《Predictor - Actor (- Recollector) モデルと負の学習》
http://jrf.cocolog-nifty.com/software/2020/02/post-c87651.html
JRF2020/2/72127
その記事の感想を繰り返す。
カエルのジャンプの井戸を超えるイメージと、おもちゃの自動車の両者を満たすものとして、MountainCarConitnuous が与えられていたのは天啓のようにも感じた。が、それを結局はうまく活かせなかったのが残念だった。
JRF2020/2/76870
「負の学習」を応用できる…といったあたりでかなりテンションが上がったのだが、落ち着いてランダムで単純な学習と比較すると全く負けていることがわかりショックを受けた。実験は失敗だったと評価できる。
しかし、問題は今後の展開である。簡単にできるところはやりつくした感がある。そのため、この先はまったく見えない。この先を考えるのは、少し時間がかかるかもしれない。
JRF2020/2/76902
他のことをまずしたいが、父の死から三年になるまでになんとか収入の道を見つけたく、これまでのように遊んではいられないという焦りみたいなものがある。にもかかわらず、何をすれば良いのか、見えない。特に収入につながりそうなことは。
他のことから見れば、今回の実験も遊んでいるようにしか見えないかもしれないが、私には一番、有望だと感じているところだった。
きっぱり言えば、それが潰えた。残念だ。
JRF2020/2/76791
以前 [cocolog:91382428] で述べた第一マシン・第二マシン・第三マシン。それを Predictor - Actor - Recollector モデルと名付けて OpenAI Gym の MountainCarContinuous を改造したものの学習をする実験を行った。
JRF2020/2/72696