我想创建一个在python中使用强化学习训练的神经网络.
X -> [ANN] -> yEstimate -> score! -> (repeat until weights are optimised)
我使用的那一刻Scikit学习,但似乎并没有被所有的神经网络的东西试图以适应yEstimate到yTarget.
yEstimate
yTarget
是否存在scikit-learn的秘密,或者是否有其他我不了解的图书馆来实现这一目标?
谢谢!