唐豆的秘密基地

#深度学习

西湖大学 RL 第七课:时序差分学习

西湖大学 RL 第七课:时序差分学习

西湖大学 RL 第五课:蒙特卡洛方法

西湖大学 RL 第五课:蒙特卡洛方法

西湖大学 RL 第六课:随机近似与随机梯度下降

西湖大学 RL 第六课:随机近似与随机梯度下降

交叉熵公式推导(为啥分类问题用交叉熵作为损失函数)

交叉熵公式推导(为啥分类问题用交叉熵作为损失函数)