ISBN/价格: | 978-7-5198-7037-9:CNY88.00 |
---|---|
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 基于Python的强化学习/.(美)安德里亚·隆萨(Andrea Lonza)著/.刘继红,王瑞文译 |
出版发行项: | 北京:,中国电力出版社:,2023 |
载体形态项: | 265页:;+图,照片:;+24cm |
提要文摘: | 本书首先介绍在强化学习环境中工作所需的工具、库和设置,涵盖了强化学习的构成模块,深入探讨基于值的方法,如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外,在学习DDPG和TD3确定性算法之前,读者将学习策略梯度方法,如TRPO和PPO,以提高性能和稳定性。本书还介绍模仿学习的原理,以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。 |
并列题名: | Reinforcement learning algorithms with python eng |
题名主题: | 软件工具 程序设计 |
中图分类: | TP311.561 |
个人名称等同: | 隆萨 (美) (Lonza, Andrea) 著 |
个人名称次要: | 刘继红 译 |
个人名称次要: | 王瑞文 译 |
记录来源: | CN 91MARC 20230304 |
记录来源: | CN TSG 20240102 |