搜索资源列表
SARA学习算法Java
- 强化学习算法
ReinforcementLearning
- 这是机器学习里面的强化学习的重要资料,主要介绍了强化学习的基本理论及实验和分析-This is inside the machine learning reinforcement learning important information, which mainly describes the basic theory of reinforcement learning and experimental and analytical
ReinforcementLearning
- 利用MATLAB实现Q学习,简单易懂,欢迎大家下载(Using MATLAB to implement Q learning)
ReinforcementLearning
- 马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。 强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。 强化学习就是:追求最大回报G 追求最大回报G就是:找到最优的策略π?。 策略π?告诉在状态s,应该执行什么行动a。 最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical model that can be used for the
Proximal_Policy_Optimization
- 强化学习可以按照方法学习策略来划分成基于值和基于策略两种。而在深度强化学习领域将深度学习与基于值的Q-Learning算法相结合产生了DQN算法,通过经验回放池与目标网络成功的将深度学习算法引入了强化学习算法。(Reinforcement learning can be divided into value-based learning and strategy based learning according to method learning strategies. In the fiel
reinforcement_learning
- 强化学习在阿里技术演进与业务创新,阿里强化学习在淘宝的应用(Strengthen learning technology evolution and business innovation in Al)
adhoc_routing-master
- adhoc_routing-master 基于强化学习的无线自组织网络路由协议实现(The implementation of ad hoc routing master routing protocol based on Reinforcement Learning)
Personae-master
- 基于强化学习的股票预测系统,内涵有监督学习和强化学习的代码(he stock forecasting system based on reinforcement learning contains the codes of supervised learning and reinforcement learning)
RL-Stock-master
- 使用强化学习完成股票预测。强化学习是机器学习的另一个分支,在决策的时候采取合适的行动 (Action) 使最后的奖励最大化。与监督学习预测未来的数值不同,强化学习根据输入的状态(如当日开盘价、收盘价等),输出系列动作(例如:买进、持有、卖出),使得最后的收益最大化,实现自动交易。(Using reinforcement learning to complete stock forecast)
SimulinkPendulumDQN
- DQN实现matlab强化学习,解决倒立摆问题(Dqn realizes matlab to strengthen learning and solve the problem of inverted pendulum)
Multi-Agent-Reinforcement-Learning-Environment
- 多智能体强化学习环境,用于开发强化学习算法(Multi agent reinforcement learning environment)
reinforcement-learning-master
- 在障碍物环境下的基于强化学习的单智能体与多智能体路径规划算法(Single agent and multi-agent path planning algorithm based on reinforcement learning in obstacle environment)
DDPG
- DDPG相关文章和代码,人工智能领域中强化学习经典算法(Ddpg related articles and codes)
DEEE_Q_NETWORK
- 深度学习强化学习神经网络Deep Q-learning Network代码(Deep learning dqn code)
9.14DQN-QL
- 深度强化学习一个简单的事例,用于深度强化学习而用(Deep reinforcement learning is a simple example for deep reinforcement learning)
q_learn
- 基于matlab实现强化学习算法中的Q-learning算法,进行训练(The Q-learning algorithm of reinforcement learning algorithm is realized based on MATLAB)
ddpg
- 使用深度强化学习中的ddpg算法学习玩游戏,让智能体学习最优策略。(The ddpg algorithm in deep reinforcement learning is used to learn to play games, so that the agent can learn the optimal strategy.)
强化学习=ppo算法
- 这个是关于强化学习的代码ppo。内容是边缘计算卸载。
强化学习-四旋翼-控制
- 基于强化学习的四旋翼控制模型,利用强化学习实现对四旋翼无人机的控制
无人机强化学习控制代码python
- 一个基于深度强化学习的无人机控制代码,python语言写的。