只为小站
首页
域名查询
文件下载
登录
2018-real-clone2-10.8s.rar
(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套 train and evaluation log
2024-04-08 16:59:03
2.5MB
强化学习
1
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真,这个是matlab自带的一个案例,在simulink入门60例中【Simulink教程案例50】,以该模型为例,对该模型进行介绍。
2024-04-08 10:23:07
228KB
matlab
DDPG
强化学习
1
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDP
强化学习
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。 使用说明 python版本: 3.10.13 依赖库:requirements.txt 安装依赖库:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
2024-03-12 21:16:32
53.97MB
1
基于深度
强化学习
的拟人化自动驾驶行为决策研究
(1)针对自动驾驶拟人化决策需要识别驾驶风格的需求, 基于客观驾驶数据和主观问卷分析了驾驶风格,提出了 种驾驶风格分类模型。 (2)针对驾驶员对驾驶安全性、舒适性和行车效率的需求, 分别基千深度Q网络(Deep Q Network, DQN)和优势演员评论家(Advantage Actor Criti c, A2C)两种深度
强化学习
算法建立了决策模型。 (3)针对当前自动驾驶决策不够拟人化的问题,基千表现更好的DQN决策模型提出了一种结合驾驶风格的拟人化决策模型。
2024-03-11 19:38:09
35.43MB
自动驾驶
深度强化学习
行为决策
毕业设计
1
pytorch实现的在线
强化学习
11种常见算法代码
这个资源是一个包含了使用 PyTorch 实现的11种常见在线
强化学习
算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26
6.68MB
pytorch
强化学习
python
1
动态避障 ROS机器人
强化学习
使用深度
强化学习
算法实现端到端的无人车避障 使用ROS和gazebo环境下仿真 python脚本编写
2024-02-24 20:12:35
4.42MB
python
1
精品--基于深度
强化学习
的部分计算任务卸载延迟优化.zip
精品--基于深度
强化学习
的部分计算任务卸载延迟优化
2024-02-05 23:31:06
4KB
1
论文研究 - 量子神经网络的分布
强化学习
传统的
强化学习
(RL)使用回报(也称为累积随机奖励的期望值)来训练代理学习最佳策略。 但是,最近的研究表明,学习学习收益的分布要比学习其预期价值具有不同的优势,如在不同的RL任务中所见。 从使用传统RL的收益期望到分配RL收益分配的转变,为RL的动力学提供了新见解。 本文基于我们最近的研究RL量子方法的工作。 我们的工作使用量子神经网络实现了分位数回归(QR)分布Q学习。 该量子网络在具有不同分位数的网格世界环境中进行了评估,说明了其对算法学习的详细影响。 还将其与马尔可夫决策过程(MDP)链中的标准量子Q学习进行了比较,这表明量子QR分布Q学习比标准量子Q学习可以更有效地探索环境。 RL中的主要挑战是有效的勘探以及开发与勘探的平衡。 先前的工作表明,可以从分布的角度采取更多有益的措施。 我们的研究结果表明了其成功的另一个原因:分布式RL的性能增强可以部分归因于其有效探索环境的卓越能力。
2024-01-10 23:17:13
627KB
连续变量量子计算机
量子强化学习
分布强化学习
分位数回归
1
基于
强化学习
+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真
matlab,
强化学习
MPC模型预测控制算法 基于
强化学习
+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真 使用matlab2021a或者更高版本运行!!!!
2023-12-08 09:42:15
5.87MB
matlab
强化学习
模型预测控制
《深入浅出机器学习》之
强化学习
本文来自于简书,本文章主要通过举例来论证机器学习算法,通过矩阵进行
强化学习
介绍。所谓
强化学习
就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号),那么Agent以后产生这个行为策略的趋势便会加强-《百科》
2023-11-26 20:28:26
507KB
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
基于YOLOV5的车牌定位和识别源码.zip
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
风电场风速及功率数据.zip
基于VMD算法的信号降噪.rar
科研伦理与学术规范 期末考试2 (40题).pdf
SSM外文文献和翻译(毕设论文精品).doc
transformer_pytorch_inCV.rar
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
基于Matlab的IEEE14节点潮流计算.zip
2019年秋招—华为硬件工程师笔试题目.pdf
最新下载
深度学习-猴痘病识别数据集
AION 改技能文件,谁用谁知道
InfoWorks ICM软件操作手册(中文)
QXDM5 安装包版本号:QXDM5.5.1.350.1可解析:LTE、NR包含:Qcat,QUTS,QXDM5
MATLAB 人工智能实验设计 基于BP神经网络的鸢尾花分类器设计
vim_plug_3.0
基于SpringBoot+Vue的甜品店购买及管理系统
(新华字典)汉字字典.rar
基于pytorch的LSTM时间序列预测的研究(交通流量预测)
嵌入式系统开发之道菜鸟成长日志与项目经理的私房菜
其他资源
石头-剪刀-布-数据集.rar
GJB 9001C-2017 质量管理体系要求
基于51单片机的智能小车避障
jsp个人信息管理系统
C#仿花生壳实现控制远程服务器
《软件测试》 课程设计
简单的MFC 多人在线聊天 客户端
ARToolKit安装包.7z
Python-3.5.10.tgz
iManager U2000 V100R002C00 网管最低硬件配置指导书V1.2-20100517-A.rar
gsoap2.8.11离线安装包
Xilinx 提供的高速多状态编码8b_10b编码器.7z
watch工具类.zip
海南大学《TCP IP网络编程》复习习题.pdf
Spring Tool Suite
ASP.NET聊天室课程设计
无需入侵制作个人专属黑页-附带黑页源代码.
cef_3.2171.1901_win32-xp及vs2017编译后的cefsimple项目
pycharm汉化包下载
C# 音频视屏格式转换很强大
net财务管理系统
搜集的webGL的资料和自己做的一些Demo
mysql导出word格式工具(可以导出数据字典)
基于JAVA的音乐音频视频播放器源代码
《Java语言程序设计第八版》基础篇/进阶篇 习题答案