欠驱动机器人强化学习算法仿真及结果分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ta iin l o tol rw r w t e c n l so h tt i ag rt m a k o o e r t b e g i,a h a i r d t a n r l e d a h o cu i n t a h s lo i o c e h c n ma er b tg t mo e sa l at tt e s me t me, i r v h b lt o o e c me t e so e d su b n e a d sr n t e h l i g r b sn s . mp o e t e a i y t v r o h l p it r a c n te g h n t e wak n o u t e s i
欠驱 动 机 器 人强 化 学 习算 法 仿真 及 结 果 分 析
臧希 糖, 王晓林 , 吴晓光 , 刘鑫宇
( 尔滨工 业大 学 机 电工程 学 院, 哈 黑龙 江 哈尔滨 100 ) 50 1 摘 要 : 对纯被 动机 器人 对 环境 变化敏 感 ,抗 干扰 能力 差等 问题 , 出了一种 基 于 Sra A 针 提 as( )强
行走 。
被动 行走进 行研 究 , 现此 类 机器 人 对 自身 结 构参 发 数要 求高 、 境 适 应 能力 差 、 定 范 围小 且 步态 单 环 稳
一
随着 被动 机器人 样机 复 杂 程 度 的增 加 , 对控 制 算 法 的研 究 也 变 得更 加 成 熟 。 n o7 E d j利用 C G神 P 经元 振子 调节 控制参 数 , 制 5杆半 被 动 机 器人 获 控 得稳 定步 态 ; sn l 出虚 拟重 力方法 , 过 驱 动 A a o8 提 通 力模 拟重 力 场 控 制 机 器 人 在 平 地 行 走 ; se 利 Wi s 用 Q 学 习分 别 以 能量 和速 度 作 为优 化 目标 成 功学
ap rme r o t f e l r h o n eligP ot l rbsd o h as( ) rif c m n e rig w s aa t s pi zd a oi m fru d r n D cnr l ae n te Sra A eno e e tl nn a e n i g t y oe r a
第 1 卷 第 2期 1
2l 02年 4月
江 南 大 学 学 报( 然 科 学 版) 自
J u n l f in n nUnv ri ( t r l ce c dt n o r a a g a ie s y Nau a S in eE i o ) o J t i
Vo .1 No 2 1 1 . Apr . 2 2 01
ZANG - h W ANG a -i W U a ・ u ng, LI Xi y Xiz e, Xi o ln, Xi o g a U n- u
( c o l f e h nc l n lcr a E gn ei g H r i s tt o e h o g , abn 1 0 0 ,C ia S h o o c a i dE e t c l n ie r , abn I t ue f c n l y H r i 5 0 1 hn ) M aa i n n i T o
p o o e e e . h o o d lwi n e n o tol rwe e b iti h n io me to t DE. C mp r d w t r p s d h r T e r b tmo e t k e s a d c n r l r u l n t e e v r n n fMa O h e o a e ih
化学习的底层 P D控制嚣参数优化算法。 M tD 在 a E环境下建立双足有膝 关节机 器人模型并进行 O
控制 器设 计。 通过 与传 统控制 器仿真 结果 的对 比分 析 ,得 出该 算法 可使 模 型 获得 更加 稳 定 的行 走
步 态 ,同时提 高 了 系统抵抗斜 坡扰 动 的能 力 , 强机 器人 的行走 鲁棒性 。 增 关键词 :被 动行 走 ; 强化 学 习; 双足 ;as( S ra A)学 习
Ab t a t F r u l a sv y a cwak n o o e st e t h h n e o n io me t n o r n a t i t re e c s r c : o l p s i e d n mi l i g r b ts n ii ot e c a g f vr n n d p o n i n e f r n e, f y v e a i —
(D P W)概 念并成 功设 计 一款 纯被 动 无 膝关 节 机器 人样 机 , 在 重 力 作 用 下 沿 一 定 倾 角斜 面 稳 定 行 仅 走 , 失能 量 由重 力势 能 补偿 J此 后 , 多学 者对 损 。 很
的A I SMO机器 人行 走能 耗是 人 类 1 左 右 。 欠 0倍 而 驱 动机器 人 的控 制 只需 施 加相 对 很 小 的控 制 力 矩 , 在保 证 步 态 自然 拟 人 的 特 性 下 实 现 高 效 率 稳 定
中 图分 类号 :P2 文献 标识 码 : 文章 编号 :6 1—74 (0 2 0 T 4 A 17 17 2 1 )2—03 12—0 5 Si ul ton f r Pa sv na i a ki bo s d o m a i o s i e Dy m c W l ng Ro tBa e n Re nf r e e a ni go ihm i o c m ntLe r ng Al rt
Ke o d : as ed n mcw lig rif c m n ann , ie ,Sra A erig yw r s p si ya i akn , e o e et erig bp d as( )l nபைடு நூலகம் v nr l a
Mc er 于 2 G e… 0世 纪 9 O年 代 提 出 被 动 行 走
欠驱 动 机 器 人强 化 学 习算 法 仿真 及 结 果 分 析
臧希 糖, 王晓林 , 吴晓光 , 刘鑫宇
( 尔滨工 业大 学 机 电工程 学 院, 哈 黑龙 江 哈尔滨 100 ) 50 1 摘 要 : 对纯被 动机 器人 对 环境 变化敏 感 ,抗 干扰 能力 差等 问题 , 出了一种 基 于 Sra A 针 提 as( )强
行走 。
被动 行走进 行研 究 , 现此 类 机器 人 对 自身 结 构参 发 数要 求高 、 境 适 应 能力 差 、 定 范 围小 且 步态 单 环 稳
一
随着 被动 机器人 样机 复 杂 程 度 的增 加 , 对控 制 算 法 的研 究 也 变 得更 加 成 熟 。 n o7 E d j利用 C G神 P 经元 振子 调节 控制参 数 , 制 5杆半 被 动 机 器人 获 控 得稳 定步 态 ; sn l 出虚 拟重 力方法 , 过 驱 动 A a o8 提 通 力模 拟重 力 场 控 制 机 器 人 在 平 地 行 走 ; se 利 Wi s 用 Q 学 习分 别 以 能量 和速 度 作 为优 化 目标 成 功学
ap rme r o t f e l r h o n eligP ot l rbsd o h as( ) rif c m n e rig w s aa t s pi zd a oi m fru d r n D cnr l ae n te Sra A eno e e tl nn a e n i g t y oe r a
第 1 卷 第 2期 1
2l 02年 4月
江 南 大 学 学 报( 然 科 学 版) 自
J u n l f in n nUnv ri ( t r l ce c dt n o r a a g a ie s y Nau a S in eE i o ) o J t i
Vo .1 No 2 1 1 . Apr . 2 2 01
ZANG - h W ANG a -i W U a ・ u ng, LI Xi y Xiz e, Xi o ln, Xi o g a U n- u
( c o l f e h nc l n lcr a E gn ei g H r i s tt o e h o g , abn 1 0 0 ,C ia S h o o c a i dE e t c l n ie r , abn I t ue f c n l y H r i 5 0 1 hn ) M aa i n n i T o
p o o e e e . h o o d lwi n e n o tol rwe e b iti h n io me to t DE. C mp r d w t r p s d h r T e r b tmo e t k e s a d c n r l r u l n t e e v r n n fMa O h e o a e ih
化学习的底层 P D控制嚣参数优化算法。 M tD 在 a E环境下建立双足有膝 关节机 器人模型并进行 O
控制 器设 计。 通过 与传 统控制 器仿真 结果 的对 比分 析 ,得 出该 算法 可使 模 型 获得 更加 稳 定 的行 走
步 态 ,同时提 高 了 系统抵抗斜 坡扰 动 的能 力 , 强机 器人 的行走 鲁棒性 。 增 关键词 :被 动行 走 ; 强化 学 习; 双足 ;as( S ra A)学 习
Ab t a t F r u l a sv y a cwak n o o e st e t h h n e o n io me t n o r n a t i t re e c s r c : o l p s i e d n mi l i g r b ts n ii ot e c a g f vr n n d p o n i n e f r n e, f y v e a i —
(D P W)概 念并成 功设 计 一款 纯被 动 无 膝关 节 机器 人样 机 , 在 重 力 作 用 下 沿 一 定 倾 角斜 面 稳 定 行 仅 走 , 失能 量 由重 力势 能 补偿 J此 后 , 多学 者对 损 。 很
的A I SMO机器 人行 走能 耗是 人 类 1 左 右 。 欠 0倍 而 驱 动机器 人 的控 制 只需 施 加相 对 很 小 的控 制 力 矩 , 在保 证 步 态 自然 拟 人 的 特 性 下 实 现 高 效 率 稳 定
中 图分 类号 :P2 文献 标识 码 : 文章 编号 :6 1—74 (0 2 0 T 4 A 17 17 2 1 )2—03 12—0 5 Si ul ton f r Pa sv na i a ki bo s d o m a i o s i e Dy m c W l ng Ro tBa e n Re nf r e e a ni go ihm i o c m ntLe r ng Al rt
Ke o d : as ed n mcw lig rif c m n ann , ie ,Sra A erig yw r s p si ya i akn , e o e et erig bp d as( )l nபைடு நூலகம் v nr l a
Mc er 于 2 G e… 0世 纪 9 O年 代 提 出 被 动 行 走