控制与决策  2020, Vol. 35 Issue (8): 1833-1840  
0

引用本文 [复制中英文]

雷荣华, 陈力. 空间机器人基于比例因子识别的自校正反馈神经网络容错算法设计[J]. 控制与决策, 2020, 35(8): 1833-1840.
[复制中文]
LEI Rong-hua, CHEN Li. Scaling factor identification based self-tuned feedback neural network fault-tolerant algorithm design for space robot[J]. Control and Decision, 2020, 35(8): 1833-1840. DOI: 10.13195/j.kzyjc.2018.1481.
[复制英文]

基金项目

国家自然科学基金项目(11372073)

作者简介

雷荣华(1990−), 男, 博士生, 从事空间机器人动力学与容错控制的研究, E-mail: m160210012@fzu.edu.cn;
陈力(1961−), 男, 教授, 博士生导师, 从事空间机器人动力学与控制等研究, E-mail: chnle@fzu.edu.cn

通讯作者

雷荣华(1990−), 男, 博士生, 从事空间机器人动力学与容错控制的研究, E-mail: m160210012@fzu.edu.cn

文章历史

收稿日期:2018-10-29
修回日期:2019-04-11
空间机器人基于比例因子识别的自校正反馈神经网络容错算法设计
雷荣华 , 陈力     
福州大学 机械工程及自动化学院,福州 350116
摘要:针对执行器发生部分失效故障的空间机器人, 提出一种基于比例因子识别的自校正反馈神经网络容错算法.首先, 针对无故障系统设计一种常规的神经网络控制算法; 然后, 利用比例因子观测器对真实的比例因子进行识别; 最后, 将该神经网络控制算法与识别的比例因子相结合, 得到一种具有容错功能的自校正反馈神经网络控制算法.控制器与观测器的稳定性判据均由Lyapunov函数法严格给出, 并通过数值仿真表明所提出控制策略的可行性.
关键词空间机器人    执行器故障    比例因子    观测器    神经网络    容错控制    
Scaling factor identification based self-tuned feedback neural network fault-tolerant algorithm design for space robot
LEI Rong-hua , CHEN Li     
School of Mechanical Engineering and Automation, Fuzhou University, Fuzhou 350116, China
Abstract: A scaling factor identification based self-tuned feedback neural network fault-tolerant algorithm is proposed for space robot systems with partial loss of actuator effectiveness. Firstly, a conventional neural network control algorithm is designed for the fault-free system. Then, the real scaling factors are identified by using the scaling factor observer. Finally, a self-tuned feedback neural network fault-tolerant control algorithm is obtained by combining the above neural network control algorithm with the identified scaling factors. The stability criteria of observers and controllers are given strictly based on Lyapunov function method. Numerical simulation verifies the feasibility of the control method.
Keywords: space robot    actuator fault    scaling factor    observer    neural network    fault-tolerant control    
0 引言

空间机器人是一类由自由漂浮的载体基座(航天器)与关节连杆组成的非线性多体系统, 它可以协助宇航员执行高风险的出舱任务[1-3].其执行器由于频繁地运行控制指令, 极易发生部分失效故障, 从而影响系统的控制精度与稳定性.空间机器人处于资源紧缺的太空环境中, 其故障电机通常无法得到及时维修, 因此, 设计合适的容错算法以提高空间机器人的自主运行能力具有较大的工程意义.

执行器故障可分为偏差式故障和比例式故障, 分别用偏差因子和比例因子对故障程度进行描述, 空间机器人的部分失效故障属于比例式故障.目前, 相关领域学者对故障的识错容错进行了广泛研究, 并取得了丰富的成果[4-13].对于存在偏差式执行器故障的一类非线性随机系统, 文献[4]利用广义模糊滑模观测器对故障进行了估计.对于存在比例式执行器故障且状态不可测的非线性系统, 文献[5]设计了一种自适应模糊分散容错控制器.对于一类同时存在偏差式和比例式执行器故障的非线性系统, 文献[6]提出了一种基于动态面技术的自适应模糊容错控制算法.对于存在外部干扰与比例式执行器故障的非线性直升机系统, 文献[7]引入了一种自适应神经网络容错控制器, 并利用干扰观测器实现了对外部干扰的估计.针对一类具有不确定参数和比例式执行器故障的非线性系统, 文献[8]设计了一种基于滑模观测器的无速度反馈容错控制算法.针对存在比例式执行器故障与外部扰动的一类线性系统, 文献[9]提出了一种基于迭代学习与LMI (linear matrix inequality)技术的鲁棒容错控制策略.对于同时存在偏差式执行器故障与传感器故障的Markovian跳跃系统, 文献[10]利用增广滑模观测器对这两类故障进行了重构.

尽管上述容错算法取得了良好的控制效果, 且文献[4]和文献[10]还利用滑模观测器对偏差因子进行了估计, 然而, 这些控制策略均未对比例因子进行估计.如果能对比例因子进行准确识别, 则可对执行器的故障程度进行评估, 从而为空间机器人的在轨服役寿命预测提供参考.当前, 针对执行器比例因子识别的研究鲜见报道.值得一提的是, 上述部分针对一般非线性系统的自适应或鲁棒容错算法通常要求系统模型的惯性参数和状态变量满足线性分离条件.然而, 对于欠驱动的空间机器人, 这一条件是难以满足的.与基座固定的地面机器人不同, 空间机器人的载体基座不受外部力或力矩的作用而处于自由漂浮状态, 其系统的惯性参数与状态变量是高度耦合的.因此, 空间机器人执行器的容错算法设计难度较大.

针对执行器发生部分失效故障的空间机器人, 本文利用比例因子观测器对实际的比例因子进行识别, 再将一种常规神经网络控制算法与识别的比例因子相结合, 得到一种具有容错功能的自校正反馈神经网络控制算法.该观测器的设计独立于上述的线性分离条件, 可用于一般非线性系统执行器的比例因子识别.

1 空间机器人系统容错问题描述 1.1 系统动力学建模

漂浮基空间机器人的平面结构如图 1所示.其中: θ0为载体姿态角, θi(i=1, 2, ..., n)为关节连杆转角.利用拉格朗日法可推导出系统的动力学微分方程为

图 1 漂浮基空间机器人系统
(1)

其中: q=[θ0, θ1, ..., θn]T为系统模型的状态变量(广义坐标), D(q)∈ R(n+1)×(n+1)为模型的正定对称惯性矩阵, 为哥氏力与离心力列向量, τ=[u0, u1, ..., un]为系统的控制输入.

空间机器人的控制输入来源于自身的电机驱动系统, 该系统由动力装置、传动装置以及控制器组成.当前, 控制器内嵌的主控芯片通常具备密集的外设引脚及较强的浮点运算能力, 能够实现绝大多数复杂控制算法的求解[14-15].控制器将传感器(陀螺仪与激光雷达等)所采集的系统状态信号加以处理, 并下达控制指令至执行单元, 从而控制载体与关节连杆的转动.

1.2 子系统动力学模型

将空间机器人的每个分体视为一个子系统, 并从系统动力学方程(1)中分离出局部变量, 可以得到子系统的动力学微分方程[16]

(2)
(3)

其中: Di(qi)为子系统的惯性参数项, 为子系统哥氏力与离心力项, τi分别为向量τ的第i个元素, Dij(q)和分别为矩阵D(q)和的第ij个元素, 为相邻子系统之间的交联项.

定义第i个子系统的状态向量为xi=[xi1, xi2]T , 则式(2)可以表示为如下状态空间方程的形式:

(4)

其中: .

当执行器发生部分失效故障时, 第i个子系统的动力学模型可描述为

(5)

其中: τi=piτi; pi(0≤ pi≤1)表示第i个执行器的比例因子(即实际输出力矩与理想输出力矩的比值), 其值越小表示执行器故障程度越高.当0 < pi < 1时, 表示执行器部分失效; 而pi=0与pi=1分别表示执行器彻底失效与完全正常.本文仅考虑执行器的部分失效故障与完全正常两种情形.

实际空间机器人的惯性参数通常是不确定的, 因此, 不妨假定均是未知的.本文的控制目标是对故障子系统(5)设计一种容错控制算法, 使得空间机器人在执行器发生部分失效故障的情况下, 载体姿态和关节连杆能抵达期望位置.空间机器人系统的闭环控制结构如图 2所示.

图 2 空间机器人系统闭环控制框图
2 自校正反馈神经网络容错算法设计 2.1 无故障系统的神经网络控制算法设计

定义第i个子系统的位置误差及滤波误差为

(6)
(7)

其中: xi1d为第i个子系统的期望位置, λi为正常数.

假设1  交联项满足以下有界条件[17]:

(8)

其中: dij>0, Sj=1+|sj|+|sj|2.

将式(7)对时间t求导, 并利用式(4)可得

(9)

由于RBF (radial basis function)神经网络能以较快速度及任意精度逼近未知光滑非线性函数, 定义gi(qi)的理想神经网络逼近分别为fi(qi, , 即

(10)
(11)

其中: θifθig为神经网络的理想权值向量, σif(qi, )和σig(qi)为基函数向量, εifεig为逼近误差, εi1εi2为正常数.

定义分别为理想权值θifθig的估计, 则理想神经网络gi (qi, θig)的估计值可分别描述为

(12)
(13)

定义权值θifθig的估计误差分别为, 则有

(14)
(15)

定义神经网络的全局估计误差为

(16)

假设2  全局估计误差ωi满足以下有界条件:

(17)

其中ξi为正常数.

需要注意的是, 神经网络的逼近误差εifεig是有界的; 而空间机器人的电机因自身的物理条件限制, 其输出力矩不可能无限大, 故τi也是有界的.由此可知, 全局估计误差ωi也是有界的, 故假设2不失一般性.

定义, 无故障子系统(4)的神经网络控制算法设计为

(18)

其中: ki为正常数, 分别为ξiδi的估计值.

权值估计向量、估计值的自适应更新律分别设计为

(19)
(20)
(21)
(22)

其中ηifηigηiδηiξ均为正常数.

定理1   对于无故障子系统(4), 在假设1和假设2成立的条件下, 设计自适应更新律(19) ~ (22), 则分散神经网络控制算法(18)可以保证载体姿态和关节连杆的位置跟踪误差渐近趋近于零, 即整个闭环系统(4)是渐近稳定的.

证明  定义估计误差, 选择正定的Lyapunov函数为

(23)

Vi对时间t求导, 并考虑式(9), 可得

(24)

将控制算法(18)代入(24), 得

(25)

结合假设1和假设2, 并利用式(19) ~ (21), 可得

(26)

对式(26)两边求和, 得

(27)

注意到, 利用Chebyshev不等式, 可得

(28)

结合式(27)和(28), 得

(29)

将式(22)代入(29), 可得

(30)

将式(30)在区间[0, ∈fty)上求积分, 得

(31)

由此可知, 滤波误差siL2, 根据Barbalat引理, 可得.因位置跟踪误差ei1si的函数, 故ei1也将渐近趋近于零.

2.2 基于神经网络的系统状态识别器设计

在第2.1节中, 为无故障子系统(4)设计了分散神经网络控制算法.在这一部分, 为了估计实际的比例因子, 将建立RBF神经网络系统状态识别器, 利用输入输出数据重构无故障子系统(4)的运动状态.

定义为所识别的系统状态矢量, 识别误差为.

假设3  交联项满足以下有界条件[17]:

(32)

其中: .

系统状态识别器设计为

(33)

其中: 分别为理想神经网络figi的估计, 并定义两者的缩写形式分别为分别为理想权值θifθig的估计向量; 的估计; 用于补偿交联项的影响; li1li2为表示识别器增益的正常数.

估计误差定义为

(34)
(35)

其中为权值识别误差.

定义全局估计误差为

(36)

假设4   全局估计误差ωio满足以下有界条件:

(37)

其中ξio为正常数.

假设4的合理性分析与假设2类似, 在此不再赘述.

估计权值以及变量的更新律设计为

(38)
(39)
(40)

其中ηifoηigoηiδ o均为正常数.

定理2  对于无故障子系统(4), 在假设3和假设4成立的前提下, 采用式(38) ~ (40)的参数更新律, 则系统状态识别器(33)可以保证识别误差最终一致有界.

证明  选择Lyapunov函数为

(41)

其中

将式(41)对时间t求导, 可得

(42)

根据假设4, 得

(43)

将式(38)和(39)代入(43), 并利用假设3, 可得

(44)

注意到, 利用Chebyshev不等式, 得

(45)

将式(45)代入(44), 可得

(46)

将式(40)代入(46), 得

(47)

因此, 只要如下不等式组成立:

(48)

.根据Lyapunov直接方法, 未知系统(4)的状态识别误差最终一致收敛.

从式(14)和(15)、(34)和(35)可以看出, 不同的RBF神经网络分别被应用于逼近未知非线性项gi(qi, θig).尽管RBF神经网络的结构相似, 但它们的作用却相异: 用于设计无故障系统的分散神经网络控制算法(18);而用于建立识别器(33), 进而对系统的状态进行估计.

2.3 执行器比例因子观测器

同理, 根据式(33)可将故障子系统(5)的分散神经网络状态识别器设计为

(49)

注意到神经网络状态识别器(33)和(49)均独立于控制算法(18)而设计, 故识别器与控制输入互相独立.此外, 估计权值在无故障系统状态被识别前后均保持不变, 由此可知神经网络权值是离线训练的.

为了进一步识别比例因子, 建立分散神经网络状态识别器为

(50)

其中: 为识别器误差, li1fli2f为表示识别器增益的正常数.

比例因子观测器设计为

(51)

其中ηip为表示观测器增益的正常数.

定理3  对于故障子系统(5), 结合分散神经网络状态识别器(49)和(50), 比例因子观测器(51)可以保证观测误差渐近收敛至零.

证明  选择Lyapunov函数为

(52)

将式(52)对时间t求导, 可得

(53)

将式(51)代入(53), 得

(54)

由此可知, 只要满足li1f≥1/2, li2f≥1/2, 则有Vifo≤0.根据Lyapunov直接方法可知, 比例因子观测误差将渐近收敛至零.

值得一提的是, 无论系统惯性参数和状态变量是否满足线性分离条件, 本文设计的比例因子观测器均能实现对真实比例因子的渐近趋近.

2.4 自校正反馈神经网络容错控制算法设计

通过观测器(51)得到的估计比例因子与神经网络控制算法(18)相结合, 便得到下式所示的自校正反馈神经网络容错控制算法:

(55)

定理4  对于故障子系统(5), 考虑定理1~定理3, 容错控制算法(55)可以保证系统的位置跟踪误差ei1一致最终有界,即整个闭环系统(5)是一致最终稳定的.

证明  选择Lyapunov函数为式(23), 即Vif=Vi, 将Vif对时间t求导, 可得

(56)

为正常数, 则有

(57)

由此可知, 只要滤波误差, 则si的函数, 根据Lyapunov直接方法, 跟踪误差ei1最终一致有界.

由上可知, 本文的控制策略存在这样的递推关系:首先, 由无故障子系统的状态识别器(33)可进一步设计故障子系统的状态识别器(49);然后, 由识别器(49)可进一步设计比例因子观测器(51);最后, 将估计的比例因子与常规控制器(18)组成容错控制器(55), 从而保证了故障系统的闭环稳定性, 达到容错的控制目标.

3 仿真算例

为了验证容错控制(fault-tolerant control, FTC)算法(55)的有效性, 对图 1所示的平面两连杆(n=2)空间机器人系统, 分别在正常模式和故障模式下进行数值仿真, 并将该算法与文献[18]的计算力矩控制(computed torque control, CTC)算法进行对比.

CTC算法的数学表达式为

(58)

其中: qd=[θ0d, θ1d, θ2d]T为期望轨迹, kvkp为正常数.

空间机器人系统的惯性参数为:载体质量40 kg, 连杆1和连杆2的质量均为3 kg; 载体转动中心至连杆1的转动中心的距离为1.5 m, 连杆1和连杆2的长度均为3 m; 载体中心转动惯量为34 kg· m2, 连杆1和连杆2的中心转动惯量均为1 kg·m2.

FTC算法的控制参数选取为: λi=102, ki=28, ηiδ=0.002, ηiξ=0.004, ηif=0.000 3, ηig=0.000 5, ηifo=0.000 3, ηigo=0.000 5, ηiδ o=0.04, ηip= 0.03, ηip=0.000 2, li1=5, li2=5, li1f=20, li2f=20. CTC算法的控制参数为: kv=4, kp=6.期望轨迹为: θ0d=cos(0.25π t)-1, θ1d=sin(0.2π t), θ2d=cos(0.2π t).

3.1 正常模式

空间机器人在正常模式下运行, 其执行器的比例因子为pi=1(i=0, 1, 2).仿真结果如图 3图 4所示.图 3为两种控制算法的位置跟踪结果对比, 图 4为比例因子观测器的识别结果.

图 3 正常模式下两种控制算法的位置跟踪结果对比
图 4 正常模式下比例因子观测器的识别结果

图 3可知, 在正常模式下, 本文提出的FTC控制算法和文献[18]的CTC控制算法均能保证载体姿态与关节连杆在4 s内到达指定的期望位置.由图 4可知, 观测器(51)能在1.5 s内实现对真实比例因子的精确识别.

3.2 故障模式

假设载体、关节1和关节2的执行器发生部分失效故障, 且比例因子分别为0.7、0.8和0.6.仿真结果如图 5图 6所示. 图 5为两种控制算法的位置跟踪结果对比, 图 6为比例因子观测器的识别结果.

图 5 故障模式下两种控制算法的位置跟踪结果对比
图 6 故障模式比例因子观测器的识别结果

图 5可知:当空间机器人的执行器发生部分失效故障时, 在本文提出的FTC算法作用下, 载体姿态和关节连杆在5 s内即可抵达期望位置; 在无容错机制的CTC算法作用下, 载体实际姿态与期望姿态存在较小的误差; 而关节连杆存在较为明显的跟踪误差, 无法满足航天控制的高精度要求.由图 6可知, 观测器(51)仍然能在1.5 s内实现对故障情况下真实比例因子的精确识别.仿真结果表明了本文所设计的FTC控制算法的容错可行性及观测器(51)的识别准确性.

4 结论

针对执行器发生常值型部分失效故障的空间机器人, 本文设计了比例因子观测器对实际比例因子进行识别, 然后将常规的神经网络控制算法与识别的比例因子相结合, 得到了一种自校正反馈神经网络容错控制算法.仿真结果表明了理论推导的正确性和控制策略的可行性.无论系统惯性参数和状态变量是否满足线性分离条件, 本文设计的观测器均能实现对实际比例因子的一致有界趋近, 从而为空间机器人的寿命预估提供了参考.

参考文献
[1]
Huang P H, Zhang F, Cai J, et al. Dexterous tethered space robot: Design, measurement, control, and experiment[J]. IEEE Transactions on Aerospace and Electronic Systems, 2017, 53(3): 1452-1468. DOI:10.1109/TAES.2017.2671558
[2]
刘福才, 梁利环, 秦利, 等. 考虑重力影响的空间机械臂轨迹跟踪滑模控制[J]. 控制与决策, 2014, 29(10): 1856-1860.
(Liu F C, Liang L H, Qin L, et al. Sliding mode control for space manipulator trajectory tracking considering effects of gravity[J]. Control and Decision, 2014, 29(10): 1856-1860.)
[3]
Chu X Y, Hu Q, Zhang J R. Path planning and collision avoidance for a multi-arm space maneuverable robot[J]. IEEE Transactions on Aerospace and Electronic Systems, 2018, 54(1): 217-232. DOI:10.1109/TAES.2017.2747938
[4]
Liu M, Cao X B, Shi P. Fuzzy-model-based fault-tolerant design for nonlinear stochastic systems against simultaneous sensor and actuator Faults[J]. IEEE Transactions on Fuzzy Systems, 2013, 21(5): 789-799. DOI:10.1109/TFUZZ.2012.2224872
[5]
Tong S C, Huo B Y, Li Y M. Observer-based adaptive decentralized fuzzy fault-tolerant control of nonlinear large-scale systems with actuator failures[J]. IEEE Transactions on Fuzzy Systems, 2014, 22(1): 1-15.
[6]
Shen Q K, Jiang B, Cocquempot V. Adaptive fuzzy observer-based active fault-tolerant dynamic surface control for a class of nonlinear systems with actuator faults[J]. IEEE Transactions on Fuzzy Systems, 2014, 22(2): 338-349. DOI:10.1109/TFUZZ.2013.2254493
[7]
Chen M, Shi P, Lim C C. Adaptive neural fault-tolerant control of a 3-DOF model helicopter system[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2016, 46(2): 260-270. DOI:10.1109/TSMC.2015.2426140
[8]
Xiao B, Yin S. Velocity-free fault-tolerant and uncertainty attenuation control for a class of nonlinear systems[J]. IEEE Transactions on Industrial Electronics, 2016, 63(7): 4400-4411. DOI:10.1109/TIE.2016.2532284
[9]
陶洪峰, 邹伟, 杨慧中. 执行器故障重复过程的鲁棒迭代学习容错控制方法及应用[J]. 控制与决策, 2016, 31(5): 823-828.
(Tao H F, Zou W, Yang H Z. Robust iterative learning fault-tolerant control method and application for repetitive process with actuator fault[J]. Control and Decision, 2016, 31(5): 823-828.)
[10]
Yin S, Yang H Y, Kaynak O. Sliding mode observer-based FTC for Markovian jump systems with actuator and sensor faults[J]. IEEE Transactions on Automatic Control, 2017, 62(7): 3551-3558. DOI:10.1109/TAC.2017.2669189
[11]
Yin S, Gao H J, Qiu J B, et al. Descriptor reduced-order sliding mode observers design for switched systems with sensor and actuator faults[J]. Automatica, 2017, 76(1): 282-292.
[12]
罗厚福.执行器故障下自适应容错控制算法研究[D].沈阳: 东北大学信息科学与工程学院, 2010.
(Luo H F. Study on adaptive fault tolerant control against actuator faults[D]. Shenyang: College of Information Science and Engineering, Northeastern University, 2010.) http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=J0102872
[13]
杨光红, 张志慧. 基于区间观测器的动态系统故障诊断技术综述[J]. 控制与决策, 2018, 33(5): 769-781.
(Yang G H, Zhang Z H. Review of interval observer based fault diagnosis techniques for dynamic systems[J]. Control and Decision, 2018, 33(5): 769-781.)
[14]
Peng C, Fang J C, Cui P L. Dynamics modeling and measurement of the microvibrations for a magnetically suspended flywheel[J]. IEEE Transactions on Instrumentation and Measurement, 2015, 64(12): 3239-3252. DOI:10.1109/TIM.2015.2459491
[15]
Praveen R P, Ravichandran M H, Achari V T S, et al. A novel slotless halbach-array permanent-magnet brushless DC motor for spacecraft applications[J]. IEEE Transactions on Industrial Electronics, 2012, 59(9): 3553-3560. DOI:10.1109/TIE.2011.2161058
[16]
Zhao Bo, Wang Ding, Shi Guang, et al. Decentralized control for large-scale nonlinear systems with unknown mismatched interconnections via policy iteration[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2018, 48(10): 1725-1735. DOI:10.1109/TSMC.2017.2690665
[17]
Huang S, Tan K K, Lee T H. Decentralized control design for large-scale systems with strong interconnections using neural networks[J]. IEEE Transactions on Automatic Control, 2003, 48(5): 805-810. DOI:10.1109/TAC.2003.811258
[18]
Thamiris L C, Fabian A L M, Aldemir A C, et al. Robust computed torque control for manipulators[J]. IEEE Latin America Transacions, 2018, 16(2): 398-407. DOI:10.1109/TLA.2018.8327392