一类非线性离散系统轨迹跟踪控制的间接数据驱动方法
2019-03-28

 

现代生活中,化学工业、冶金工业、机械工业、电子、运输、后勤等许多工业种类已经发展成为了具有大规模和高复杂度的系统。因此,控制理论与工程领域中出现了大量理论与技术上的挑战。一方面,基于相应物理机理准确地对这些系统进行建模是几乎不可能的,尽管它们每时每刻都在生成、测量、传输和存储着大量包含相关系统及其特征的有用信息的数据。由于这一类基于模型的控制方法需要事先知道控制对象的准确动力学模型,因此无力解决此类系统的控制问题。而另一方面,由于信息科学与技术得到了极大的发展,一些新型的技术,例如高性能的软/硬件与云计算技术,使得实时进行复杂数据的分析与计算变成了可能。这些条件也促使科学家与工程师去发展新的数据驱动控制理论与研究方法,而这对于当前的大数据时代来说,兼备了理论与实践意义。

 

在数据驱动控制方法中,一般通过使用在线或离线测量的数据、关于受控对象的先验知识与合理假设来设计控制器,而不需要清楚地知道被控对象的动力学模型。迄今为止,学界已经发展出了许多典型的数据驱动控制方法,例如自适应动态规划、迭代反馈整定、迭代学习控制、无模型自适应控制和同步扰动随机近似等。我们可以将其分为两大类:一类是间接数据驱动控制方法(Indirect Data-Driven Control,以下简称IDDC),此类方法首先需要进行系统辨识,并通过诸如神经网络和支持向量机之类的方法来利用测量数据建立被控对象的近似模型,然后再通过近似模型设计控制器。另一类是直接数据驱动控制方法(Direct Data-Driven Control,以下简称DDDC),它们并不对被控对象进行建模而是直接利用测量数据来控制系统,但它们受到一些约束条件和先验假设的限制。此外,对于DDDC方法而言,由于对系统动态特性的变化趋势不是很敏感,导致此类方法有很大的预测误差;对于IDDC方法而言,在建立近似模型后,一般不会依据测量数据在线校正或调整模型,更不会实时调整控制器了。因此,该方法经常遭受建模误差带来的不利影响。

 

 

 

 

1间接数据驱动输出轨迹跟踪控制(IDDOTTC)方法的框图

 

 

在研究过程中,我们开发了一种间接数据驱动输出轨迹跟踪控制方法(Indirect Data-Driven Output Trajectory Tracking Control,以下简称IDDOTTC),应用于一类具有未知动力学模型的非线性离散系统,使其系统输出可以跟踪给定的参考轨迹。与其他的IDDC方法类似,本IDDOTTC方法需要在真正的控制任务开始之前,采用历史的I/O数据和神经网络离线地建立系统的近似动力学模型。该方法通过求解一系列非线性优化问题,并利用测量和记录的I/O数据、给定的参考轨迹和近似模型,实现在线估计、预测与系统模型相关的雅可比矩阵,然后通过上述结果设计反馈增益矩阵。IDDOTTC方法需要预先根据跟踪误差设定期望的系数矩阵,其中跟踪误差直接基于测量的输出数据与先前每个样本的估计值,以便相应地调整反馈增益矩阵使得系统输出渐进地跟踪参考轨迹。这一预测、估计和调整的过程克服了建模误差引起的不利影响,并且敏感于系统动态变化趋势,因此优于传统IDDCDDDC方法。这些优点会使系统拥有更好的轨迹跟踪表现,这是我们工作的主要贡献。此外,我们提出了一种基于拉格朗日中值定理的针对非线性离散系统的在线线性化技术,此类非线性离散系统需满足系统动力学模型函数对输入和输出都具有连续偏导数的条件。

 

综上所述,本方法可以用于解决具有未知动态特性的一类非线性离散系统的输出轨迹跟踪控制问题。本方法的基本技巧是:首先使用历史I/O数据和神经网络离线地建立原系统的近似模型,然后利用在线测量和记录的I/O数据并通过近似模型设计反馈增益矩阵B(k),再后当到达k时刻时将反馈增益矩阵B(k-1)更新为B(k)。这种设计和调整的过程是使系统输出渐进收敛到参考轨迹上的关键。IDDOTTC方法对每一个采样k时刻都需要解决一系列的非线性优化问题,才能以此预测和估计相应的雅可比矩阵,并设计B(k)。这可以被看作是在线修正先前建立的近似模型,因此能克服由神经网络建模误差引起的不利影响。这与没有做预测、估计、调整过程的传统IDDC方法相比是一个显著的优点。此外,通过先前的控制结果                                                                                                                                                                                                                                                                                                                                     (k − 2) (k − 1)以及e(k-1)而预设的期望结果 (k)B(k)的设计起到直接的影响。这一事实表明了本IDDOTTC方法的另一个优点是它具有自适应能力,能够抵抗系统动态特性不确定引起的改变;也正是因此,我们的方法才具有更好的轨迹跟踪表现。算法收敛性分析和计算机仿真结果表明了IDDOTTC方法的有效性与可行性。此外,我们还提出了一种在线线性化非线性离散系统的方法,它的优点是作为结果的线性模型中不含高阶无穷小项。这种动态线性化技术可以应用于那些动力学模型具有连续偏导数的非线性离散系统中。

 

 

 

 

2 (a)实际轨迹与估计轨迹;(b)位置跟踪表现;(c)速度跟踪表现;(d)BP神经网络离线学习结果

 

 

本项目由中国国家自然科学基金资助。本文描述的理论和实验结果是初步的结果,这些理论和实验结果还将扩展到具有随机成分和干扰的系统研究中。

 

 

王卓,仪器科学与光电工程学院,精密仪器与量子传感技术研究所,教授,E-mail: zhuowang@buaa.edu.cn

 

 

参考文献

 

Zhuo Wang*, Renquan Lu, Furong Gao, and Derong Liu, "An Indirect Data-Driven Method for Trajectory Tracking Control of a Class of Nonlinear Discrete-Time Systems," IEEE Transactions on Industrial Electronics, vol. 64, no. 5, pp. 4121--4129, May 2017.