相關(guān)鏈接: 北京安全網(wǎng) 北京質(zhì)量網(wǎng) 北京論文網(wǎng) 北京資訊網(wǎng)
摘要:非線性系統(tǒng),其最優(yōu)控制求解相當(dāng)困難,尋求近似的最優(yōu)控求解方法是當(dāng)下解決這一問(wèn)題的主要途徑。目前,比較成熟的最優(yōu)控制求解方法主要有七類,本文對(duì)這七種方法進(jìn)行了詳細(xì)的闡述,并對(duì)其優(yōu)缺點(diǎn)進(jìn)行了客觀的對(duì)比。
論文關(guān)鍵詞:非線性,最優(yōu)控制
近年來(lái),最優(yōu)控制理論[1,2]的研究,無(wú)論在深度和廣度上,都有了很大的發(fā)展,已成為系統(tǒng)與控制領(lǐng)域最熱門的研究課題之一,取得了許多研究成果。同時(shí),也在與其他控制理論相互滲透,出現(xiàn)了許多新的最優(yōu)控制方式,形成了更為實(shí)用的學(xué)科分支。例如魯棒最優(yōu)控制[3]、隨機(jī)最優(yōu)控制[4]、分布參數(shù)系統(tǒng)的最優(yōu)控制[5]、大系統(tǒng)的次優(yōu)控制[6]、離散系統(tǒng)的最優(yōu)控制及最優(yōu)滑模變結(jié)構(gòu)控制[7,8]等。而對(duì)于非線性系統(tǒng),其最優(yōu)控制求解相當(dāng)困難,需要求解非線性HJB方程或非線性兩點(diǎn)邊值問(wèn)題,除簡(jiǎn)單情況外[9],這兩個(gè)問(wèn)題都無(wú)法得到解析解。因此,許多學(xué)者都致力于尋求近似的求解方法[10~13],通過(guò)近似解得到近似的最優(yōu)控,即次優(yōu)控制。
1、非線性最優(yōu)控制理論研究成果分類
目前,較為流行的近似最優(yōu)控制求解方法主要有以下幾類[6][13]。
1)冪級(jí)數(shù)展開(kāi)法:冪級(jí)數(shù)展開(kāi)方法通過(guò)一個(gè)冪級(jí)數(shù)來(lái)構(gòu)造控制律,得到序列形式的近似最優(yōu)解,或者將系統(tǒng)中的非線性項(xiàng)以冪級(jí)數(shù)形式分解,或者通過(guò)引進(jìn)一個(gè)臨時(shí)變量并圍繞它展開(kāi)。
將上式代入HJB方程求得級(jí)數(shù)近似解,也可利用Adomian分解將非線性項(xiàng)進(jìn)行分解,由此尋求非線性HJB方程級(jí)數(shù)的近似解。
2)Galerkin逐次逼近方法:由動(dòng)態(tài)規(guī)劃得到的一般性偏微分HJB方程,引入一個(gè)迭代過(guò)程來(lái)求解一般非線性HJB方程的一個(gè)近似解序列。
3)廣義正交多項(xiàng)式級(jí)數(shù)展開(kāi)法:其主要思想是將最優(yōu)控制問(wèn)題中的狀態(tài)變量,控制輸入,性能指標(biāo)和各個(gè)參數(shù)分別用廣義正交多項(xiàng)式展開(kāi),利用廣義正交多項(xiàng)式的積分、乘積運(yùn)算陣
將描述系統(tǒng)的微分方程轉(zhuǎn)化為一系列的代數(shù)方程。然后,得到,T非奇異時(shí)由得到的控制律是一個(gè)多項(xiàng)式級(jí)數(shù)解。該方法將最優(yōu)控制問(wèn)題轉(zhuǎn)化為代數(shù)極值問(wèn)題,從而避免了求解時(shí)變非線性Riccati方程。
4)有限差分和有限元方法:經(jīng)典的有限差分和有限元方法可以用來(lái)近似求解非線性HJB方程。近年來(lái),這類方法用來(lái)近似求取非線性HJB方程的粘性解。
5)狀態(tài)相關(guān)Riccati方程方法:這種方法適用的模型是仿射非線性系統(tǒng),通過(guò)極大值原理假設(shè)最優(yōu)控制律具有如下形式
其中為下式所述里卡提方程的解
這樣,問(wèn)題的關(guān)鍵歸結(jié)于近似求解。狀態(tài)相關(guān)里卡提方程方法通過(guò)在中引入靈敏度參數(shù)變量ε,在鄰域內(nèi)將展為冪級(jí)數(shù)
通過(guò)比較冪級(jí)數(shù)同次項(xiàng)系數(shù)將狀態(tài)相關(guān)里卡提方程分解為一組矩陣微分方程序列,由此求得其近似解。狀態(tài)相關(guān)里卡提方程方法所設(shè)計(jì)的近似最優(yōu)控制律是一種級(jí)數(shù)形式的狀態(tài)反饋控制律。
6)Riccati方程近似序列法:該方法對(duì)非線性系統(tǒng)構(gòu)造線性時(shí)變序列以及相應(yīng)的線性二次型時(shí)變性能指標(biāo),得到線性時(shí)變序列的最優(yōu)反饋控制序列
其中是里卡提方程近似序列的解。
此方法計(jì)算量較大,但是當(dāng)系統(tǒng)的維數(shù)不是很大時(shí),較里卡提方程近似序列方法具有很快的收斂速度,并表現(xiàn)出很好的魯棒性。
7)逐次逼近法:該方法是針對(duì)非線性的一次項(xiàng)和高次項(xiàng)可分離的一類非線性系統(tǒng)進(jìn)行近似最優(yōu)控制問(wèn)題的求解,給出了一種逐次逼近的近似求解方法。該方法針對(duì)由極大值原理導(dǎo)致的兩點(diǎn)邊值問(wèn)題,構(gòu)造近似的等價(jià)序列將其轉(zhuǎn)化為一組線性非齊次兩點(diǎn)邊值問(wèn)題序列,通過(guò)迭代求解一系列的向量微分方程,包括狀態(tài)向量方程序列和共態(tài)向量方程序列,得到原非線性系統(tǒng)近似最優(yōu)控制問(wèn)題的解。該方法被廣泛應(yīng)用到各類非線性系統(tǒng),其最大優(yōu)點(diǎn)是在迭代過(guò)程中每次計(jì)算的不是矩陣微分或代數(shù)方程,而是向量微分或代數(shù)方程,計(jì)算量大大減少,而且實(shí)時(shí)性很高。
2、非線性最優(yōu)控制理論研究成果對(duì)比
比較以上方法,各有優(yōu)缺點(diǎn)。其中,冪級(jí)數(shù)展開(kāi)方法要求系統(tǒng)關(guān)于狀態(tài)向量x解析,才能夠進(jìn)行展開(kāi),這在實(shí)際工程應(yīng)用中是不現(xiàn)實(shí)的。Galerkin逐次逼近法的收斂性過(guò)于依賴系統(tǒng)的初值,收斂性在很多情況下是無(wú)法保證的。廣義正交多項(xiàng)式級(jí)數(shù)展開(kāi)法和有限差分、有限元方法都是采用不同的數(shù)學(xué)工具來(lái)解決近似求解非線性系統(tǒng)的最優(yōu)控制問(wèn)題,但這兩種方法的計(jì)算收斂性不好,所需的巨大計(jì)算量也使得它們離工程實(shí)際應(yīng)用有很大一段距離。狀態(tài)相關(guān)里卡提方程適用于一類仿射非線性系統(tǒng)。里卡提方程近似序列方法同樣適用于一類仿射非線性系統(tǒng),當(dāng)處理高維系統(tǒng)時(shí),其計(jì)算量將很大。而逐次逼近法,從計(jì)算復(fù)雜度看,是對(duì)向量迭代,得到的最優(yōu)控制律是由精確的線性反饋?lái)?xiàng)和非線性補(bǔ)償項(xiàng)組成,將最優(yōu)控制的求解轉(zhuǎn)化為非線性補(bǔ)償向量序列的求極限過(guò)程,大大減少了計(jì)算量,容易被實(shí)際工程所應(yīng)用。簡(jiǎn)言之,逐次逼近法通過(guò)較為簡(jiǎn)單的計(jì)算設(shè)計(jì)得到系統(tǒng)的近似最優(yōu)控制律,具有計(jì)算量少,易于工程實(shí)現(xiàn)的優(yōu)點(diǎn),有很好的工程應(yīng)用前景。然而,逐次逼近法的缺點(diǎn)在于其對(duì)外部擾動(dòng)和系統(tǒng)內(nèi)部參數(shù)攝動(dòng)以及未建模動(dòng)態(tài)敏感,因此提高最優(yōu)控制的魯棒性是非常必要的。
3、結(jié)束語(yǔ)
對(duì)于非線性系統(tǒng),其最優(yōu)控制的解一般是不存在的。再加上非線性系統(tǒng)的復(fù)雜性和多樣性,這方面的研究成果還很少,尚待解決的問(wèn)題還很多,,本文對(duì)非線性最優(yōu)控制理論現(xiàn)有研究成果對(duì)比進(jìn)行了詳細(xì)的闡述,并對(duì)其優(yōu)缺點(diǎn)進(jìn)行了客觀的對(duì)比,為非線性最優(yōu)控制理論的進(jìn)一步研究提
參考。
[1]胡壽松,王執(zhí)銓,胡維禮.最優(yōu)控制理論與系統(tǒng)(第二版).北京:科學(xué)出版社,2005
[2]鄭大鐘.線性系統(tǒng)理論(第二版).北京:清華大學(xué)出版社.2002
[3]Nata Kumara Dinata.Control Relevant Identification for Robust Optimal Control.For the Degree of Master of Applied Science,University of Toronto,Canada.2003
[4]Ozer Elbeyli.Analysis and Control of Nonlinear Stochastic Systems.For the Doctor of Philosophy in Mechanical Engineering,The University of Delaware.Winter,2004.
[5]Sanjay Chawla.Applications of Optimal Control Theory to Distributed Parameter Systems.For the Degree of Doctor of Philosophy,The University of Tennessee,Knoxville.August,1995
[6]張會(huì).非線性系統(tǒng)最優(yōu)控制的改進(jìn)逐次逼近法研究.[D]海洋艦艇學(xué)院博士論文,2007.[J].
[7]Najia.AL-Musabi.Design of Optimal Variable structure Controllers:Applications to Power System Dynamics.For the Degree of Master of Science,King Fahd University of Petroleum&Minerals,Dhahran,Saudi Arabia.June 2004
[8]逄海萍.不確定時(shí)滯非線性系統(tǒng)的最優(yōu)滑模控制.[D]中國(guó)海洋大學(xué)博士論文,2007.[J].
[9]J.L.Leeper,R.J.Mulholland.Optimal control of nonlinear single-input systems. IEEE Transactions onAutomatic Control, 1972, AC-17(3): 401-402
[10] S.Ito.Numerical methods of nonlinear optimal control based on mathematical programming. NonlinearAnalysis, Theory, Methods and Applications, 1997, 30(6): 3843~3854
[11] M.Abu-Khalaf,F.L.Lewis. Nearly optimal control laws for nonlinear systems with saturating actuatorsusing a neural network HJB approach. Automatica, 2005, 41(5): 779~791
[12]M.Diehl,H.G.Bock, J.P.Schloder.A real-time iteration scheme for nonlinear optimation in optimalfeedback control. SIAM Journal on Control and Optimization, 2005,43(5): 1714~1736
[13] T.Itami.Nonlinear optimal control as quantum mechanical eigenvalue problems. Automatica, 2005, 41(9):1617~1622