优胜从选择开始,我们是您最好的选择!—— 中州期刊联盟(新乡市博翰文化传媒有限公司)
0373-5939925
2851259250@qq.com
我要检测 我要投稿 合法期刊查询
您的位置:网站首页 > 优秀论文 > 科技论文 > 正文

一致性约束下末制导系统最大可容许模式决策延迟

作者:项盛文 范红旗 达凯 付强来源:《自动化学报》日期:2022-07-13人气:1342

在实际的末制导拦截场景中, 目标状态不可避免地受噪声污染并且不是所有的状态量都能直接被量测, 因此估计器是制导系统中的一个关键组件. 由于目标机动通常是未知且难以预测的, 目标状态估计是一个典型的混合估计问题, 即包含基础状态估计和模式决策两个任务. 目前, 常用的混合估计方法可以分为两类: 单模方法和多模方法. Li等[1-2]对这两类方法进行了全面的分析和总结. 值得注意的是, 无论选用哪种方法, 模式决策延迟都是影响系统估计精度的关键因素. 具体而言, 在单模方法中模式决策延迟表现为目标机动检测延迟; 而在多模方法中则表现为模型概率收敛的时间. Shinar等[3]指出对于大机动目标拦截(Highly maneuvering target interception, HMTI)问题, 目标状态估计延迟特别是目标横向加速度的估计延迟, 是引起系统非零脱靶量的主要因素. 因此, 为了尽可能地提高系统估计和制导的精度, 模式决策延迟的取值越小越好. 否则, 由模式失配引起的不精确状态估计会误导拦截器生成错误的控制指令, 并最终导致系统拦截精度降低(模式延迟太大且没有足够长的时间让估计器收敛).

近年来, 研究者分别从不同的角度考虑如何降低模式延迟对制导性能的影响: 一种是研究新型导引律以适应模式决策延迟; 另一种则聚焦于怎样降低系统的模式决策延迟. 在导引律设计方面, 学者们提出了一系列延迟信息模式下的微分对策导引律. Shinar等[4]假定目标横向加速度分量存在一个固定的估计延迟, 基于状态可达集提出了一种新型导引律DGL/C (Differential games law, DGL). 文献[5]在同时考虑目标横向加速度和相对速度存在延迟的条件下提出了DGL/CC. 对于随机Bang-Bang机动目标, DGL/CC与DGL/C相比可进一步降低系统脱靶量. 文献[6]则考虑更一般情形, 假定弹目相对距离、相对速度和目标加速度均存在估计延迟, 提出了一种多信息延迟模式下的微分对策导引律. 然而, 对于HMTI问题, 单一的估计器和导引律的简单组合并不能适应所有的目标机动情形[7]. 采用集成估计导引(Integrated estimation and guidance, IEG)的思路, 组合使用一组不同精度和带宽的估计器和一个独立的模式决策器, 可以显著提高末制导精度并越来越受到研究领域的关注[8-11]. 其中, 基于逻辑的IEG方法具有潜在的应用前景[12-13], 该方法也在多个拦截场景中得到了验证. 另一方面, 为了降低模式决策延迟, 研究者们从目标机动特性出发进行了不同的尝试. 事实上, 雷达和光电导引头可以观测到与目标机动紧密相关的特征信息, 这也为目标机动的快速辨识提供了可能. 相关研究结果表明, 集成雷达特征信息可以有效降低目标机动检测的延迟并提高制导系统的精度[14-15].

为了定量评估模式决策延迟对制导性能的潜在影响, 需进一步回答该问题: 给定系统误差边界后, 模式决策器最大可容许的模式决策延迟(Maximal admissible mode decision delay, MAMDD)是多少? 对于该问题, 文献[16]分析了离散时间系统状态估计误差特性并推导了模式延迟的上边界和模式逗留时间的下边界[16]. 文献[17]将该工作推广至连续时间情形. 考虑末制导的拦截特性, 文献[18]通过将零控脱靶量(Zero-effort miss, ZEM)估计误差的均值限定在捕获区边界内提出了一种MAMDD的数值计算方法, 然而该方法未考虑ZEM估计误差的方差. 文献[19]同时考虑ZEM估计误差的均值和方差, 引入可靠性评价指标得到了系统可接受模式决策延迟的范围, 但没有给出MAMDD的具体数值.

本文针对HMTI问题, 在IEG系统框架下, 分析给定系统性能约束条件下模式决策器的性能指标, 为模式决策器的设计提供指标参考. 主要创新点包括: 1)给出了离散时间系统ZEM估计误差模型; 2)同时考虑ZEM估计误差一阶矩和二阶矩, 利用一致性约束条件提出了一种MAMDD的数值计算方法. 研究结果表明在末制导前段采用一致性约束、后段采用捕获区约束可保证更好的拦截性能.

本文仅考虑图1所示的一弹一目平面拦截场景, 表1给出了全文的符号描述, 下面对拦截问题做3个假设[3-611-1215-19]:

图 1  平面拦截几何
Fig. 1  Planer interception geometry

表 1  符号说明
Table 1  Description of symbols
变量名称变量描述
P导弹
E目标
τp,τe导弹和目标控制系统的时间常数
apmax,aemax导弹和目标最大横向加速度
Vp,Ve导弹和目标的飞行速度
up,ue导弹和目标的横向加速度指令
r弹目相对距离
tsw目标模式切换时刻
t仿真时间
tf终止时刻
tgo剩余飞行时间
g重力加速度, 9.8m/s2
m目标的运动模式
m1,m2目标在模式切换时刻前后的运动模式
Δm目标运动模式改变量, Δm=m2m1
T采样时间间隔
σθ测角精度
σa导弹加速度测量精度
sw目标指令加速度误差的功率谱密度
Δt目标运动模式辨识延迟
x~状态估计误差
ξ,Σ状态估计误差的均值和方差
μ,σ2ZEM估计误差的均值和方差
χk2检验统计量

1) 弹目的控制动态可用一阶转移函数近似, 对应的时间常数分别记为τpτe;

2) 弹目飞行速度恒定, 分别用VpVe表示;

3) 弹目的横向加速度有界, 最大横向加速度分别用apmaxaemax表示.

图1中, P (Pursuer)和E (Evader)分别表示导弹和目标; X轴沿弹目初始视线方向; Y垂直于X轴; (xp,yp)(xe,ye)分别为P、E的当前位置; ϕpϕe分别为弹目的速度偏角, 定义为速度矢量和X轴正方向的夹角. 对于高速大机动目标末制导拦截场景, 速度偏角满足小角度条件(sinϕpϕp,sinϕeπϕe), 弹目相对运动轨迹可沿初始视线方向进行线性化[12]. 假定弹目接近速度恒定、起始时刻t0=0s, 给定弹目起始距离r0后, 拦截的终止时刻满足

(1)

剩余飞行时间定义为tgo=tft, 其中, t[0,tf].

定义状态矢量x=[x1(t),x2(t),x3(t),x4(t)]T=[y(t),y˙(t),aye(t),ayp(t)]T. 基于上述三个假设条件, 容易得到如下的线性动态方程:

(2)

其中, x1=yeyp为弹目沿Y轴的相对距离; x2为相对横向速度; upue分别表示P和E的横向加速度指令且满足有界条件

(3)

系统的动态方程可写成如下的矢量形式

(4)

其中,

(5)

通过终端投影变换

(6)

可将方程(4)转换为一个标量问题. 此时, 系统新的状态量为零控脱靶量z(t), 系统的脱靶量则为tf时刻的z(t), 即z(tf). 在式(6)中, d=[1,0,0,0]TΦ(tf,t)为满足齐次方程x˙(t)=Ax(t)的状态转移矩阵, 求解可得到

(7)

由式(6)容易得到z(t)满足

(8)

其中, gT(t)=[g1(t),g2(t),g3(t),g4(t)]

(9)

将目标的横向加速度控制指令ue(t)建模为一个跳变的马尔科夫过程[16]

(10)

其中, m(t)为目标当前时刻的运动模式, 它表示目标横向加速度指令的具体取值, 且满足{m(t)M=[m1,m2,,m|M|]}, 其中M为目标运动模式集、|M|为模型集的势, w(t)为量化误差, 建模为零均值的高斯白噪声, 功率谱密度为sw.

不失一般性, 我们假定在[0,tf]内目标仅发生一次模式切换. 用tsw表示模式切换时刻, m1,m2分别表示模式切换前后目标的运动模式量, 则m(t)可表示为

(11)

其中, u(t)为阶跃函数, 定义为

(12)

将式(10)中的ue代入式(4), 可以得到

(13)

假定系统的时间采样间隔为T且在每一个T内弹目的横向加速度指令保持恒定, 容易得到与式(13)等价的离散模型为

(14)

其中,

(15)
(16)
(17)
(18)

其中, ukpmk分别为离散化后的弹目加速度控制指令; ωk=b2wk为零均值的高斯白噪声, 协方差矩阵为

(19)

其中,

(20)

假定雷达导引头测量每一时刻弹目的相对位置和导弹自身的加速度, 则系统的观测方程可以写成[20]

(21)

其中, yk=[yk,aykp]Ttk时刻含噪的观测向量; ykaykp分别对应该时刻弹目相对位置和导弹加速度的量测值; vk为离散化后的测量噪声, 其均值为零、协方差矩阵为Rk[20].

图2给出了一种典型的基于逻辑的IEG系统架构[817-19]. 在该制导系统中, 通过引入一个独立的模式决策器用于估计目标当前的运动模式(即目标横向加速度指令), 并为估计器和导引律提供目标的运动模式信息. 这种系统架构的优势可从以下两方面进行理解. 一方面, 模式决策器的输出可以辅助估计器选择合适的的动态模型; 当目标发生机动后, 估计器能够根据目标的运动模式信息快速切换至正确的模型. 另一方面, 模式决策器的输出可以辅助制导律单元选择合适的导引律. 例如, 当目标当前的运动模式量取值很小时(即|v|很小), 对应的目标横向加速度很小, 此时可选用DGL/0导引律, 因为其计算效率更高; 若目标当前的运动模式量取值较大(即|v|很大), 此时目标加速度不能直接忽略, 可将导引律切换至DGL/1以保证更高的拦截精度; 此外, 如果模式决策器能够提供目标运动模式的符号或方向, 可根据这一信息进一步缩小目标加速度的可达集[21]. 本节将基于该制导系统架构推导目标存在运动模式切换时ZEM估计误差的分布, 在此基础上进一步分析模式决策延迟对系统制导精度的影响.

图 2  一个典型的基于逻辑的IEG制导系统框架[18]
Fig. 2  A typical logic-based IEG guidance system frame[18]

对式(11)进行离散化处理后, 目标加速度指令满足

(22)

其中, ksw表示模式切换离散时刻

(23)

将式(22)代入式(14), 可以得出离散系统的动态方程满足

(24)

记模式决策器的时间延迟步长为j, 则离散系统目标模式切换以及对应模式决策器的输出可用图3表示. 从图3容易得出估计器的动态模型满足

(25)

由式(24)和式(21)可以看出, 系统的状态方程和测量方程具有线性形式. 因此, 选用线性Kalman滤波器作为最优估计器. 下面根据目标模式切换时间、模式决策器延迟和拦截终止时刻的关系分三种情形分别讨论ZEM估计误差的分布.

图 3  目标模式切换和模式决策器输出示意图
Fig. 3  Diagram of target's mode switch and mode decision-maker's outputs

情形1. kswkf. 在这种情形下, 目标的横向加速度指令在整个末制导期间始终为m1, 估计器使用的模型不存在失配. 此时系统的状态方程为

(26)

从式(25)容易看出估计器的滤波方程为

(27)

其中, Kk+1表示tk+1时刻的离散Kalman增益矩阵, 满足


(28)

(29)


(30)

定义状态估计误差x~k=x^kxk, 将式(27)和式(26)相减得到

(31)

由于E{ωk}=0E{vk}=0, 则状态估计误差的均值(记作ξk)满足

(32)

且状态估计误差的协方差矩阵(记作Σk)具有如下的迭代形式

(33)

情形 2. ksw<kfksw+j. 这里需要分两种情况分别讨论.

1) k[0,ksw). 此时状态估计误差的均值和协方差分别同式(32)和式(33).

2)k[ksw,kf]. 目标的运动模式发生了切换, 此时系统的动态方程满足

(34)

估计器的滤波方程为式(27), 因为导弹仍然认为目标的运动模式为m1, 即在此期间内系统存在模式失配. 根据状态估计误差的定义, x~k满足

(35)

容易得出状态估计误差的均值为

(36)

协方差矩阵的递归形式与式(33)相同. 式(36)中的前一项描述了起始状态估计误差的影响, 而后一项则度量了模式失配的影响.

情形 3. ksw+j<kf. 类似地, 需要分三种情况分别讨论.

1)k[0,ksw). 在此区间内, 目标运动模式未发生改变, 因此状态估计误差的均值由式(32)确定, 协方差矩阵由式(33)确定.

2)k[ksw,ksw+j). 在此区间内, 目标的运动模式发生切换但模式决策器未检测对应的改变, 系统存在模式失配. 状态估计误差的均值和协方差分别满足式(36)和式(33).

3)k[ksw+j,kf]. 在此区间内, 目标的运动模式由m1切换至m2, 并且模式决策器已经正确检测出目标的运动模式. 因此, 系统的状态方程满足式(34), 而滤波方程为

(37)

由式(37)和式(34)容易得到状态估计误差均值将由式(32)确定, 误差协方差矩阵由式(33)确定.

定义ZEM的估计误差为估计的ZEM值与系统真实的ZEM值之差, 即

(38)

其中, gkT=gT(tk). 因此, ZEM估计误差的均值(记作μk)具有如下的迭代形式

(39)

ZEM估计误差的方差满足

(40)

综上所述, 每一时刻的ZEM估计误差均服从有偏的高斯分布, 均值为μk, 方差为σk2. 当目标的运动模式和估计器执行的模式匹配时(即模式切换前和模式正确匹配后), ZEM估计误差的均值满足如下的迭代方程

(41)

而当存在模式失配时, μk满足

(42)

从式(39)和式(40)可以看出, 导弹的控制指令ukp未出现在式中, 这说明ZEM估计误差的方差不受导引律的影响. 该误差模型准确性的证明可参见文献[19], 这里不再赘述.

由前文分析可知, 每一时刻的ZEM估计误差均服从均值为μk、方差为σk2的高斯分布, 即z~kN(μk,σk2). 受基于跟踪滤波器残差进行机动检测理论的启发, 构造如下的中心加权的检验统计量

(43)

不考虑系统的起始状态估计误差, 当目标运动模式不发生切换时, z~kN(0,σk2). 此时, χk2服从自由度为1的χ2分布, 即χk2χ2(1). 相反, 当目标运动模式改变后, ZEM的误差随着模式决策延迟的增大逐渐增大, 对应χk2的取值增大; 而当误差增大到一定程度后χk2χ2(1)的条件将不满足, 此时认为系统的模式决策延迟不可接受. 因此, 在给定系统容许的虚警概率后, 根据上述的一致性约束条件可计算得出MAMDD.

下面通过一个典型的TBM拦截场景介绍MAMDD的具体求解过程, 仿真参数见表2[1117-20]. 系统可容许的虚警率α设定为0.05, 查表可知χ1α2(1)=3.84. 评判标准如下: 当χk23.84, ZEM估计误差位于系统容许的误差范围内, 对应的模式决策延迟是制导系统可接受的; 反之, 则认为该模式决策延迟超出了系统可容许的范围之内. 图4给出了tsw=2.0sΔm=10gχk2的变化. 如图所示, 目标模式切换前(tsw2.0s, 即tgo1.03s), ZEM估计误差的均值为零, 对应的χk2取值为零, 因此χk2始终位于置信边界χk2=3.84范围内. 目标模式切换后(tsw>2.0s, 即tgo<1.03s), 由于系统模式决策延迟的存在, ZEM估计误差增大, χk2也随之增大. 经过一段时间后, χk2的取值超出系统给定的置信边界χ0.952. 此时, 我们认为ZEM的估计误差过大, 估计的ZEM将不可靠, 它会误导导弹生成错误的制导指令从而导致系统的制导性能下降. 在这种思路下, 将系统的MAMDD定义为χk2χk2=3.84交点对应的时刻与目标模式切换时刻之间的时间差值. 由于系统的时变特性, 这里很难得到MAMDD的解析表达式, 因此需要通过数值计算方法进行求解. 综上所述, MAMDD的计算过程可归纳如下.

表 2  仿真参数
Table 2  Simulation parameters
参数类型参数名称单位值 (范围)
弹目参数Vpm/s2300
Vem/s2700
apmaxg30
aemaxg15
τps0.2
τes0.2
观测参数Ts0.01
σθmrad5
σam/s21
场景参数r0m15000
ϕp(0)radπ/18
ϕe(0)rad>π/2且满足碰撞三角形
目标机动方式随机乒乓
估计器参数swg2/Hz1
初估计误差x~0=[0,0,0,0]T
初估协方差阵P0=[0000000000(aemax)200000]

图 4  tsw=2.0sΔm=10g下的χk2
Fig. 4  χk2 under tsw=2.0s and Δm=10g

初始化. 初始化拦截场景和估计器参数, 目标模式切换时刻tsw, 模式变化量, Δm=m2m1和系统可接受虚警率α.

步骤 1. 根据式(42)计算tk时刻ZEM估计误差的均值.

步骤 2. 根据式(40)计算tk时刻ZEM估计误差的方差.

步骤 3. 根据式(43)计算tk时刻检验统计量χk2.

步骤 4. 判断tk时刻χk2χ1α2(1)的大小, 若当前时刻满足χk2χ1α2(1), 则MAMDD=tktsw; 否则, 回到步骤1.

本节基于表2的拦截场景进一步讨论χk2和MAMDD的性质.

图5给出了tsw=1.0s(对应tgo=2.03s)、Δm分别取10 g和20 g两种情形下χk2的取值. 仿真过程中, 我们将模式决策延迟设置为无穷大. 如图5所示, 如果目标在同一时刻进行模式切换, 机动的强度越小, 对应χk2的取值越小. 因为在该情形下, Δm取值越小, ZEM估计误差的均值也越小, 对应的χk2值就越小. 图6给出了Δm=20gtsw分别取1.0 s和2.0 s (对应tgo=1.03s)两种情形下χk2的取值. 可以看出, 目标机动时刻越晚, 对应χk2的取值越小. 由前面的分析可知, 目标模式切换不影响ZEM估计误差的方差, 因此在Δm相同情形下, σk2在每一时刻的取值相等. 目标机动越早(红色虚线), 由于模式决策延迟无穷大, 每一时刻ZEM估计误差的取值越大, 对应χk2的值也就越大.

图 5  tsw=1.0s时不同机动幅度下的χk2
Fig. 5  χk2 under different maneuver magnitude for tsw=1.0s

图 6  Δm=20g时不同机动时刻下的χk2
Fig. 6  χk2 under different maneuver time for Δm=20g

图7给出了Δm分别取5 g, 10 g, 15 g, 20 g, 30 g时系统MAMDD与目标模式切换时刻的关系. 在仿真实验中, 我们假定拦截器的参数始终保持不变, 仅改变目标的机动参数. 如图7所示, MAMDD随着模式切换时刻呈现先减小后增大并最终达到无穷大的变化趋势, 这与文献[18]给出的结果是一致的. 可以看出, 当目标机动时刻较早时(即对应tgo取值较大), ZEM估计误差的方差取值较大, χk2的取值相对较小(见式(43)). 此时, χk2与置信边界相交的时间较长, 这意味着MAMDD的取值越大, 即系统对模式决策器的要求相对宽松. 当目标机动时刻越来越接近拦截终止时刻(即tgo取值减小)时, ZEM估计误差的均值和方差均逐渐减小, 对应的χk2取值也随着时间逐渐减小. 当满足χk2<3.84时, ZEM估计误差对拦截精度的影响可以忽略. 如果目标在此时机动将无益于逃逸, MAMDD的取值趋向于无穷大, 系统对模式辨识器的性能不作要求. 此外, 对比不同机动幅度下MAMDD的曲线可以看出, 当Δm的取值较小时, 对应的MAMDD的值越大. 这表明, 对于弱机动类型目标, 拦截系统对于模式决策器的要求也相对宽松.

图 7  不同Δm条件下MAMDD与模式切换时刻
Fig. 7  MAMDD with mode switch time for different Δm

表3对比了5组不同机动幅度下分别采用捕获区边界作为ZEM误差边界[18]和利用本文一致性约束条件作为ZEM误差边界的MAMDD. 对比5组数据结果可以看出, 在拦截周期的前段选用一致性约束条件系统对模式决策器的性能要求更为严格; 而在拦截周期的后半段选用捕获区边界作为约束条件系统对模式决策器的要求更加苛刻. 具体来看, 当tsw<2.2s (即tgo=0.83s)时, 采用一致性约束条件得出的MAMDD小于采用捕获区边界的MAMDD. 当tsw2.2s, 采用捕获区约束条件获取的MAMDD大于一致性约束条件下的MAMDD (注意当tsw=2.2sΔm取20 g和30 g时, 两种方法求得的MAMDD可看作近似相等). 因此, 为对模式决策器提出更为严格的要求以确保系统的拦截精度, 在末制导前段可以采纳一致性约束条件, 而在末制导后段应选用更为严格的捕获区边界作为ZEM估计误差的约束条件.

表 3  两种方法MAMDD对比
Table 3  Comparison of MAMDD with two methods
tsw (s)捕获区约束MAMDD (s)一致性约束MAMDD (s)
Δm=5g

0.61.350.64
1.20.940.53
1.80.580.54
2.20.370.60
2.60.18
Δm=10g

0.60.940.39
1.20.650.28
1.80.410.28
2.20.260.29
2.60.12
Δm=15g

0.60.720.29
1.20.500.20
1.80.320.19
2.20.200.25
2.60.09
Δm=20g

0.60.580.24
1.20.410.16
1.80.260.15
2.20.160.16
2.60.080.19
Δm=30g

0.60.420.17
1.20.300.11
1.80.190.10
2.20.120.11
2.60.050.13

本文在基于逻辑的集成估计导引的制导系统框架下, 针对末制导拦截场景推导了离散时间ZEM估计误差模型; 然后提出了一种满足一致性约束条件的系统最大可容许模式决策延迟的数值计算方法, 可为模式决策器的设计提供性能参考. 实验结果表明, 为确保系统的拦截精度, 在末制导前段可选用一致性约束作为ZEM估计误差的限制条件, 在后段应选用捕获区边界的限制条件. 开展目标运动模式辨识技术研究是下一步的主要工作.


网络客服QQ: 沈编辑

投诉建议:0373-5939925    投诉建议QQ:

招聘合作:2851259250@qq.com (如您是期刊主编、文章高手,可通过邮件合作)

地址:河南省新乡市金穗大道东段266号中州期刊联盟 ICP备案号:豫ICP备2020036848

【免责声明】:中州期刊联盟所提供的信息资源如有侵权、违规,请及时告知。

版权所有:中州期刊联盟(新乡市博翰文化传媒有限公司)

关注”中州期刊联盟”公众号
了解论文写作全系列课程

核心期刊为何难发?

论文发表总嫌贵?

职院单位发核心?

扫描关注公众号

论文发表不再有疑惑

论文写作全系列课程

扫码了解更多

轻松写核心期刊论文

在线留言