Нелинейная адаптивная система автоматического управления

Патент 2267147

Авторы

Гольцов А.С. (RU)

Правообладатели

Гольцов Анатолий Сергеевич (RU)

Классы МПК

G05B13/04 - с использованием моделей или моделирующих устройств

Нелинейная адаптивная система автоматического управления

Иллюстрации

Показать все

Изобретение относится к адаптивным системам автоматического управления объектами с неизвестным математическим описанием и произвольными возмущающими воздействиями при наличии в задании системе управления нелинейных ограничений в форме равенств и неравенств на управляемые переменные, управляющие воздействия и траектории перехода объекта управления в требуемое состояние. Технический результат - обеспечение погрешности, асимптотически стремящейся к нулю. В системе блок формирования задания, вычислитель выходных сигналов системы измерительных устройств и генератор управляющих воздействий оснащены нелинейными преобразователями с сигмоидальными статическими характеристиками, обеспечивающими выполнение системой управления ограничений в форме неравенств. Вычислитель системы измерительных устройств образован параллельным соединением пропорционального, интегрирующего и дифференцирующего блоков, а генератор управляющих воздействий и наблюдатель переменных состояния выполнены в виде многомерных самонастраивающихся ПИД-регуляторов, реализующих алгоритмы модифицированных фильтров Калмана. 1 ил.

Реферат

Известны системы адаптивного управления, предназначенные для автоматического управления динамическими объектами с неизвестным математическим описанием, основанные на принципе разделения и стохастической теории оптимального оценивания (Красовский А.А. Адаптивный оптимальный регулятор с переменным порядком наблюдателя и временем экстраполяции // АиТ. 1994. №11; Острем К., Виттенмарк Б. Системы управления с ЭВМ. - М.: Мир, 1987. - с.388-405; Саридис Дж. Самоорганизующиеся стохастические системы управления. - М.: Наука, 1980). В соответствии с принципом разделения эти системы формируют управляющие воздействия путем решения детерминированной задачи оптимального управления с использованием в цепи обратной связи оптимальных оценок переменных состояния вместо их реальных значений. В состав систем адаптивного управления (как и в состав заявленного изобретения) входят: блок формирования задания (БФЗ), генератор управляющих воздействий (ГУВ) с блоком сравнения (БС) и самонастраивающимся регулятором (СР) и объект управления (ОУ), которые образуют прямую цепь системы управления, а также измерительное устройство и наблюдатель переменных состояния и(или) параметров (НПС), включенные в цепь обратной связи. Кроме того, в состав систем адаптивного управления (в отличие от заявленного изобретения) входят отбеливающие фильтры, формирующие оценки возмущающих воздействий из центрированных белых гауссовских шумов (ЦБГШ). Отличаются адаптивные системы с СР друг от друга математическими моделями ОУ; моделями отбеливающих фильтров; алгоритмами оценивания переменных состояния и(или) параметров модели системы управления; алгоритмами формирования управляющих воздействий. В качестве моделей ОУ и отбеливающих фильтров используют различные авторегрессии, временные ряды, полиномы и сплайны. НПС вычисляет функции распределения условных вероятностей переменных состояния ОУ и оптимальные оценки параметров и переменных состояния указанных моделей, используя результаты измерений выходных сигналов ОУ, априорные сведения об интенсивностях ЦБГШ и значения управляющих воздействий, реализованные в предыдущие моменты времени. Для вычисления этих оценок применяют алгоритмы стохастической аппроксимации, метод наименьших квадратов, метод максимума правдоподобия либо фильтр Калмана. Алгоритмы СР синтезируют путем решения задачи минимизации используемой функции штрафа в детерминированной постановке с помощью вариационного исчисления, принципа максимума или методом динамического программирования.

Адаптивные системы автоматического управления с СР удалось реализовать только в линейных системах и в простейших нелинейных системах (если заданы траектории перехода всех управляемых переменных ОУ в требуемое конечное состояние, ограничения в форме неравенств отсутствуют, при синтезе алгоритма СР используют квадратичную функцию штрафа). Однако в реальных задачах управления эти условия одновременно выполняются редко. Многие системы управления содержат устройства с нелинейными характеристиками (например, измерительные устройства с нелинейными статическими характеристиками, различные нелинейные преобразователи и т.п.). Обычно функции распределения вероятностей возмущающих воздействий отличны от гауссовских функций, часто эти функции распределения неизвестны по априорным данным. Кроме того, траектории перехода в требуемое конечное состояние заданы только для части переменных состояния ОУ, а для другой части переменных состояния с помощью неравенств (линейных и нелинейных) задано множество допустимых траекторий перехода в требуемое конечное состояние. В этих случаях принцип максимума приводит к нелинейной двухточечной краевой задаче, а динамическое программирование - к нелинейному уравнению Беллмана, которые нельзя решить численными методами в процессе управления в реальном масштабе времени (Бар-Шалом Я., Ци Э. Концепции и методы стохастического управления // Фильтрация и стохастическое управление в динамических системах / Под ред. К.Е.Леондеса. М.: Мир, 1980. С.74-122; Фельдбаум А.А. Основы теории оптимальных автоматических систем. - М.: Наука, 1966). Кроме того, указанные адаптивные системы управления реализуют алгоритмы пропорционального регулирования оценок переменных состояния, параметров и управляющих воздействий. Поэтому они имеют статическую ошибку управления в случаях, когда возмущающие воздействия отличны от ЦБГШ.

Последний недостаток частично устранен в адаптивной системе управления с самонастраивающимся ПИД-нейроконтроллером, формирующим управляющие воздействия по алгоритму ПИД-регулирования с автоматической настройкой параметров ПИД-регулятора с помощью обучаемой нейросети (Нейроуправление и его приложения. Кн.2. / Сигеру Омату, Марзуки Халид, Рубия Юсоф. - М.: ИПРЖР, 2000; Saiful A. and S. Omatu, «Neuromorphic self-tuning PID controller», Proc. of 1993 IEEE ICNN. San Francisco, pp.552-557, 1993). Эта система (прототип изобретения) имеет (как и заявленное изобретение): блок формирования задания; генератор управляющих воздействий, содержащий блок сравнения и ПИД-регулятор, и ОУ, образующие прямую цепь системы управления, систему измерительных устройств (ИУ) и НПС, включенные в цепь обратной связи. Входы БС соединены с выходами БФЗ и НПС. Выходы БС соединены с входами ПИД-регуляторов. БФЗ формирует требуемые значения управляемых переменных в текущий момент времени, требуемые средние значения этих переменных в скользящем временном окне и требуемые скорости изменения управляемых переменных. Выходные сигналы системы измерительных преобразователей связаны с управляемыми переменными известными функциональными зависимостями (линейными или нелинейными). В отличие от изобретения адаптивная система управления с самонастраивающимся ПИД-нейроконтроллером содержит формирователь оценок параметров ПИД-регулятора, выполненный в виде обучаемой нейросети. НПС этой системы выполнен в виде еще одной обучаемой нейросети и формирует оценки управляемых переменных и матриц чувствительности управляемых переменных к изменению управляющих воздействий. Обе нейронные сети образованы из статических нейронов и обучаются по алгоритму обратного распространения ошибки.

Однако адаптивная система с самонастраивающимся ПИД-нейроконтроллером не учитывает ограничения в форме неравенств на управляемые переменные и траектории перехода переменных состояния ОУ в требуемое конечное состояние. Кроме того, при использовании в системе управления динамической нейронной сети в качестве модели объекта управления алгоритм обратного распространения ошибки порождает нелинейную краевую задачу (которую, как указывалось, нельзя решить в реальном масштабе времени в процессе управления).

Сущность изобретения как технического решения, обеспечивающего с погрешностью, асимптотически стремящейся к нулю, автоматическое управление объектами с неизвестным математическим описанием при наличии в задании системе управления нелинейных ограничений в форме равенств и неравенств на управляемые переменные, управляющие воздействия и траектории перехода объекта управления в требуемое состояние, выражается в совокупности следующих признаков:

- полезная модель выполнена в виде адаптивной системы управления с самонастраивающимися ПИД-регуляторами и формирует оценки переменных состояния и управляющие воздействия с помощью модифицированных алгоритмов фильтра Калмана, в которых в качестве априорных моделей объекта управления и генератора управляющих воздействий используется авторегрессия скользящего среднего;

- каждое измерительное устройство образовано последовательным соединением измерительного преобразователя (с линейной или нелинейной статической характеристикой) и вычислителя, выполненного в виде параллельного соединения пропорционального, интегрирующего и дифференцирующего блоков;

- БФЗ, вычислитель системы измерительных устройств и ГУВ оснащены нелинейными преобразователями (НП), обеспечивающими выполнение системой управления ограничений, заданных неравенством . Такие НП имеют сигмоидальные статические характеристики s(x,a), заданные сплайнами или другими непрерывными функциями, например:

где:

s(x,a) - выходной сигнал НП;

x - входной сигнал НП;

а - заданный параметр, определяющий границы множества допустимых значений переменной x (входного сигнала НП);

p - целое число, которое выбирают из диапазона значений 0≤p≤3;

- нелинейный преобразователь БФЗ включен в дополнительный контур обратной связи и он формирует свои выходные сигналы (дополнительное задание системе управления) с учетом заданных ограничений в форме неравенств на траектории перехода переменных состояния в требуемое конечное состояние и текущих значений выходных сигналов системы измерительных устройств.

Изобретение решает задачу автоматического управления (с погрешностью, асимптотически стремящейся к нулю) многомерным динамическим объектом с неизвестным математическим описанием и произвольными возмущающими воздействиями при наличии нелинейных ограничений в виде следующих совместимых равенств и неравенств:

y_j(t_k)=h_j(z(t_k),t_k)+δ_j(t_k); j=1,2,...,n;

; t_k=k·Δt;

r_j(t_k)=ƒ_j(z(t_k),u(t_k),t_k)+ε_j(t_k);

;

где:

r_j(t_f)=f_j(β,u_опт(t_f),t_f); γ_i(t_f)=ϕ_i(β,u_опт(t_f),t_f);

y(t_k) - вектор выходных сигналов измерительных преобразователей;

z(t_k) - вектор управляемых переменных (выходных сигналов ОУ);

h(z(t_k),t_k) - вектор нелинейных статических характеристик измерительных преобразователей;

δ(t_k) - вектор погрешностей измерений;

Δt - шаг квантования времени t_k;

T_d - время дифференцирования;

Δh(t_k) - вектор заданных функций времени t_k;

η(t_k) - вектор допустимых погрешностей отклонения скоростей изменения управляемых переменных от предельных значений, заданных неравенством (2);

r_j(t_k) - известная по априорным данным функция, с помощью которой заданы координаты траекторий перехода в требуемое конечное состояние (3) части управляемых переменных, входящих в ограничение (4);

ϕ_i(z(t_k),t_k) - функция, с помощью которой задано ограничение (5) на допустимые траектории перехода другой части управляемых переменных в требуемое конечное состояние (3);

ε_j(t_k) - допустимая погрешность управления;

u(t_k) - вектор управляющих воздействий;

u_опт(t_k) - вектор оптимальных управляющих воздействий.

Сущность изобретения поясняет блок-схема адаптивной системы автоматического управления, изображенная на чертеже.

Заявленная адаптивная система автоматического управления, как и системы-аналоги, использует авторегрессию скользящего среднего в качестве априорных моделей объекта управления и генератора управляющих воздействий. Она, как и прототип, содержит (см. чертеж): блок формирования задания 1; генератор управляющих воздействий, образованный БС 2 и ПИД-регулятором 3, и объект управления 4, включенные в прямую цепь системы управления, систему измерительных преобразователей 5 и НПС 6, включенные в цепь обратной связи. При этом входы БС 2 соединены с выходами БФЗ 1 и НПС 6, а выходы БС 2 соединены с входами ПИД-регулятора 3. Выходы ОУ 4 соединены с входами системы измерительных преобразователей 5. Отличается заявленная адаптивная система автоматического управления от прототипа тем, что система измерительных устройств помимо измерительных преобразователей 5 содержит вычислитель 7, образованный параллельным соединением пропорционального блока 8, интегрирующего блока 9 и дифференцирующего блока 10. Входы вычислителя 7 соединены с выходами системы измерительных преобразователей 5, а его выходы соединены с входами НПС 6. Кроме того, БФЗ 1, ПИД-регулятор 3 и дифференцирующий блок 10 оснащены нелинейными преобразователями 11, 12 и 13 с сигмоидальными статическими характеристиками (1), обеспечивающими выполнение системой управления ограничений (2), (5) и (6). ГУВ полезной модели содержит дополнительный блок сравнения 14, входы которого соединены с выходами НПС 6 и НП 12, а выходы соединены с входами ПИД-регулятора 3. Входы НП 11 соединены с выходами дифференцирующего блока 10. Входы НП 12 соединены с выходами БФЗ 1 и НПС 6. Входы НП 13 соединены с выходами ПИД-регулятора 3, а выходы соединены с входами ПИД-регулятора 3, ОУ 4 и НПС 6.

Нелинейная адаптивная система автоматического управления реализует алгоритм управления следующим образом. БФЗ 1 по известным априорным данным формирует в скользящем временном окне следующее задание системе управления:

- текущие значения вектора r(t_k) (левую часть ограничений (4)), которые поступают в БС 2;

- текущие значения вектора γ(t_k) (левую часть ограничений (5)), которые поступают в НПС 6 и НП 12;

- алгоритм формирования правых частей ограничений (4) и (5), который поступает в НПС 6.

Вычислитель 7 формирует выходные сигналы системы измерительных устройств по алгоритму

;

а затем передает их текущие значения в НПС 6, где:

y^*(t_k) - вектор выходных сигналов системы измерительных устройств;

0≤α≤1 - весовой коэффициент (параметр регуляризации);

T_d - время дифференцирования;

- сглаженная оценка скорости изменения выходного сигнала y_j(t_k) измерительного преобразователя с номером j.

Нелинейный преобразователь 13 формирует вектор управляющих воздействий u(t_k) по алгоритму:

где - вектор выходных сигналов ПИД-регулятора 3. Кроме того, НП 12 формирует вектор своих выходных сигналов (дополнительное задание системе управления) с учетом ограничений (5) по алгоритму:

НПС 6 выполнен в виде многомерного самонастраивающегося ПИД-регулятора оценок управляемых переменных. Он реализует модифицированный алгоритм фильтра Калмана:

где:

b_j(t_k) - вектор коэффициентов чувствительности управляемой переменной z_j(t_k) к изменению управляющих воздействий;

ψ_j(t_k) - вспомогательная переменная;

- прогноз значения переменной x(t_k) в момент времени t_k, вычисленный по результатам измерений, выполненных в моменты времени t₁, t₂,...,t_k-1;

Т - постоянная времени сглаживающего фильтра (11);

- оценка переменной x(t_k), вычисленная в момент времени t_k-i;

, - векторы выходных сигналов НПС 6 (векторы оценок выходных сигналов БФЗ 1 и НП 12 соответственно).

НПС 6 по алгоритму (11)-(18) вычисляет текущие значения своих выходных сигналов (прогноз задания системе управления): вектор , который поступает в БС 2, и вектор , который поступает в НП 12 и БС 14. НПС 6 формирует свои выходные сигналы в предположении, что в момент времени t_k действуют управляющие воздействия u(t_k)=u(t_k-1), сформированные в предыдущий момент времени t_k-1. Нелинейный преобразователь 12 по алгоритму (10) формирует вектор - дополнительное задание системе управления, которое передает в БС 14. Блоки сравнения 2 и 14 формируют по уравнению

вектор сигналов рассогласования и их текущие значения передают в ПИД-регулятор 3. ПИД-регулятор 3 реализует алгоритм модифицированного фильтра Калмана

где: Q и R - положительно определенные матрицы.

Затем НП 13 из выходных сигналов ПИД-регулятора 3 формирует по алгоритму (9) текущие значения управляющих воздействий u_j(t_k).

Из формулы (1) непосредственно следует, что для выходного сигнала s(x,a) нелинейного преобразователя со статической характеристикой (1) выполняется неравенство при любых значениях его входного сигнала x и параметра а. Значит, оптимальную оценку переменной x, ограниченной неравенством , можно определить путем решения уравнения

s(x,a)-x=0.

Поэтому при синтезе алгоритмов НПС 6 и ПИД-регулятора 3 вместо неравенств (2), (5) и (6) использовались равенства (8), (10), (19) и (9).

Уравнения (11)-(18) алгоритма оценивания параметров и управляемых переменных (модифицированный фильтр Калмана) получены минимизацией функции штрафа

с помощью вариационного исчисления и инвариантного погружения с учетом используемой априорной модели состояния ОУ (в виде авторегрессии скользящего среднего)

где ξ_j(t_k) - погрешность априорной модели состояния ОУ.

Уравнения модифицированного фильтра Калмана (20)-(26), реализуемые ПИД-регулятором 3, получены минимизацией функции штрафа

с помощью вариационного исчисления и инвариантного погружения с учетом уравнений (9), (19) и апостериорной модели состояния ОУ

; .

Заявленная адаптивная система автоматического управления реализует алгоритмы пропорционально-интегрально-дифференциального регулирования управляющих воздействий и оценок параметров и управляемых переменных. Поэтому она обеспечивает погрешность управления, стремящуюся асимптотически к нулю.

Адаптивная система автоматического управления объектами с неизвестным математическим описанием и произвольными возмущающими воздействиями при наличии в задании системе управления нелинейных ограничений в форме равенств и неравенств на управляющие воздействия и траектории перехода объекта управления в требуемое состояние, которая содержит блок формирования задания, блок сравнения, генератор управляющих воздействий и объект управления, включенные в прямую цепь системы управления, систему измерительных устройств и наблюдатель переменных состояния, включенные в цепь обратной связи, отличающаяся тем, что в контур обратной связи системы управления включены нелинейный преобразователь и дополнительный блок сравнения, входы которого соединены с выходами нелинейного преобразователя и наблюдателя переменных состояния, а выходы соединены с дополнительными входами генератора управляющих воздействий; входы этого нелинейного преобразователя соединены с выходами блока формирования задания и наблюдателя переменных состояния; в прямую цепь системы управления установлен еще один нелинейный преобразователь, входы которого соединены с выходами генератора управляющих воздействий, а выходы соединены с входами наблюдателя переменных состояния, генератора управляющих воздействий и объекта управления; вычислитель выходных сигналов системы измерительных устройств образован параллельным соединением пропорционального, интегрирующего и дифференцирующего блоков, а дифференцирующий блок оснащен нелинейным преобразователем; нелинейные преобразователи имеют сигмоидальные статические характеристики, составленные с учетом ограничений, заданных в форме неравенств; генератор управляющих воздействий и наблюдатель переменных состояния выполнены в виде модифицированных фильтров Калмана, реализующих алгоритмы ПИД-регулирования управляющих воздействий и оценок параметров и управляемых переменных.