Адаптивная система управления с идентификатором и неявной эталонной моделью

Реферат

 

Изобретение относится к системам автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями. Технический результат заключается в упрощении условий и сокращении времени для достижения цели адаптации замкнутой системы управления, а также в расширении области применения системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) объектов управления с неконтролируемыми внешними возмущениями. Технический результат достигается за счет того, что система содержит сумматор, первый и второй регуляторы, фильтр низких частот, объект управления, блок текущей идентификации, блок априорной информации о матрице эффективности управления и блок настройки регуляторов. 1 ил.

Изобретение относится к системам автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями.

Прототипом изобретения является беспоисковая адаптивная система управления с непрямым адаптивным управлением и неявной эталонной моделью, описанная в работе [1, с. 492]. Структурная схема адаптивной системы управления для объектов с неконтролируемыми возмущениями включает в себя сумматор, два регулятора (один в прямой и один в обратной связи), объект управления и контур адаптации. Последний в свою очередь состоит из блока текущей идентификации, блока настройки регуляторов и логического блока, осуществляющего переключение работы контура адаптации с цикла идентификации на цикл настройки регуляторов и наоборот.

Рассмотрим построение такой системы управления для следующей задачи. Пусть объект управления (ОУ) описывается следующим матричным дифференциальным уравнением , где xRn - непосредственно измеряемый вектор состояния ОУ; xRm - вектор управления (в дальнейшем - закон управления); f - вектор неконтролируемых внешних возмущений, ограниченный по норме; A, B и D - матрицы неизвестных параметров ОУ с соответствующими размерностями, в общем случае переменные; - непосредственно измеряется или аналитически вычисляется по x.

Адаптивная система должна формировать такой закон управления, чтобы ОУ вел себя подобно эталонной модели, которая задана неявным образом в виде следующего дифференциального уравнения: где xм - вектор состояния модели; uм - ограниченное по норме входное воздействие модели; размерности соответствуют уравнению (1); Aм и Bм - матрицы параметров модели в общем случае переменные, причем Aм - гурвицева матрица (вещественные части собственных ее чисел строго отрицательны).

Точный закон управления можно найти только тогда, когда выполнено условие полного соответствия моделей [2].

rankB = rank(B, Aм - A) = rank(B, Bм) = rank(B, D) или, что тождественно BB+(Aм - A) = Aм - A; BB+Bм = Bм; BB+D = D, (3) где B+ - псевдообратная матрица к B. В дальнейшем будем считать, что условие (3) выполнено, тогда управление, которое назовем точным u* = B+[(Aм - A)x + Bмuм - Df], обеспечит асимптотические свойства ошибки адаптации: . Действительно, подставляя (4) в уравнение (1), учитывая (3) и (2), получим уравнение ошибки адаптации Однако по условию матрицы A, B и D неизвестны и внешние возмущения неизмеряемы, поэтому вместо (4) используется закон управления , где - оценки матриц A и B, доставляемые блоком текущей идентификации. Обновление параметров в законе управления производится циклически по управлению с логического блока. Блок текущей идентификации может быть построен на основе одного из известных алгоритмов идентификации.

Таким образом, замкнутая адаптивная система управления описывается уравнениями (1), (2), (5) при условии (3), а также включает алгоритм текущей идентификации и алгоритм переключения режимов работы контура адаптации.

В работах [1, 3, 4] указывается, что для достижения цели адаптации: с течением времени e _ 0 - требуется отсутствие неизвестных возмущений, а также необходимо иметь асимптотические оценки в конце цикла идентификации. Такое достаточно жесткое требование порождает ряд недостатков системы [3, 4]: - необходимость обеспечения процесса управления стойким возбуждающим входным сигналом порядка не менее n; - невозможность точной оценки параметров ОУ в замкнутой системе управления на некоторых режимах, например, на режиме стабилизации, когда uм = 0, что объясняется линейной зависимостью компонент вектор-функций x(t) и u(t), где t - текущее время; - большое влияние на качество идентификации и управления неконтролируемых внешних возмущений; - невысокая скорость адаптации, поскольку параметры закона управления корректируются только в конце цикла идентификации.

Следует также отметить, что затянутость по времени процесса оценивания неизвестных параметров ОУ обусловливает известное мнение о том, что указанная система на практике может обеспечить приемлемое качество управления только для линейных стационарных или квазистационарных ОУ.

Целью изобретения является упрощение условий и сокращение времени для достижения цели адаптации замкнутой системы управления, а также расширение области применения системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) объектов управления с неконтролируемыми внешними возмущениями.

Для теоретического обоснования достижения цели рассмотрим вопрос адаптации в непрерывной постановке при отсутствии возмущений (Df O). В качестве алгоритма текущей идентификации будем использовать алгоритм типа стохастической апроксимации, который в непрерывной постановке описывается следующим образом [5]: , где C = [A, B]; - ошибка идентификации; xтр = [xт,uт] - расширенный вектор состояния ОУ; Г - в общем случае переменная положительно определенная квадратная матрица размерностью (n + m), или скаляр; норма матрицы - ограничена. Из теории идентификации известно, что алгоритм (6) обладает более простыми и лучшими свойствами сходимости к нулю по сравнению со сходимостью оценок параметров. Действительно, если назначить функцию Ляпунова вида V = т , то ее производная на уравнении (6) имеет вид Уравнение (7) показывает, что при ограниченных нормах (это справедливо для подавляющего большинства прикладных задач) и при достаточно большой норме матрицы Г с течением времени _ 0 , причем без каких-либо дополнительных условий. Также можно указать, что уравнение (6) описывает динамическую систему с матрицей собственного движения xpxтpГ , которая имеет единственное ненулевое собственное число xТpГxp , равное собственной частоте системы, или собственной частоте алгоритма идентификации (a) .

В связи с указанным найдем зависимость ошибки адаптации от ошибки идентификации. Для этого вычтем из уравнения (1) уравнение (2), получим Прибавляя и вычитая из правой части полученного Aмx, комбинируя слагаемые и учитывая (3), (4), найдем Для поиска зависимости невязки B(u - u*) от уравнение (5) с учетом равенств (3), (4), (6) и (1) запишем в виде Последнее слагаемое вынесено за скобки в силу очевидного равенства . Отсюда следует, что Уравнение (9) показывает, что его выражение в квадратных скобках всегда ортогонально строкам матрицы , или, согласно свойствам псевдообратной матрицы, - столбцам матрицы [6]. В связи с этим общее решение уравнения (9) будет иметь вид B(u-u*)- = , (10), , где - матрица такая, что ; - произвольный вектор соответствующей размерности. Уравнения (8) и (10) описывают искомый результат.

Очевидно, наиболее важным является случай, когда в уравнении (10) невязка B(u - u*) не зависит от неопределенного член . Одним из возможных вариантов этого является случай, когда выполняется условие [7] Для того чтобы доказать это утверждение, предположим, что rankB = k min (n, m). Тогда матрицу B можно представить через скелетное разложение в виде [6] , где F и L - матрицы размерностью n k и k m соответственно такие, что rankF = rankL = k. В этом случае равенство (11) влечет за собой выполнения условия , или, согласно свойствам псевдообратной матрицы, . Последнее обуславливает то, что , где Ek - единичная k k матрица [6]. Следовательно, умножение уравнения (10) слева на матрицу ограниченной нормы дает .

В свою очередь, частным к условию (11) является случай, когда столбцы матрицы B линейно зависимы со столбцами , т.е.

Действительно, в этом случае строки матрицы B+ линейно зависимы со строками матрицы , и на основании (10) B+ = 0 . В результате умножение уравнения (10) слева на матрицу BB+ дает вместо (12) B(u-u*) = BB+. .

Таким образом, если выполнено хотя бы одно из условий: (11) или (13), то уравнение ошибки адаптации описывается простым линейным дифференциальным уравнением , где матрица K имеет ограниченную норму, т.е. при _ 0 достигается цель адаптации.

Следует однако отметить, что для выполнения условия _ 0 требуется , но последнее согласно свойствам уравнений (6) и (7) приводит к увеличению скорости изменения оценок, возрастанию норм , что препятствует сходимости ошибки идентификации и может привести к возникновению высокочастотных резонансных явлений. Для устранения этого неблагоприятного факта примем во внимание, что, как правило, рабочие частоты ОУ находятся в низкочастотной области. Поэтому достаточно управление (5) пропускать через фильтр низких частот с частотой среза (ф) меньшей, чем a , но превышающей диапазон рабочих частот ОУ. Действительно, фильтрация управления соответствует устранению высокочастотной составляющей оценки с сохранением ее низкочастотной части . Последняя образует низкочастотную составляющую ошибки идентификации: . Поскольку выбором матрицы Г обеспечено стремление к нулю ошибки идентификации, то стремится к нулю и указанная ее низкочастотная часть. Следовательно, в области рабочих частот ОУ будут наблюдаться асимптотические свойства ошибки адаптации.

Из изложенного следует ряд выводов: - требование асимптотической точности оценок параметров ОУ является лишь частным случаем достижения цели адаптации; - цель адаптации можно достигнуть, если наложить довольно слабые ограничения (11) или (13) на оценку матрицы эффективности управления объекта (если B - скаляр, то достаточно ; эти ограничения не основаны на собственных динамических свойствах ОУ и могут быть получены из небольшой априорной информации об управляемом объекте; для выполнения условия (11) или (13) в структурную схему системы целесообразно ввести блок априорной информации о матрице эффективности управления объекта; по сигналам с этого блока будет производиться коррекция текущей оценки ; - выбором матрицы Г алгоритма идентификации (6) можно всегда добиться требуемой скорости сходимости ошибки идентификации , что дает, во-первых, увеличение скорости адаптации замкнутой системы, а, во-вторых, - возможность: организации непрерывной подстройки закона управления по текущим оценкам параметров ОУ, устранения цикличности работы контура адаптации, а следовательно, и устранения логического блока; - нет никаких дополнительных требований к входному сигналу ОУ, кроме u 0 , и поэтому адаптивная система управления может функционировать на фоне естественных управляющих сигналов; - возможно расширение области применения адаптивной системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) ОУ, у которых скорость изменения параметров ограничена; - в связи с тем, что качество адаптации явно не зависит от качества оценок, доставляемых идентификатором, возможно использование системы при воздействии на ОУ неконтролируемых внешних возмущений, ограниченных по норме; действительно, в этом случае ошибка идентификации будет иметь вид , а уравнение (7) - соответственно , остальные уравнения останутся прежними; в области рабочих частот ОУ норма матрицы ограничена, и поэтому выбором матрицы Г всегда возможно в указанной области частот добиться сходимости и e .

Следует отметить, что если алгоритм идентификации дискретный, то требованиями сходимости являются: во-первых, все собственные числа матрицы Гi должны находится в пределах , а, во-вторых, период дискретизации алгоритма должен быть достаточно малым (i - текущий момент времени). Это следует из рассмотрения уравнения (6) в разностном виде , где - определяется дискретным алгоритмом идентификации. Умножим последнее равенство справа на xpi, получим При достаточно малом шаге дискретизации , и поэтому можно записать i+1 i(1-xTpiГixpi). . Сходимость дискретной ошибки будет иметь место, если выражение в круглых скобках последнего равенства будет по модулю меньше единицы, или 0 < xTpiГixpi< 2. . Поделив это неравенство на xTpixpi и используя отношение Релея [6], найдем указанные требования к матрице Гi. Для дискретной формы алгоритма a= xTpiГixpi/H , где H - шаг дискретизации.

Полученные выводы, в частности, подтверждаются численными исследованиями, результаты которых приведены в работе [7].

На чертеже представлена структурная схема дискретной адаптивной системы управления с идентификатором и неявной эталонной моделью.

Структурная схема содержит сумматор 1, первый 2 и второй 3 регуляторы, фильтр 4 низких частот, объект 5 управления, блок 6 текущей идентификации, блок 7 априорной информации о матрице эффективности управления объект, блок 8 настройки регуляторов.

Адаптивная система работает следующим образом.

Задающее воздействие в виде [BмUм]t подается на первый вход сумматора 1. На второй вход сумматора поступает сигнал с выхода второго регулятора 3. Выход сумматора связан с первым входом первого регулятора 2, этот регулятор окончательно формирует управление в соответствии с зависимостью Выход первого регулятора связан со входом фильтра 4 низких частот, пропускающего рабочие частоты ОУ. Выход фильтра связан со входом объекта 5 управления и с первым входом блока 6 текущей идентификации. Выход объекта управления связан с первым входом второго регулятора 3, преобразующего входной сигнал xi в виде , и со вторым входом блока текущей идентификации. Выход блока 7 априорной информации о матрице эффективности управления объекта подключен к третьему входу блока текущей идентификации. Блок текущей идентификации по входным сигналам с объекта управления: - формирует текущие оценки параметров ОУ. Вектор может либо непосредственно измеряться, либо аналитически вычисляться в блоке текущей идентификации по текущим значениям x, например, на основе полиномиальной или тригономтрической аппроксимации на скользящем интервале /8/. Алгоритм текущей идентификации блока 6 относится к классу алгоритмов типа стохастической аппроксимации, в качестве которого можно использовать алгоритм, описанный в работе /9/ Здесь a= H-1 - выбирается из условия a> ф . Для выполнения требований (11) или (13) на каждом шаге идентификации в блоке 6 производится коррекция оценки . Такая коррекция должна быть с "минимальным" изменением исходной матрицы и может быть организована следующим образом. Блок 7 выдает в блок текущей идентификации информацию о матрице B0 размерностью n m. Эта матрица учитывает априорную информацию о матрице эффективности управления объекта в виде соблюдения равенства rank(BToB) = rankB, (14) , Предположим, что , где Gi - какая-то матрица размерностью m m. Оценку определим как , где i - минимальная по норме добавка до невырожденности матрицы . Эта добавка может быть получена, например, на основе разложения квадратной матрицы на треугольные сомножители [6] с минимальной коррекцией последовательной процедуры разложения с целью устранения нулевых диагональных элементов сомножителей. Полученные сомножители в дальнейшем перемножаются, формируя . Скорректированная оценка будет иметь вид . Тогда , что следует из равенства (14) и утверждения о том, что умножение любой матрицы на невырожденную соответствующей размерности не изменяет ранга исходной матрицы /6/. Оценка используется при формировании управления и заменяет оценку для следующего шага алгоритма идентификации.

Выход блока текущей идентификации, через который выдаются оценки , связан с блоком 8 настройки регуляторов. Этот блок вычисляет . Для реализации псевдообращения матриц можно использовать последовательный метод Гревилля [6]. Первый выход блока 8 связан со вторым входом первого регулятора, по нему передается информация о . Второй выход блока 8 связан со вторым входом второго регулятора, по нему передается информация о матрице .

Литература: 1. Справочник по теории автоматического управления./Под ред. А.А.Красовского. - М.: Наука, Гл. ред. физ. - мат. лит., 1987. - 712 с. (прототип).

2. Уткин В.Н. Скользящие режимы в задачах оптимизации и управления. - М. : Наука, 1981.

3. Изерман Р. Цифровые системы управления: Пер. с англ. - М.: Мир, 1984, 541 с.

4. Острем К.И. Адаптивное управление с обратной связью//ТИИЭР - 1987, N 2, т. 75, с. 4 - 45.

5. Цыпкин Я.З. Основы информационной теории идентификации. - М.: Наука. Гл. ред. фиг.-мат. лит., 1984. 320 с.

6. Гантмахер Ф.Р. Теория матриц. - М.: Наука, Гл. ред. физ.-мат. лит., 1988, с. 552.

7. Буков В.Н., Круглов С.П., Решетняк Е.П. Адаптируемость линейной динамической системы с идентификатором и эталонной моделью//Автоматика и телемеханика - 1994, N 3, с. 99 - 107.

8. Пашковский И.М., Леонов В.А., Поплавский Б.К. Летные испытания самолетов и обработка результатов испытаний. - М.: Машиностроение, с. 416, 1985.

9. Гроп Д. Методы идентификации систем: Пер. с англ. - М.: Мир, 1979, с. 302.

Формула изобретения

Адаптивная система управления с идентификатором и неявной эталонной моделью, содержащая объект управления и сумматор, первый вход которого подключен к задающему воздействию, а выход - к первому входу первого регулятора, выход объекта управления подключен к первому входу второго регулятора и к первому входу блока текущей идентификации, выход второго регулятора подключен к второму входу сумматора, выход блока текущей идентификации подключен к входу блока настройки регуляторов, первый выход которого подключен к второму входу первого регулятора, а второй выход - к второму входу второго регулятора, отличающаяся тем, что она дополнительно содержит фильтр низких частот, вход которого подключен к выходу первого регулятора, а выход подключен к входу объекта управления и к второму входу блока текущей идентификации, блок априорной информации о матрице эффективности управления объекта, выход которого подключен к третьему входу блока текущей идентификации.

РИСУНКИ

Рисунок 1