Способ выделения тренда нестационарного процесса с адаптацией интервалов аппроксимации

Иллюстрации

Показать все

Изобретение относится к области вычислительной техники, в частности к цифровой обработке сигналов. Техническим результатом является сокращение времени обработки. В способе при выделении тренда нестационарного процесса адаптируют интервалы аппроксимации таким образом, что дискретную реализацию нестационарного процесса, представляющую сумму полезного сигнала и шума, последовательно разбивают на интервалы, на каждом из которых осуществляют аппроксимацию методом наименьших квадратов, ширину первого интервала выбирают равной части от общей продолжительности единственной дискретной реализации, выполняют аппроксимацию данного интервала и, если несоответствие аппроксимации превышает заданное значение, аппроксимацию повторяют, задавая ширину интервала равной части ее предыдущего значения, для каждого последующего интервала задают ширину, равную значению на предыдущем интервале, выполняют аппроксимацию и, если получают несоответствие аппроксимации меньше заданного значения установленное число раз подряд, увеличивают ширину последующего интервала, а если получают несоответствие аппроксимации больше заданного значения, то ширину текущего интервала выбирают равной части ее имеющегося значения и повторяют аппроксимацию, причем если ширина последнего интервала выходит за пределы единственной дискретной реализации нестационарного процесса, то ширину этого интервала ограничивают шириной оставшегося неаппроксимированного интервала.

Реферат

Предлагаемое изобретение относится к области вычислительной техники и может быть использовано в системах управления и обработки сигналов, в частности в системах цифровой обработки сигнала, в работе систем управления и контроля, при обработке сигналов в системах автоматического управления, в расчетах при выделении тенденции развития каких-либо показателей и принятии решения об удалении результатов воздействия случайных факторов.

Пусть имеется временной ряд, который представляет собой последовательность полученных в равностоящие моменты времени t1, t2, …, tn n значений y1, у2, …, yn (где yi=y(ti), i=1, 2…, n) некоторой функции y=y(t), описывающей на интервале времени t1…tn единственную реализацию нестационарного процесса.

Рассматриваемый процесс состоит из аддитивной смеси некоторой систематической составляющей S(t), представляющей собой полезный сигнал, или тренд, и случайной составляющей u(t), представляющей собой шум или помехи: y(t)=S(t)+u(t).

Относительно случайной составляющей u(t) предполагаем, что математическое ожидание Mu(t)=0, дисперсия Du(t)=σ2 и значения u(t) в разные моменты времени некоррелированы (cov(ut,us)=0, t≠s). Тренд S(t) в общем случае является квазидетерминированным сигналом, который рассматривается как некоторый нестационарный процесс, аналитическое описание которого неизвестно.

Основная задача - выделение полезного сигнала (тренда) в условиях недостаточной априорной информации о статистических свойствах аддитивного шума и о виде функции полезного сигнала при наличии единственной дискретной реализации исследуемого нестационарного процесса. Априорно считается, что на некоторых не слишком малых интервалах времени функция S(t) может быть достаточно точно аппроксимирована полиномом низкой степени.

Известен способ выделения тренда, заключающийся в аппроксимации дискретной реализации y1, y2, …, yn исследуемого процесса функцией S'(t) путем использования метода наименьших квадратов, минимизирующего невязку . Здесь S'(t) - простая аппроксимирующая функция, которая на интервале времени [t1; tn] хорошо аппроксимирует полезный сигнал S(t) (Бендат Дж., Пирсол А. Прикладной анализ случайных данных: пер. с англ. – М.: Мир, 1989, стр. 114). Например, для линейной зависимости S'(t)=a+bt параметры a, b определяют из условия минимизации суммы квадратов отклонений элементов ряда y1, y2, …, yn исследуемого процесса от значений полинома S'(t) в соответствующих точках ti, т.е. из условия

Дифференцируя данное выражение по a и b и приравнивая их к нулю, получают систему линейных уравнений:

Решая полученную систему уравнений, определяют значения коэффициентов аппроксимации:

Недостатком описанного способа является вычислительная сложность выделения полезного сигнала. Это обусловлено тем, что при применении способа к сложным сигналам большой продолжительности, описываемым временным рядом с большим числом членов n, использование простых аппроксимирующих функций невозможно, а применение сложных функций с большим числом параметров, например полиномов высокой степени, резко увеличивает вычислительную сложность. При больших объемах выборки и отсутствии априорной информации о статистических свойствах случайного шума и модели полезного сигнала вместо полиномов высокой степени используют также кусочную аппроксимацию нестационарного процесса простыми функциями на коротких интервалах, но это тоже увеличивает вычислительную сложность способа.

Наиболее близким к предлагаемому изобретению по технической сущности и достигаемому результату (прототипом) является способ выделения тренда путем размножения оценок его единственной исходной реализации (РАЗОЦ) и устройство для его осуществления, заключающийся в том, что единственную дискретную реализацию нестационарного процесса, представляющую сумму полезного сигнала и шума, последовательно разбивают на интервалы, на каждом из которых осуществляют аппроксимацию методом наименьших квадратов. При этом исходную реализацию нестационарного случайного процесса предварительно разбивают на интервалы с помощью генератора случайных чисел, распределенных по равномерному закону, последующую упомянутую аппроксимацию исходной реализации нестационарного случайного процесса производят на каждом из упомянутых интервалов, разбиение на интервалы повторяют заданное число раз, затем последовательно в каждом промежутке разбиения исходной дискретной реализации нестационарного случайного процесса получают оценки тренда полезного сигнала, после чего по методу среднего арифметического усредняют полученные оценки тренда (патент RU №2207622, МПК G06F 17/18, опубл. 2003).

Недостатком описанного способа является повышенная вычислительная сложность процесса выделения полезного сигнала (тренда), обусловленная тем, что отсутствие адаптации числа и протяженности интервалов разбиения к динамике поведения сигнала приводит к необходимости разбиения реализации сигнала на большое число интервалов, причем процесс разбиения и процедура аппроксимации на каждом из интервалов должна повторяться многократно.

Предлагаемым способом решается техническая проблема уменьшения вычислительной сложности процесса выделения тренда.

Для достижения технического результата в способе выделения тренда нестационарного процесса с адаптацией интервалов аппроксимации, заключающемся в том, что единственную дискретную реализацию нестационарного процесса, представляющую сумму полезного сигнала и шума, последовательно разбивают на интервалы, на каждом из которых осуществляют аппроксимацию методом наименьших квадратов, ширину первого интервала выбирают равной части от общей продолжительности единственной дискретной реализации, выполняют аппроксимацию данного интервала и, если невязка аппроксимации превышает заданное значение, аппроксимацию повторяют, задавая ширину интервала равной части ее предыдущего значения, для каждого последующего интервала задают ширину, равную значению на предыдущем интервале, выполняют аппроксимацию и, если получают невязку аппроксимации меньше заданного значения установленное число раз подряд, увеличивают ширину последующего интервала, а если получают невязку аппроксимации больше заданного значения, то ширину текущего интервала выбирают равной части ее имеющегося значения и повторяют аппроксимацию, причем если ширина последнего интервала выходит за пределы единственной дискретной реализации нестационарного процесса, то ширину этого интервала ограничивают шириной оставшегося неаппроксимированного интервала.

Уменьшение вычислительной сложности процесса выделения полезного сигнала (тренда) вследствие сокращения или исключения многократного повторения аппроксимации исходной реализации заданным полиномом на всех интервалах и использованием на участках с различной шириной спектра интервалы с близкой к оптимальной протяженностью достигается за счет того, что ширину первого интервала выбирают равной части от общей продолжительности единственной дискретной реализации, выполняют аппроксимацию данного интервала и, если невязка аппроксимации превышает заданное значение, аппроксимацию повторяют, задавая ширину интервала равной части ее предыдущего значения, для каждого последующего интервала задают ширину, равную значению на предыдущем интервале, выполняют аппроксимацию и, если получают невязку аппроксимации меньше заданного значения установленное число раз подряд, увеличивают ширину последующего интервала, а если получают невязку аппроксимации больше заданного значения, то ширину текущего интервала выбирают равной части ее имеющегося значения и повторяют аппроксимацию, причем если ширина последнего интервала выходит за пределы единственной дискретной реализации нестационарного процесса, то ширину этого интервала ограничивают шириной оставшегося неаппроксимированного интервала.

Предлагаемый способ выделения тренда нестационарного процесса с адаптацией интервалов аппроксимации осуществляется следующим образом.

Изначально имеется наличие единственной дискретной реализации исследуемого нестационарного процесса y1, y2, …, yn, где yi=y(ti), i=1, 2, …, n, представляющего сумму полезного сигнала (тренда) и шума, т.е. y(t)=S(t)+u(t). Априорная информация об исследуемом процессе заключается в том, что на некоторых интервалах Δj⊂[t1, tn] полезный сигнал (тренд) достаточно точно описывается полиномом, где Δj=[tj-1, tj], j⊂[1, n]. Для описания способа считают, что степень полинома равна единице, т.е. S(t)=a+bt, хотя в общем случае это может быть самая произвольная функция.

Рассматриваемый способ содержит следующие шаги:

Шаг 0:

Определяют число входящих в первый аппроксимируемый интервал членов ряда m=int(n*k0), где функция int возвращает целое значение от аргумента, а коэффициент k0, лежащий на интервале (0, 1), определяют из динамических свойств исходного сигнала, например из ширины спектра исходного сигнала fmax: чем шире спектр, тем меньше величина k0 и в соответствии с теоремой Найквиста k0=(tn-t1)/[2fmax]. Если сведения об fmax отсутствуют, то полагаем k0=0,5.

Если m=n, то берут k0=k0*k0 и повторяют шаг 0.

Задают величину невязки ε, определяющую требуемую точность соответствия выделенного тренда имеющейся дискретной реализации. Очевидно, ее значение не должно быть меньше среднеквадратического отклонения шумовой составляющей u(t).

Шаг 1:

Запоминают первый отрезок исходного ряда {yi}, где i=1, …m;

Методом наименьших квадратов осуществляют аппроксимацию элементов ряда y1, y2, …, ym полиномом первой степени: S1(t)=a1+b1t.

Коэффициенты a1, b1 аппроксимирующего полинома S1(t)=a1+b1t определяют из условия минимизации суммы квадратов отклонений элементов ряда y1, y2, …, ym от значений полинома S1(t) в соответствующих точках, т.е. из условия

Для нахождения соответствующих данному условию значений коэффициентов a1, b1 используют формулы

Находят невязку ε1 аппроксимирующей функции S1(ti) на первом интервале ряда {yi}, где i=1, …, m, по формуле . Если невязка ε1>ε, то задают m=int(m*k1) и повторяют шаг 1 для нового значения m, где величину k1 выбирают из соображений скорости адаптации ширины интервала аппроксимации к характеру изменения динамики полезного сигнала (оптимально, если k1 лежит в пределах от 0,5 до 0,8). Если невязка ε1≤ε, то фиксируют индекс последнего члена рассмотренного ряда r=m, задают число аппроксимаций без повторного пересчета p=0, номер следующего интервала j=2 и переходят к шагу 2.

Шаг 2:

Если на очередном шаге окажется, что m+r>n, то задают m=n-r и рассматривают очередные m членов ряда {yi}, где i=r+1, r+2, …, r+m, r - индекс, заданный на предыдущем шаге. Методом наименьших квадратов аппроксимируют элементы ряда yr+1, yr+2, …, yr+m полиномом первой степени: Sj(t)=aj+bjt.

Из условия минимума суммы квадратов отклонений находят коэффициенты aj, bj аппроксимирующего полинома j-го интервала, дополнительно используя условие, необходимое для непрерывности ломаной аппроксимирующей функции Sj(tr)=Sj-1(tr), откуда следует aj=aj-1+(bj-1-bj)tr. Находят невязку εj аппроксимирующей функции Sj(ti) на отрезке ряда {yi}, где i=r+1, …, r+m, по формуле . Если невязка εj>ε, то полагают p=0, задают m=int(m*k1) и повторяют шаг 2 с r+1 новым значением m. Если невязка εj≤ε, то сохраняют значения aj, bj, фиксируют индекс последнего члена рассмотренного ряда r=r+m, подсчитывают число "удачных", не требующих повторного пересчета из-за невыполнения условия εj≤ε аппроксимаций p=p+1, и, если p превышает заданное число, например 3, полагают p=0 и увеличивают ширину последующего аппроксимируемого интервала m по формуле m=int(m*k2), где величину k2 выбирают из тех же соображений, что и k1 (оптимально, если k2 лежит в пределах от 1.2 до 2.0, или, например, k2=1/k1). Задают r=r+m и, если r<n, инкрементируют номер интервала j=j+1 и переходят к началу шага 2.

Если функция полезного сигнала (тренда) достаточно точно описывается полиномом заданной степени на некотором интервале и динамические свойства полезного сигнала (тренда) не изменяются на протяжении всей дискретной реализации исследуемого нестационарного процесса, то ширина всех интервалов будет равна ширине, выбранной на первом шаге. Следовательно, вычислительная сложность реализации способа уменьшается, так как существенно сокращается число повторного выполнения процедуры аппроксимации методом наименьших квадратов. Кроме того, способ обладает свойством адаптивности, благодаря которому протяженность и число интервалов оптимизируют, когда динамика изменения полезного сигнала (тренда) на очередном шаге отличается от его динамических свойств на предыдущем шаге. Это также способствует уменьшению вычислительной сложности реализации способа, т.к. протяженность интервалов выбирают максимально возможной, а значит, и общее число выполнения аппроксимаций будет минимальным. Например, предположим, что исходная дискретная реализация содержит два участка, из которых один занимает 10% ее протяженности и имеет частотный спектр, верхняя граница которого в 10 раз превышает аналогичную границу на другом участке. Положим, что для хорошего восстановления тренда достаточно каждый из таких участков разбивать на 5 интервалов. Тогда, при применении описанного способа потребуется всего 5+5=10 интервалов разбиения исходной дискретной реализации. Если считать, что на адаптацию протяженности интервала потребуется повторять аппроксимацию, например, 5 раз на первом интервале и 5 раз при переходе на другой участок (число повторов равно отношению логарифма отношения максимальных частот на участке к логарифму коэффициентов k1 или k2), то общее число аппроксимаций окажется равным 20. Поскольку местонахождение участка с расширенным частотным спектром заранее неизвестно, то в способе прототипа временной отрезок разбивают на 50 интервалов, исходя из протяженности высокочастотного участка. Если при этом число повторных разбиений на участки, а значит, и повторных аппроксимаций задать равным 10 для получения приемлемого усреднения, то общее число аппроксимаций составит 500, то есть окажется в 25 раз больше, чем в предлагаемом способе.

Кроме того, информацию о тренде в предлагаемом способе можно хранить в виде набора значений коэффициентов на каждом из интервалов разбиения, что многократно меньше числа членов последовательности yi на этих интервалах, тогда как в способе прототипа такой возможности нет.

Таким образом, использование предлагаемого способа выделения тренда нестационарного процесса с адаптацией интервалов аппроксимации приводит к уменьшению вычислительной сложности процесса выделения тренда.

Способ выделения тренда нестационарного процесса с адаптацией интервалов аппроксимации, заключающийся в том, что единственную дискретную реализацию нестационарного процесса, представляющую сумму полезного сигнала и шума, последовательно разбивают на интервалы, на каждом из которых осуществляют аппроксимацию методом наименьших квадратов, отличающийся тем, что ширину первого интервала выбирают равной части от общей продолжительности единственной дискретной реализации, выполняют аппроксимацию данного интервала и, если несоответствие аппроксимации превышает заданное значение, аппроксимацию повторяют, задавая ширину интервала равной части ее предыдущего значения, для каждого последующего интервала задают ширину, равную значению на предыдущем интервале, выполняют аппроксимацию и, если получают несоответствие аппроксимации меньше заданного значения установленное число раз подряд, то увеличивают ширину последующего интервала, а если получают несоответствие аппроксимации больше заданного значения, ширину текущего интервала выбирают равной части ее имеющегося значения и повторяют аппроксимацию, причем если ширина последнего интервала выходит за пределы единственной дискретной реализации нестационарного процесса, то ширину этого интервала ограничивают шириной оставшегося неаппроксимированного интервала.