Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Градиентный алгоритм адаптации



Подставляя выражение (4.25) для градиента функционала Ф2(W) в интегральное уравнение (4.32) *, после замены < E > W на W (поскольку < E > − единичная матрица) и небольших перестановок получаем:

.       (4.36)

Построим структурную схему, которая управляла бы весовым вектором W(T) в соответствии с уравнением (4.36). Как и прежде, основными функциональными элементами этой схемы служат N идеальных интеграторов, каждый из которых формирует соответствующую компоненту вектора W(T):

  4.36΄)

Фигурная скобка с индексом n означает n-компоненту произведения матрицы на вектор.

На входах интеграторов должны действовать сигналы, соответствующие квадратной скобке выражения (4.36΄). В предыдущем разделе было показано, что сигнал , соответствующий первым двум слагаемым квадратной скобки, представляет собой комплексный коэффициент корреляции сигнала n-го канала  и сигнала на выходе ААР: . Он может быть сформирован комплексным коррелятором (КК), техническая реализация которого обсуждается в главе 7.

Последнее слагаемое соответствует умножению матрицы на вектор и может быть получено с помощью аналогового матричного преобразователя или соответствующего процессора. Представленная на рис. 4.8 структурная схема в точности соответствует уравнению (4.36). Это техническое решение, защищенное авторским свидетельством [26], по идее, обеспечивает потенциально лучшие характеристики в отношении сохранения исходной ДН.

Рис. 4.8. Структурная схема ААР, осуществляющая градиентный спуск к минимуму функционала Ф2(W)  

Потренируйте инженерный стиль мышления.

1. Пусть в момент включения цепей адаптации на выходах интеграторов сигналы равны нулю, а потому Wn = 0. Предположим, что нет ни помех, ни внутренних шумов {Ŝ n = 0}. При этом Rn = 0 вне зависимости от значения сигнала Ŝвых на выходе ААР. Убедитесь, что это состояние не может сохраняться, весовые коэффициенты Wn будут изменяться до тех пор, пока не установятся значения Wn = W0n.

2. Покажите, что благодаря матричному преобразователю m < Z > интеграторы охвачены отрицательной обратной связью и превращаются в совокупность взаимно связанных ФНЧ. Поскольку в общем случае доказательство этого факта требует использования знаний и приемов, выходящих за рамки учебной программы вузов радиотехнического профиля, то выполните необходимые рассуждения для простейшей ситуации − одноканальной системы (N = 1).

4.5. Минимизация критерия Ф3(W)

Минимизация функционала Ф3(W) по сути представляет собой задачу наилучшего среднеквадратичного приближения к исходной амплитудной ДН |F0(θ)| при условии требуемого ослабления мощности помех на выходе ААР. Как отмечалось в главе 2, даже в отсутствии каких-либо дополнительных требований к искомому решению нет аналитических методов оптимального приближения к заданной  амплитудной  ДН,  хотя  бы  потому,  что  минимизируемый  функционал || |SWnfn (θ)| − |F0(θ)| ||2 является невыпуклым многоэкстремальным функционалом. Поэтому в рассматриваемом случае немыслимы блоки адаптации типа обращения корреляционной матрицы, осуществляющие формирование оптимального весового вектора в результате обработки текущих значений коэффициентов корреляции принимаемых сигналов.

Поисковые алгоритмы минимизации целевого функционала Ф3(W) остаются единственной возможностью и в качестве инструмента расчетно-теоретических исследований, и тем более как основа для реализации блока адаптации. В теории автоматического управления [27] известен так называемый универсальный оптимизатор, позволяющий для любого линейного объекта автоматически отслеживать состояние, соответствующее локальному минимуму произвольного целевого функционала. Принцип действия такого оптимизатора достаточно прост.

На рис. 4.9,а представлена обобщенная структурная схема оптимизатора в одноканальном варианте. Текущее состояние y(t) объекта управления изменяется под воздействием внешнего возмущения ε(t) и управляющего воздействия x(t). По текущему состоянию y(t) управляемого объекта блок измерения и/или вычисления формирует оценку его отклонения от оптимального состояния, оценку, определяемую целевой функцией Ф(у).

а
б
Рис. 4.9. Одноканальный оптимизатор: а – структурная схема; б – принцип работы

Регулирование осуществляется следующим образом. Управляющее воздействие x(t) состоит из суммы медленно меняющегося сигнала х с выхода интегратора и достаточно малого по амплитуде поискового возмущения δ(t). Как правило, это гармоническое колебание малой амплитуды α с частотой Ω: δx = α sin(Ωt) . Поисковые возмущения приводят к тому, что сигнал Ф(t) = Ф(у(x + δ(t))) содержит флуктуационную составляющую δФ(t) частоты Ω. В рассматриваемом одноканальном варианте коррелятор представляет собой амплитудно-фазовый различитель*, который выделяет постоянную составляющую произведения измеряемого сигнала с опорным сигналом δ(t).

По сути, оптимизатор реализует в реальном масштабе времени процесс градиентного спуска к минимуму целевой функции Ф(х) = Ф(у(х)). Рис. 4.9,б поясняет это. Если постоянная составляющая х управляемого параметра, формируемая интегратором, в данный момент времени имеет значение х1, находящееся слева от оптимального значения х2, то, как видно из рисунка, вызванные возмущающим воздействием δx(t) флуктуации δФ(t) целевой функции противофазны самим возмущениям. Поэтому сигнал на выходе коррелятора отрицателен и с учетом последующего суммирования со знаком минус вызовет увеличение значения х1, т.е. движение в сторону оптимума.

Если значение х3 управляемого параметра находится справа от оптимального значения х2, то флуктуации δФ(t) целевой функции синфазны возмущениям, а потому значение х3 изменяется в сторону его уменьшения, т.е. опять происходит движение в сторону оптимума. В оптимальной точке х2 флуктуации δФ(t) очень малы и к тому же характеризуются удвоенной частотой. Поэтому на выходе интегратора сохраняется оптимальное значение х2.

В многоканальном варианте (при управлении N параметрами) оптимизатор содержит N каналов, генератор возмущений каждого из которых формирует сигнал, ортогональный сигналам возмущений остальных каналов, например, гармонические сигналы разных частот Ωn. Это обеспечивает независимую работу всех каналов за счет того, что каждый коррелятор из общих флуктуаций δФ(t), содержащих составляющие всех частот Ωn, за счет опорного сигнала «реагирует» только на «свою» составляющую.

При всех достоинствах такого оптимизатора, в первую очередь связанных с его универсальностью и относительной простотой, ему свойственен принципиальный недостаток – постоянное присутствие поисковых возмущений. Применительно к ААР это вызовет непрерывные флуктуации ДН, а следовательно, и провалы в направлениях на источники помех будут флуктуировать, что ограничит степень ослабления мешающих сигналов. Можно построить более эффективный алгоритм минимизации функционала Ф3(W), основанный на идее рекурсивной коррекции фазовой диаграммы при синтезе антенн по заданной амплитудной ДН [28].

Дело в том, что если фазовая диаграмма ψ0(θ) исходной комплексной ДН  совпадает с фазовой диаграммой ψ(t,θ) АР в текущий момент времени , т.е. ψо(θ) = ψ(t,θ), то значения функционалов Ф2(W) и Ф3(W) совпадают. Действительно,

 (4.37)

поэтому минимизацию функционала Ф3(W) можно свести к антиградиентному спуску (в реальном времени или в процессе вычислений) к минимуму функционала Ф2(W), но при этом необходимо непрерывно отслеживать изменение текущей фазовой диаграммы ААР ψ(t,θ) и корректировать фазовую диаграмму ψо(θ) исходной ДН, используя в качестве нее текущую фазовую диаграмму ААР: ψо(θ) = ψ(t, θ).

В структурной схеме ААР (см. рис. 3.2) исходная ДН  представлена вектором W0 весовых коэффициентов, задающих исходное состояние ААР (в отсутствии помех). Поэтому изменение ψо(θ) означает такое изменение вектора W0, при котором

.                   (4.38)

Решение уравнения (4.38), минимизирующее среднеквадратичное отклонение, находится как решение системы N линейных комплексно-значных алгебраических уравнений относительно N неизвестных {W0n}:

,                           (4.39)

где  

,   .       (4.40)

Или в матричной записи:

< A > W0 = b.                              (4.41)

На рис. 4.10 изображена структурная схема возможного варианта построения ААР, минимизирующей целевой функционал Ф3(W). Сплошными линиями представлены элементы структурной схемы ААР, функционирующей по критерию Ф2(W) (см. рис. 4.8), пунктирными – дополнительные цепи, осуществляющие коррекцию исходного весового вектора W0. Эта же схема прекрасно иллюстрирует способ цифрового моделирования динамики адаптации подобной ААР, который сводится к  рекурсиям  конечно-разностного  алгоритма  моделирования  динамики

Рис. 4.10. Структурная схема контура управления ААР, минимизирующего функционал Ф3(W)  

регулирования в рассматриваемой схеме. Рекурсии на шаге i определяются следующими выражениями:

;

;   

;

;

.

Здесь  Ti = i ∆t   (  − малый временной дискрет);  β = exp(−∆t/Tф);  Кф, Тф − параметры ФНЧ; матрица < A > и вектор b образованы коэффициентами (4.40). Последние три строчки рекурсий моделируют процесс коррекции исходной фазовой диаграммы, косвенно задаваемой вектором W0.

Динамика процесса адаптации

Вводные замечания

Замечание 1. В ААР используются два типа алгоритмов управления весовыми коэффициентами. Алгоритм обращения корреляционной матрицы сводится к непосредственному вычислению оптимального вектора в результате решения системы уравнений (4.30) или (4.31). Алгоритм градиентного спуска реализует «движение» в реальном масштабе времени к минимуму целевого функционала по «направлению» его антиградиента (4.24) или (4.25), т.е. относится к алгоритмам поискового типа.

Как уже отмечалось, это только кажется, что алгоритм обращения корреляционной матрицы мгновенно устанавливает оптимальное состояние ААР, никаких переходных режимов не возникает и, следовательно, нет предмета для анализа динамики управления ААР. Однако ясно, что реализация этого варианта требует «измерения»* текущих значений комплексных коэффициентов взаимной корреляции принимаемых сигналов, которые и образуют корреляционную матрицу < R > помеховых сигналов. Для этого необходима совместная обработка принимаемых сигналов , включающая усреднение на интервале времени ∆Т, как минимум, заметно превышающий интервал корреляции помеховых сигналов. Причем, с ростом числа помех и возникновением ситуаций**, при которых ухудшается устойчивость решения систем уравнений, элементы матрицы < R > должны оцениваться с возрастающей точностью, и это замедляет процесс управления из-за необходимости увеличивать время ∆Т обработки принимаемых сигналов.

Кроме того, в варианте обращения корреляционной матрицы ААР является разомкнутой системой автоматического регулирования, и поэтому к ее элементам предъявляются жесткие требования. В первую очередь, это касается фазовой стабильности трактов и всех управляемых элементов. Нестабильность их характеристик или их отклонение от расчетных зависимостей ограничивает точность воспроизведения полученного решения и, соответственно, степень подавления мешающих сигналов.

Привлекательная особенность ААР, реализующих градиентный алгоритм управления, состоит в том, что, как и во всякой системе регулирования с обратной связью, вызванные нестабильностью любых элементов отклонения характеристик цепей и объекта управления отрабатываются в процессе управления и практически не ухудшают достижимого качества. Естественно, существуют ограничения на предельные отклонения этих характеристик, но они оказываются легко выполнимыми.

Оба подхода к организации цепей адаптации представляют практический интерес, и обилие публикаций подтверждает это. Однако мы ограничимся градиентными алгоритмами по двум причинам. Во-первых, для телекоммуникационных систем наибольший интерес представляет целевой функционал G3(W), минимизация которого не сводится к обращению матрицы и требует использования поисковых алгоритмов. Во-вторых, студенты радиотехнических специальностей оказываются в математическом отношении достаточно подготовленными к анализу динамики регулирования ААР при градиентной минимизации целевого функционала. В то время как статистические методы анализа свойств алгоритмов обращения корреляционной матрицы, связанные, например, с применением обучающих выборок и других утонченных приемов обработки случайных сигналов, лежат далеко за пределами учебных курсов. 

Замечание 2. Как было показано в главе 4, реализация градиентной минимизации функционалов Ф1(W) и Ф2(W) для ААР приводит к структурным схемам, представленным на рис. 4.5 и 4.8. Поэтому возможны два уровня анализа алгоритма антиградиентного спуска: сугубо математический, когда рассматривается функционал и временной процесс его минимизации, или технический, когда анализируются процессы, протекающие в соответствующих схемах ААР (в той или иной степени идеализированных, естественно). Инженеру полезно уметь выполнять анализ на обоих уровнях, поэтому в этой главе и тот и другой будут перемежаться.

5.2. Процесс градиентной минимизации функционала Ф1(W)

Численное моделирование

Перед тем как перейти к формульному анализу динамики управления ААР в общей постановке (N элементов АР, М источников помех) чрезвычайно полезно (и интересно!) выполнить численное моделирование, причем вручную, на калькуляторе. Естественно, при этом целесообразно ограничиться простейшей ситуацией, представленной на рис. 5.1: АР является линейной эквидистантной решеткой с шагом d = λ/2; состоит из основного элемента, к которому привязано начало координат, и двух компенсаторов; все элементы изотропны; интенсивная помеха, мощность которой значительно превышает уровень внутренних шумов, приходит с направления θ1 = 60°.

 

Рис. 5.1. ААР с двумя компенсирующими элементами

Получим формулы, которые на уровне комплексных амплитуд описывают состояние ААР в момент времени T. Для упрощения расчетов будем пренебрегать наличием внутренних шумов. Обозначим через Ŝ0 комплексную амплитуду помехового сигнала на выходе основного элемента. Учитывая, что фазовые сдвиги, обусловленные разностью хода лучей, при выбранной геометрии и положении источника помехи равны k d cos(θ1) = 90° и 2k d cos(θ1) = 180°, запишем сигналы на выходах компенсирующих элементов следующим образом: ; . Причем будем считать помеховую ситуацию стационарной, в силу чего сигналы помех (точнее их комплексные амплитуды) во времени не изменяются или изменяются настолько медленно, что на интересующем нас временном интервале переходного режима в ААР их изменениями можно пренебречь. Очевидно:

; .         (5.1)

Пусть оба ФНЧ, присутствующие в цепях обратной связи, имеют одинаковые параметры: коэффициент передачи Кф и постоянную времени Тф. Тогда в соответствии с уравнениями (2.2) и (2.5) сигналы на входе ФНЧ x(T) и его выходе y(T) связаны дифференциальным уравнением y(T) + Tф dy(T)/dT = Kф x(T). Применительно к рассматриваемой схеме имеем x(T) = Rn(T) и y(T) = −Wn(T), поэтому

 или . (5.2)

Поскольку в коэффициент корреляции Rn(T) сигнала Ŝ n с выходным сигналом Ŝвых входят все коэффициенты Wn(T), то два (n = 1, 2) уравнения (5.2) не независимы, а образуют систему дифференциальных уравнений, и аналитические решения типа (2.3), (2.4) не применимы, надо использовать специфические приемы решения этой системы.

В противовес аналитическим способам метод конечных разностей вооружает нас эффективным и универсальным алгоритмом численного моделирования подобных систем. Идеология метода очень проста: на малом временном интервале ∆t происходит приращение ∆W = (dW/dT) ∆t, следовательно, для последовательности моментов времени Tk = kt имеем

Wn(Tk +1) = Wn(Tk) – [Kф Rn(Tk) + Wn(Tk)] ∆t/Tф.         (5.2΄)

Численное моделирование, конечно же, связано с необходимостью ввода конкретных значений. Поступим по-студенчески, зададим все, что можно, единицами, потом обсудим результаты и сообразим, на что повлияет изменение этих величин. Итак, положим Ŝ0 = 1, Kф = 1. Значение Tф тоже можно выбрать произвольным, например Tф = 1 с. Однако нетрудно сообразить, что и по смыслу, и как видно из выражения (5.2΄), в расчетах фигурирует не сама по себе постоянная времени Tф, а относительная величина временного дискрета ∆t/Tф, которая должна быть малой. Выберем ∆t/Tф = 0,1. Обозначим приращение весового коэффициента на дискрете ∆t через ∆Wn. Очевидно, что

Wn = – [Kф Rn(Tk) + Wn(Tk)] ∆t/Tф.

Запишем  начальное  состояние ААР  при k = 0 (в  момент T0 = 0):  Ŝ0 = 1; S1 = j; Ŝ2 = −1; W1 = 0; W2 = 0; Ŝвых = 1; R1 = − j;  R2 = −1. Вычислим приращения коэффициентов W1 и W2 за временной дискрет ∆t: ∆W1 = 0,1j и ∆W2 = 0,1. Таким образом, новое состояние ААР в момент T1 = 0,1 Tф определяется следующими значениями: W1 = 0,1j;  W2 = 0,1; Ŝвых = 1 + (0,1j) j + 0,1 (−1) = 0,8; R1 = − 0,8j;  R2 = −0,8. Соответственно, приращения равны ∆W1 = 0,07j и ∆W2 = 0,07. Продолжите расчеты до седьмого шага, заполняя пустые ячейки табл. 5.1. Для контроля правильности вычислений приведены значения, соответствующие столбцу Ŝвых(Tk) и последней строке.

Таблица 5.1


Поделиться:



Последнее изменение этой страницы: 2019-03-22; Просмотров: 418; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.029 с.)
Главная | Случайная страница | Обратная связь