Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Градиенты целевых функционалов
Имея в виду, что в процессе адаптации осуществляется регулирование весовых коэффициентов за счёт независимого изменения их вещественных и мнимых частей, целевые функционалы можно воспринимать, как вещественные функции 2N вещественных переменных . Соответственно под градиентом функционала Ф следует понимать 2N-мерный вектор-столбец G, составленный из соответствующих частных производных: (n = 1,..., N) (4.11) Здесь и в дальнейшем фигурные скобки означают вектор-столбец, записанный в строчку ради компактности. Вектор градиента представляет интерес в двух отношениях. Во-первых, в любой точке 2N-мерного пространства векторов управления, соответствующей текущему весовому вектору , он указывает направление максимального роста функционала Ф(W). Соответственно, антиградиент – это направление максимально крутого «спуска» (максимально быстрого уменьшения функционала Ф(W)). Поэтому, вычисляя градиент (4.11) или формируя его в результате обработки принимаемых сигналов совокупности 2N управляющих сигналов*, можно реализовать процедуру минимизации функционала Ф(W) как достаточно эффективный вычислительный алгоритм или как реальный физический процесс. Во-вторых, экстремальные точки (минимумы, максимумы, седловые точки) функции Ф(W), в том числе оптимальная точка Wopt, определяются условием G = Ø (символ Ø означает нулевой вектор). Это условие эквивалентно системе равенств: (n = 1,..., N), (4.12) аналитическое или численное решение которой позволяет найти желаемую оптимальную точку Wopt, доставляющую функционалу Ф(W) минимальное значение. В теории ААР [15, 17, 18], отходя от математических строгостей*, вводят понятие производной вещественной функции f(W) от комплексно-значных аргументов, образующих N-мерный комплексный вектор W, по ясному и целесообразному правилу: . (4.13) Это позволяет заметно упростить запись, сделать естественной и наглядной форму выражений, отражающих динамику процессов регулирования в ААР и ее оптимальное состояние. Пространство управляемых параметров предстаёт в более компактном виде как N-мерное пространство комплексных весовых коэффициентов W = . При этом надо иметь в виду, что обычные правила дифференцирования аналитических функций комплексного переменного к функционалам Ф1(W), Ф2(W) не применимы. Необходимо непосредственно использовать правило (4.13), требующее кропотливого, хотя и не сложного труда. В результате могут быть обоснованы некоторые удобные формальные приемы, позволяющие в дальнейшем без труда получать необходимые результаты. Формулы для частных производных слагаемых, фигурирующих в целевых функционалах, легко вывести, если расписать весовые коэффициенты и воспользоваться определением (4.13). Например, учитывая (3.12) для ААР Аппелбаума, запишем и будем интересоваться производной по (для аргумента производной временно введен индекс m = 1,..., N, чтобы отличать его от индексов суммирования n и k). Учитывая, что по одному разу присутствует в суммах по n и k (пробегая все значения от 1 до N, эти индексы однажды приобретают значение m), элементарно получаем: (m = 1,..., N). (4.14) Первое слагаемое последней строки соответствует значению индекса k = m, второе − значению n = m. Учитывая эрмитову сопряжённость матрицы < R >, которая состоит в комплексной сопряженности транспонированных элементов: , заменяя для удобства индекс n во втором слагаемом (4.14) на индекс k, а затем, возвращаясь к индексу n вместо m в обозначении производной, получаем: . (4.15) Проделайте аналогичные выкладки для производной и убедитесь в том, что (4.16) или (4.17) Окончательно с учётом (4.15) получаем первое слагаемое (помеховую составляющую, о чем напоминает верхний индекс «П») градиентов целевых функционалов Ф1 и Ф2 в виде: (4.18) или в матричной форме: . (4.19) Таким образом, приходим к интересному формальному правилу: производная по комплексной переменной Wn может быть получена, если, относясь к Wn и Wn * как к независимым переменным, взять производную выражения (3.13) по и умножить на два. Еще раз повторю, что это правило подтверждают только выкладки, связанные с выводом соотношений (4.15) и (4.17). И ничего более. В выражении (3.12) для мощности помех на выходе ААР с основным элементом фигурирует слагаемое , частные производные которого по Wn΄ и Wn ˝, как нетрудно видеть, равны соответственно 2 Re[R0n] и 2 Im[R0n]. Таким образом, в рассматриваемом варианте ААР с учетом (4.18) имеем: . (4.20) Окончательно выражение для помеховой составляющей градиентов в компактной векторной форме предстает в виде (4.21) где верхняя строчка, как прежде, соответствует ААР Аппелбаума, а нижняя – ААР с основным элементом. В функционале Ф1(W) фигурирует слагаемое ||W − W0||2, поэтому выясним его вклад в градиент этого функционала. Записывая очевидное и дифференцируя эту сумму по независимым аргументам и , элементарно получаем: , . Подставляя оба равенства в (4.11), находим рассматриваемое слагаемое градиента функционала: . (4.22) Наконец, слагаемое W* < Z > W в функционале Ф2(W) по структуре не отличается от первого слагаемого . Поэтому легко догадаться (или убедиться) в том, что . (4.23) При анализе установившихся состояний ААР для упрощения записей сомножитель «2» в выражениях для всех слагаемых вектора градиента можно опустить подобно тому, как мы игнорировали наличие усилителей-приемников. Тогда с учетом (4.21), (4.22) и (4.23) получаем: (4.24) (4.25) Оптимальное состояние ААР, при котором достигается минимум целевого функционала, соответствует весовому вектору Wopt, при котором равны нулю все компоненты градиентов G1 или G2, соответственно. Для ААР Аппелбаума имеем: (1,…,N), (4.26΄) (1,…,N), (4.26˝) Дужка над компонентами Wi весового вектора заменяет индекс «opt», т.е. отмечает оптимальный вектор. Аналогичные соотношения для ААР с основным элементом: (1,…, N), (4.27΄) (1,…, N). (4.27˝) Каждое из равенств (4.27΄), (4.27˝) представляет собой систему N алгебраических уравнений относительно искомых компонент оптимального вектора Wopt. В компактной матричной форме записи эти системы предстают в виде (4.28) . (4.29) Таким образом, расчёт оптимального (в текущей помеховой ситуации) весового вектора Wopt для двух целевых функционалов сводится к обращению следующих матриц: для Ф1(W) (4.30) для Ф2(W) (4.31) В выражениях (4.30) сумму рш <E> + m <E> можно было бы записать короче как (рш + m) <E>. Этого не сделано в интересах раздела 4.3. Следуя назиданию «получили – проверьте» как одному из приемов тренировки инженерного стиля мышления (глава 1), выясним, соответствуют ли решения (4.30) обсужденным свойствам функционалов при изменении масштабирующего коэффициента m. Во-первых, видно, что при m = 0 обе строчки дают нулевой вектор* Wopt = Ø, как это вытекает из смысла рассматриваемых функционалов. Во-вторых, при m = ∞ по тому же смыслу в обоих случаях должно быть Wopt = W0. И в этом легко убедиться, учитывая, что обращаемыми матрицами становятся (m <.E.>) и (m <.Z.>), и зная, а еще лучше, догадавшись, что (m <.E.>)-1 = (1/m) <.E.> и (m <.Z.>)-1 = = (1/m) <.Z.> -1. В-третьих, если нет помех, то матрица является нулевой и можно убедиться (убедитесь!), что в обоих случаях Wopt = (m/(m + pш)) W0. 4.3. Структура цепей адаптации по критерию Ф1(W) |
Последнее изменение этой страницы: 2019-03-22; Просмотров: 322; Нарушение авторского права страницы