![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Методы анализа спектров кругового дихроизма белков
Метод " эталонных спектров" [2, 3]. М етоды предсказания вторичной структуры белков по их спектрам КД основаны на предположении о том, что спектры КД различных структурных форм, составляющих белковую молекулу, дают аддитивный вклад в спектр КД белка в целом. Это можно записать в следующем виде:
где
Эталонные спектры Принимая в рассмотрение в качестве структурных классов a-спираль (H), b-структуру (b), b-изгиб (t) и “неупорядоченную” форму (R), можем написать:
Суммируя экспериментальные данные, вместо
где
где
где
Здесь Параметры
Эти параметры для глобулярных белков с достаточно большой точностью можно считать постоянными. Попытки оценить Вклад b-структуры в спектр КД белка оказывается зависящим от гораздо большего числа параметров: не только от числа аминокислотных остатков на сегмент, но и от числа нитей в данном участке структуры и их направленности, поэтому его описание простым уравнением, подобным уравнению (1.2.7), невозможно. То же самое касается b-изгиба и, особенно, “неупорядоченной” формы, под которой подразумевается все, не относящееся к другим классам. Используемые в данном методе эталонные спектры b-структуры, b-изгиба и “неупорядоченной” формы являются статистически усредненными по белкам, используемым в качестве базисных. Процедура анализа спектра КД исследуемого белка подразделяется на два этапа. Первый этап заключается в вычислении эталонных спектров структурных элементов, то есть значений Когда эталонные спектры найдены, могут быть вычислены коэффициенты
Здесь Метод " регуляризации" [4]. Подход к анализу спектра КД белка, лежащий в основе предыдущего метода, заключается в определении эталонных спектров, которые, как можно было бы предполагать, полностью характеризуют структурные элементы, образующие вторичную структуру исследуемого белка. Однако, как показывают экспериментальные данные, ни один эталонный спектр не может точно описать все разновидности таких обширных и достаточно неопределенных классов, как a-спираль, b-структура, b-изгиб и др. Конформация элементов вторичной структуры глобулярных белков значительно отличается от идеальной. Кроме этого, вклад каждого структурного класса в спектр КД белка зависит от очень многих параметров, о которых упоминалось выше. Для учета всего разнообразия типов вторичной структуры белков требуется расширить исходный набор базисных спектров. В результате возникающей при этом избыточности начальных данных обычный метод наименьших квадратов становится неустойчивым к экспериментальной ошибке и приводит к заведомо неверным результатам. Применение метода " эталонных спектров" в том виде, как он описан в предыдущем пункте, к большому базисному набору спектров оказывается, по сути, некорректным. Эту проблему частично можно разрешить, заменив метод наименьших квадратов моделью, применение которой, на первый взгляд, не вполне оправдано и адекватно, но зато приводит к устойчивому к экспериментальной ошибке результату даже в случае большого числа параметров. Применение такой стабилизирующей модели позволяет подойти к анализу спектров КД с другой стороны. А именно, появляется возможность прямого представления спктра КД исследуемого белка в виде линейной комбинации базисных спектров. Таким образом удается полностью избежать проблемы, связанной с определением эталонных спектров отдельных структурных классов и проводить более гибкий и точный анализ с использованием реальных белковых спектров. Рассмотрим данный метод более подробно. Предположим, что нам удалось представить спектр КД исследуемого белка в виде линейной комбинации спектров
где Обозначим долю аминокислот j-ого базисного белка в i-ом структурном классе через
Аналогично для спектра КД исследуемого белка:
Подставляя равенства (1.2.10) и (1.2.11) в уравнение (1.2.9), получим связь искомых коэффициентов
Проблема заключается в определении коэффициентов
с ограничениями
Здесь Согласно теореме Гаусса-Маркова, среди линейных несмещенных оценок оценка, получаемая с помощью метода наименьших квадратов, является наиболее эффективной в том смысле, что рассчитанные с его помощью коэффициенты Авторы метода [4] нашли выход в использовании вместо метода наименьших квадратов линейной смещенной оценки, определяемой следующим условием:
Эта оценка является смещенной и, следовательно, приводит к систематической ошибке. Тем не менее при больших значениях Рассмотрим критерий (1.2.15) более подробно. При a=0 мы получаем обычный метод наименьших квадратов, не пригодный в нашем случае. При a> 0 второй член в левой части (1.2.15) является регуляризатором. Он стабилизирует решение, поддерживая коэффициенты При возрастании параметра a точность аппроксимации экспериментальных данных падает за счет уменьшения эффективного числа степеней свободы, соответствующего числу свободных параметров в обычном методе наименьших квадратов. Обычно при малых a это происходит медленно, но когда этот параметр становится слишком большим, число степеней свободы становится таким малым, что коэффициенты Если при анализе спектра КД белка нам известно, что среди белков базисного набора есть белки, структурно схожие с исследуемым, то в уравнение (1.2.15) можно ввести эти данные с помощью различного взвешивания отдельных членов второй суммы этого уравнения, тем самым давая соответствующим коэффициентам Метод " ортогональных спектров" [5, 6]. О сновой данного метода является метод собственных векторов многокомпoнентного матричного анализа. Он позволяет проводить быструю обработку больших наборов данных с помощью формирования из них ортогональных компонент в виде собственных векторов с соответствующими собственными значениями. Этот метод использует в качестве базисных спектры КД 16 белков с известной вторичной структурой в диапазоне 178-260 нм с интервалом в 2 нм (всего по 42 точки в каждом из 16 спектров). Пусть С - прямоугольная матрица размером 16
(CC T) U = UE. (1.2.16)
Матрица U будет состоять из 16 собственных векторов, а диагональная матрица Е - из 16 собственных значений матрицы CC T. Рассмотрим матрицу B, определяемую выражением
B = U T C. (1.2.17)
Это прямоугольная матрица, которая, также как и матрица исходных спектров КД базисных белков, имеет размер 16 Ошибка, возникающая при аппроксимации экспериментального белкового спектра КД с помощью неполного набора наиболее “значимых" ортогональных базисных спектров, определяется следующей формулой:
Здесь s - среднее квадратичное отклонение, n - число точек в спектре, m - число базисных спектров в исходном наборе,
Из приведенной таблицы видно, что четыре ортогональных базисных спектра дают значение s, нe превышающее уровень случайной ошибки. Но эксперименты показывают, что форма реконструированного таким образом спектра плохо совпадает с реальной. Пять ортогональных базисных спектров дают значение s, в два раза меньшее уровня случайной ошибки, и при этом хорошо воспроизводят форму спектра. Шесть ортогональных базисных спектров дают лишь незначительное улучшение. Это объясняется тем, что оставшиеся базисные спектры представляют собой ни что иное, как “шум”, и их учет приводит лишь к увеличению ошибки при вычислениях. Авторы данного метода использовали для вычислений пять " наиболее значимых" ортогональных базисных спектров (m=5), полагая это количество оптимальным. Эти спектры представлены на рисунке 1.2.2. Из выражения (1.2.17) следует, что
С = UB. (1.2.19)
Восстанавливая по сокращенному набору ортогональных базисных спектров исходный набор базисных спектров КД, можем написать:
где Представим данные рентгеноструктурного анализа для 16 базисных белков в виде матрицы S размером 16 Как можно предполагать из того факта, что исходный набор базисных спектров может быть полностью восстановлен но основе лишь пяти спектров ортогонального базисного набора, спектры КД белков в диапазоне от 178 до 260 нм содержат в себе информацию лишь о пяти независимых типах вторичной структуры. С точки зрения независимости спектров КД в качестве таких типов вторичной структуры могут быть приняты комбинации обычных типов вторичной структуры (a-спирали, b-структуры и т.д.), соответствующие пяти " наиболее значимым" ортогональным базисным спектрам. Если для ортогональных базисных спектров также ввести матрицу структурных данных D (16
S = UD (1.2.21)
Как показывает эксперимент, структурная матрица S может быть полностью восстановлена на основе лишь пяти комбинаций элементов вторичной структуры матрицы D, соответствующих пяти " наиболее значимым" ортогональным базисным спектрам. Таким образом, эти комбинации обычных типов вторичной структуры являются (с точки зрения независимости спектров КД) независимыми вторичными " суперструктурами":
Следовательно, восемь рассматриваемых в данном методе стандартных структурных классов, вообще говоря, не являются строго независимыми, так как все они также могут быть описаны с помощью пяти независимых “суперструктур”, описанных выше. Для применения данного метода к анализу спектров КД произвольных белков необходимо, чтобы анализируемый спектр также быть снят в диапазоне от 178 до 260 нм. Поскольку при его аппроксимации базисными спектрами рассматривается лишь небольшой их набор, то проблемы, связанной с неустойчивостью метода наименьших квадратов, не возникает. Однако, очевидно, что приемлемые результаты возможно получить только в том случае, если структурные характеристики исследуемого белка достаточно хорошо представлены среди базисных белков. Для установления достоверности полученных результатов авторы метода рекомендуют использовать метод наименьших квадратов без ограничений на коэффициенты разложения (смотри условия (1.2.2)). При этом большие по модулю отрицательные коэффициенты Метод " выбора переменных" [7]. О бычный метод наименьших квадратов, используемый для представления произвольного спектра КД в виде линейной комбинации базисных спектров, имеет по сравнению с другими методами наибольшую гибкость. Это проявляется в том, что спектры базисных белков участвуют в разложении в различной степени в зависимости от характера конкретного спектра. Однако, эксперименты показывают, что наилучшее воспроизведение формы спектра не всегда дает лучшие результаты. Более того, метод наименьших квадратов оказывается неустойчивым к экспериментальной ошибке, если число используемых в разложении базисных спектров превышает информационное содержание анализируемого спектра (для спектров в диапазоне 178-260 нм оно приблизительно равно пяти, а в диапазоне 190-260 нм - четырем). Метод " регуляризации" [4] решает эту проблему с помощью " регуляризатора", который стабилизирует систему, оставляя ей при этом значительную гибкость. Метод " ортогональных спектров" [5, 6] достигает устойчивости метода наименьших квадратов за счет использования только пяти ортогональных базисных спектров, построенных на основе исходного набора спектров базисных белков. Однако, поскольку базисные спектры построены на основе фиксированного набора спектров базисных белков, степень участия последних при воспроизведении анализируемого спектра также оказывается в некоторой мере фиксированной, а гибкость метода - крайне низкой. Метод " выбора переменных", суть которого будет описана ниже, основан на методе " ортогональных спектров", но обладает значительной гибкостью, достигаемой за счет использования при построении ортогональных базисных спектров различных наборов базисных белков, выбираемых с помощью статистической процедуры " выбора переменных". Рассмотрим смысл этой процедуры более подробно. Предсказание вторичной структуры белка по его спектру КД должно удовлетворять двум важным условиям: 1. Величины содержания в белке рассматриваемых структурных элементов не должны быть отрицательными: 2. Суммарное содержание в белке всех рассматриваемых типов структур должно быть равно единице (100%): Второе условие является особенно важным при анализе конформационных изменений белка при денатурации или связывании каких-либо лигандов. Во всех методах, описанных выше, оба эти условия вводятся непосредственно в процедуру нахождения коэффициентов Для преодоления подобных недостатков авторы рассматриваемого метода не пользуются условиями (1) и (2) и допускают существование отрицательных коэффициентов Поскольку заранее не известно, какие из базисных белков содержат элементы, отсутствующие у исследуемого белка, и спектры которых необходимо исключить из исходного набора для улучшения результатов, рассматриваются все возможные комбинации из исходного набора 16 базисных спектров. Эта процедура выполняется в следующем порядке. Сначала из исходного набора исключаются поочередно по три базисных спектра на каждом шаге, а ортогональные базисные спектры строятся на основе оставшихся 13 исходных базисных спектров. Сравнение результатов, полученных для различных наборов из 13 базисных белков, выявляет один или два белка, которые являлись причиной отклонений коэффициентов Критериями удовлетворительного решения, соответствующего оптимальному набору базисных спектров, являются следующие условия: 1. Сумма коэффициентов 2. Значение содержания произвольной структурной формы в исследуемом белке ( 3. Воспроизведение анализируемого спектра на основе выбранного набора базисных спектров должно быть лучше, чем при использовании полного их набора. 4. Более предпочтительным является набор, содержащий большее число базисных спектров. 5. Более предпочтительными являются те белки, спектры которых ближе к анализируемому спектру. На практике в большинстве случаев удовлетворительных результатов удается достичь при исключении из исходного набора всего трех или четырех белков, причем среднеквадратичная ошибка при воспроизведении анализируемого спектра составляет меньше 0.2 единицы De. Если несколько наборов базисных белков оказываются удовлетворительными в одинаковой степени, то результаты, полученные на их основе, усредняются. В заключение можно отметить, что метод " выбора переменных" является мощным средством анализа спектров КД белков в ситуациях, когда другие распространеннные методы дают заведомо неверные результаты. Сравнение различных методов анализа спектров КД. Поскольку все методы анализа спектров КД имеют чисто эмпирический характер, каждый из них нуждается в экспериментальной проверке на белках с известными рентгеноструктурными данными. Обычно подобная проверка проводится на белках, включенных в базисный набор для данного метода. При этом белки поочередно исключаются по одному из этого набора, а их спектры анализируются на основе спектров оставшихся белков. После этого результаты, полученные для каждого типа вторичной структуры, сравниваются со значениями, полученными при рентгеноструктурном анализе, с помощью подсчета коэффициента корреляции между этими двумя наборами данных, определяемого следующим выражением:
Здесь Ниже приведены значения коэффициентов корреляции для четырех рассмотренных методов: метода " эталонных спектров" [2, 3], метода " регуляризации" [4], метода " ортогональных спектров" [5, 6] и метода " выбора переменных" [7]:
|
Последнее изменение этой страницы: 2020-02-17; Просмотров: 165; Нарушение авторского права страницы