бесплано рефераты

Разделы

рефераты   Главная
рефераты   Искусство и культура
рефераты   Кибернетика
рефераты   Метрология
рефераты   Микроэкономика
рефераты   Мировая экономика МЭО
рефераты   РЦБ ценные бумаги
рефераты   САПР
рефераты   ТГП
рефераты   Теория вероятностей
рефераты   ТММ
рефераты   Автомобиль и дорога
рефераты   Компьютерные сети
рефераты   Конституционное право
      зарубежныйх стран
рефераты   Конституционное право
      России
рефераты   Краткое содержание
      произведений
рефераты   Криминалистика и
      криминология
рефераты   Военное дело и
      гражданская оборона
рефераты   География и экономическая
      география
рефераты   Геология гидрология и
      геодезия
рефераты   Спорт и туризм
рефераты   Рефераты Физика
рефераты   Физкультура и спорт
рефераты   Философия
рефераты   Финансы
рефераты   Фотография
рефераты   Музыка
рефераты   Авиация и космонавтика
рефераты   Наука и техника
рефераты   Кулинария
рефераты   Культурология
рефераты   Краеведение и этнография
рефераты   Религия и мифология
рефераты   Медицина
рефераты   Сексология
рефераты   Информатика
      программирование
 
 
 

Учебное пособие: Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белков

Для применения данного метода к анализу спектров КД произвольных белков необходимо, чтобы анализируемый спектр также быть снят в диапазоне от 178 до 260 нм. Поскольку при его аппроксимации базисными спектрами рассматривается лишь небольшой их набор, то проблемы, связанной с неустойчивостью метода наименьших квадратов, не возникает. Однако, очевидно, что приемлемые результаты возможно получить только в том случае, если структурные характеристики исследуемого белка достаточно хорошо представлены среди базисных белков. Для установления достоверности полученных результатов авторы метода рекомендуют использовать метод наименьших квадратов без ограничений на коэффициенты разложения (смотри условия (1.2.2)). При этом большие по модулю отрицательные коэффициенты  или большое отклонение их суммы от единицы свидетельствуют о том, что метод в данном случае неприменим. Подробнее об этом критерии будет говориться в следующем разделе.

Метод "выбора переменных" [7]. Обычный метод наименьших квадратов, используемый для представления произвольного спектра КД в виде линейной комбинации базисных спектров, имеет по сравнению с другими методами наибольшую гибкость. Это проявляется в том, что спектры базисных белков участвуют в разложении в различной степени в зависимости от характера конкретного спектра. Однако, эксперименты показывают, что наилучшее воспроизведение формы спектра не всегда дает лучшие результаты. Более того, метод наименьших квадратов оказывается неустойчивым к экспериментальной ошибке, если число используемых в разложении базисных спектров превышает информационное содержание анализируемого спектра (для спектров в диапазоне 178-260 нм оно приблизительно равно пяти, а в диапазоне 190-260 нм - четырем).

Метод "регуляризации" [4] решает эту проблему с помощью "регуляризатора", который стабилизирует систему, оставляя ей при этом значительную гибкость. Метод "ортогональных спектров" [5,6] достигает устойчивости метода наименьших квадратов за счет использования только пяти ортогональных базисных спектров, построенных на основе исходного набора спектров базисных белков. Однако, поскольку базисные спектры построены на основе фиксированного набора спектров базисных белков, степень участия последних при воспроизведении анализируемого спектра также оказывается в некоторой мере фиксированной, а гибкость метода - крайне низкой.

Метод "выбора переменных", суть которого будет описана ниже, основан на методе "ортогональных спектров", но обладает значительной гибкостью, достигаемой за счет использования при построении ортогональных базисных спектров различных наборов базисных белков, выбираемых с помощью статистической процедуры "выбора переменных". Рассмотрим смысл этой процедуры более подробно.

Предсказание вторичной структуры белка по его спектру КД должно удовлетворять двум важным условиям:

1.  Величины содержания в белке рассматриваемых структурных элементов не должны быть отрицательными: .

2.  Суммарное содержание в белке всех рассматриваемых типов структур должно быть равно единице (100%): .

Второе условие является особенно важным при анализе конформационных изменений белка при денатурации или связывании каких-либо лигандов. Во всех методах, описанных выше, оба эти условия вводятся непосредственно в процедуру нахождения коэффициентов  с помощью метода наименьших квадратов. Однако такое ограничение на коэффициенты может весьма заметным образом исказить результаты этой процедуры.

Для преодоления подобных недостатков авторы рассматриваемого метода не пользуются условиями (1) и (2) и допускают существование отрицательных коэффициентов  и отклонение их суммы от единицы. Появление подобных несоответствий свидетельствует о неуспехе метода и может быть объяснено наличием у некоторых базисных белков таких структурных форм, вкладов которых в спектр исследуемого белка не было обнаружено. Для избежания подобных ситуаций вводится процедура "выбора переменных", которая поочередно исключает белки из исходного базисного набора, а затем проводит вычисления с каждой из полученных комбинаций базисных белков, используя метод "ортогональных спектров". Эксперименты показали, что достоверность результатов значительно повышается по мере того, как сумма коэффициентов  приближается к единице. Повышение точности анализа было достигнуто даже при анализе спектров в укороченном диапазоне (190-260 нм).

Поскольку заранее не известно, какие из базисных белков содержат элементы, отсутствующие у исследуемого белка, и спектры которых необходимо исключить из исходного набора для улучшения результатов, рассматриваются все возможные комбинации из исходного набора 16 базисных спектров. Эта процедура выполняется в следующем порядке. Сначала из исходного набора исключаются поочередно по три базисных спектра на каждом шаге, а ортогональные базисные спектры строятся на основе оставшихся 13 исходных базисных спектров. Сравнение результатов, полученных для различных наборов из 13 базисных белков, выявляет один или два белка, которые являлись причиной отклонений коэффициентов  и их суммы от условий (1) и (2). Эти белки исключаются из исходного набора, и процедура повторяется до тех пор, пока не будут получены удовлетворительные результаты.

Критериями удовлетворительного решения, соответствующего оптимальному набору базисных спектров, являются следующие условия:

1.  Сумма коэффициентов  должна находиться в диапазоне от 0.96 до 1.05 (или, по крайней мере, от 0.90 до 1.10).

2.  Значение содержания произвольной структурной формы в исследуемом белке () должно быть выше - 0,05.

3.  Воспроизведение анализируемого спектра на основе выбранного набора базисных спектров должно быть лучше, чем при использовании полного их набора.

4.  Более предпочтительным является набор, содержащий большее число базисных спектров.

5.  Более предпочтительными являются те белки, спектры которых ближе к анализируемому спектру.

На практике в большинстве случаев удовлетворительных результатов удается достичь при исключении из исходного набора всего трех или четырех белков, причем среднеквадратичная ошибка при воспроизведении анализируемого спектра составляет меньше 0.2 единицы De. Если несколько наборов базисных белков оказываются удовлетворительными в одинаковой степени, то результаты, полученные на их основе, усредняются.

В заключение можно отметить, что метод "выбора переменных" является мощным средством анализа спектров КД белков в ситуациях, когда другие распространеннные методы дают заведомо неверные результаты.

Сравнение различных методов анализа спектров КД.Поскольку все методы анализа спектров КД имеют чисто эмпирический характер, каждый из них нуждается в экспериментальной проверке на белках с известными рентгеноструктурными данными. Обычно подобная проверка проводится на белках, включенных в базисный набор для данного метода. При этом белки поочередно исключаются по одному из этого набора, а их спектры анализируются на основе спектров оставшихся белков. После этого результаты, полученные для каждого типа вторичной структуры, сравниваются со значениями, полученными при рентгеноструктурном анализе, с помощью подсчета коэффициента корреляции между этими двумя наборами данных, определяемого следующим выражением:

.(1.2.22)

Здесь  и  - экспериментальный и рассчитанный наборы данных, n - число белков в базисном наборе. Значения коэффициента корреляции r лежат в диапазоне от - 1 до 1, причем значеия r, близкие к 1, свидетельствуют об успешном предсказании, характеризующимся достаточно высокой точностью. Значения r, близкие к 0 или - 1, говорят о случайном совпадении или полном несоответствии рассчитанных и экспериментальных данных.

Ниже приведены значения коэффициентов корреляции для четырех рассмотренных методов: метода "эталонных спектров" [2,3], метода "регуляризации" [4], метода "ортогональных спектров" [5,6] и метода "выбора переменных" [7]:

метод диапазон, коэффициент корреляции r
нм a b ­¯ b ­­ b ­¯+­­ b-изг. Ост.
 [2,3] 190-240 0.85 - - 0.25 -0.31 0.46
 [4] 190-240 0.96 - - 0.94 0.31 0.49
 [5,6] 190-260 0.98 0.40 0.00 -0.27 0.18 0.24
 [7] 190-260 0.95 0.57 0.47 0.45 0.54 0.69
 [4] 178-260 0.96 0.23 0.39 0.12 0.51 0.64
 [5,6] 178-260 0.98 0.55 0.63 0.54 0.30 0.61
 [7] 178-260 0.97 0.78 0.67 0.76 0.49 0.86
1.3 Работа с пакетом программ STRUCTURE по анализу спектров КД белков

Пакет программ STRUCTURE разработан в институте белка РАН (1991-1992 К.С. Василенко). Он предназначен для анализа спектров кругового дихроизма белков и определения их вторичной структуры. Алгоритм анализа спектров основан на методах, описанных выше. Пакет STRUCTURE состоит из следующих программ и вспомогательных файлов:

-  STRUCTURE (файл structur.exe) - программа, обеспечивающая интерфейс для всех программ пакета, позволяющая также создавать и редактировать файлы данных в универсальном для всех программ формате.

-  CONTIN (файл contin.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].

-  PROVCD (файл provcd.exe) - программа, осуществляющая проведение статистического теста для программы CONTIN.

-  DEF_CLASS (файл def_clas.exe) - программа, определяющая тип третичной структуры белка.

-  CDESTIMATE (файл cdestima.exe) - программа, определяющая вторичную структуру белка методом "эталонных спектров" [3].

-  VARSELEC (файл varselec.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" с процедурой "выбора переменных" [7].

-  RUN.BAT - командный файл, используемый для запуска программ пакета в условиях недостаточного объема оперативной памяти.

-  *.DAT - файл, содержащий спектр КД белка, а также данные о его вторичной структуре (если они известны).

-  *.GRP - файл, содержащий список базисных спектров КД (принадлежащих одной из базисных групп).

-  *.STR - файл, содержащий набор структурных типов (элементов вторичной структуры белка).

После запуска файла structur.exe на экране появляется главное меню программы, состоящее из следующих пунктов:

1.  File - создание и редактирование файлов данных;

2.  Group - создание и редактирование групп базисных спектров КД белков;

3.  Calculate - выбор метода анализа, анализируемого спектра, группы базисных спектров, запуск вычислений и просмотр результатов;

4.  Options - выбор набора структурных типов;

5.  Setup - изменение цветового оформления окон программы;

6.  Quit - выход из программы.

В нижней части экрана располагаются три окна, содержащие информацию об анализируемом спектре КД (Protein), а также о выбранных для анализа группе базисных спектров (Group) и наборе типов вторичной структуры белка (Structures).

Создание и редактирование файлов данных. Создание и редактирование файлов данных осуществляется с помощью команд меню File/Create и File/Edit соответственно. В файл необходимо внести следующую информацию:

-  Комментарий длиной не более 45 символов (пункт меню Comment).

-  Идентификатор длиной не более 7 символов, который становится именем файла и автоматически приобретает расширение.dat (пункт меню Identificator).

-  Содержание в белке (относительные доли) различных типов вторичной структуры по данным рентгеноструктурного анализа (пункт меню Structure data). Эти данные необходимы только в случае использования вводимого спектра в дальнейшем в качестве базисного.

-  Диапазон и шаг по длинам волн, а также сам спектр КД (пункт меню Spectrum). Для программы CDESTIMATE диапазон анализируемого спектра не должен быть шире, чем 240 - 190 нм, а шаг должен быть равен 1 нм или больше. Для программы CONTIN число точек в анализируемом спектре не должно превышать 51. Для программ CONTIN, VARSELEC и PROVCD диапазон анализируемого спектра не должен быть шире диапазона базисных спектров, а шаг должен совпадать с шагом базисных спектров.

После ввода всей перечисленной выше информации необходимо сохранить ее с помощью пункта меню Save. При необходимости можно построить введенный спектр КД на экране в графическом виде с помощью пункта меню View.

Команды меню File/Load и File/Delete используются соответственно для добавления новых спектров в список рабочих спектров, запоминаемых программой, и для удаления из него ненужных спектров. Для добавления нового спектра с помощью команды Load необходимо указать имя файла, в котором он хранится (предварительно его надо записать в текущий каталог). При удалении какого-либо спектра из списка с помощью команды Delete соответствующий ему файл не удаляется, поэтому его всегда можно будет включить обратно в список с помощью команды Load.

Создание и редактирование групп базисных спектров. В программе STRUCTURE уже существует 6 предопределенных групп базисных спектров, соответствующих различным методам анализа спектров КД. Эти группы имеют следующие имена:

-  PG_3_16.GRP и PG_4_16.GRP - базисные наборы, состоящие из 16 спектров, использованные для анализа авторами метода "регуляризации" [4] (Provencher & Glockner), предназначенные для определения вторичной структуры по 3 и 4 структурным классам соответственно (смотри ниже);

-  PG_3_20.GRP и PG_4_20.GRP - базисные наборы, содержащие те же самые 16 спектров, что и в двух предыдущих наборах, плюс 4 спектра денатурированных белков;

-  HJ_16.GRP и HJ_22.GRP - базисные наборы, состоящие из 16 и 22 спектров соответственно, использованные для анализа авторами метода "ортогональных спектров" [7] (Henessey & Johnson), предназначенные для определения вторичной структуры по 5 структурным классам (смотри ниже).

В программе предусмотрена возможность создания собственных групп базисных спектров. Для этого необходимо воспользоваться командой главного меню Group/Create, позволяющей выбрать из списка существующих спектров те, которые вы хотите включить в свой базисный набор. Аналогичным образом осуществляется редактирование групп базисных спектров (команда главного меню Group/Edit). Удаление группы базисных спектров осуществляется с помощью команды главного меню Group/Delete.

Выбор набора структурных типов. В программе STRUCTURE предопределены следующие 3 набора типов вторичной структуры белка:

Provencher 3 (PG3.STR)

ALFA_hl (a-спираль)

BETA_sh (b-структура)

Remain (остальные типы)

Provencher 4 (PG4.STR)

ALFA_hl (a-спираль)

BETA_sh (b-структура)

BETA_tn (b-поворот)

Remain (остальные типы)

Johnson 5 (HJ.STR)

ALFA_hl (a-спираль)

BETA_Ash (антипараллельная b-структура)

BETA_Psh (параллельная b-структура)

BETA_tn (b-поворот)

Other (остальные типы)

Набор All structures (FULL.STR) содержит дополнительные типы вторичной структуры белка, однако он ни с одной из предопределенных групп базисных спектров не используется.

Каждая группа базисных спектров соответствует одному из выше перечисленных наборов структурных типов. Это соответствие выглядит следующим образом:

PG_3_16.GRP и PG_3_20.GRP - Provencher 3;

PG_4_16.GRP и PG_4_20.GRP - Provencher 4;

HJ_16.GRP и HJ_22.GRP - Johnson 5.

При выборе одной из групп базисных спектров необходимо выбрать соответствующий набор типов вторичной структуры белка. Выбор нужного набора структурных типов осуществляется с помощью команды главного меню Options/Structure types.

Запуск вычислений. Для начала вычислений необходимо воспользоваться командой главного меню Calculate. В появляющемся меню нужно выбрать один из предлагаемых методов вычислений. В появляющемся после этого списке имеющихся белковых спектров необходимо выбрать анализируемый спектр. Если для расчетов были выбраны программы CONTIN, VARSELEC, PROVCD или DEF_CLASS, то необходимо также выбрать группу базисных спектров, на которой будут основаны вычисления. После этого производится запуск вычислений.

Если для расчетов была выбрана программа VARSELEC, то необходимо также установить порядок исключения спектров из исходного базисного набора для процедуры "выбора переменных" с помощью команды главного меню Options/Var.select. Для этого необходимо указать число спектров, исключаемых на каждом шаге вычислений. После его задания автоматически вычисляется общее количество шагов, требуемых для перебора всех возможных комбинаций. Если перебор всех возможных комбинаций не требуется, необходимо указать номер начальной и конечной комбинации.

Время вычислений равняется в среднем 1-3 минутам, однако может составлять значительно больший интервал для программы VARSELEC при задании очень большого количества комбинаций базисных спектров.

Результаты вычислений можно просмотреть с помощью команды Calculate/Result.


2. Инфракрасные спектры поглощения белков 2.1 Поглощение белков в ИК-области

Поглощение света в видимом и ультрафиолетовом диапазонах обусловлено электронными переходами в молекулах поглощающего вещества. Поглощение света в инфракрасном диапазоне имеет иную природу. Оно связано с переходами между колебательными уровнями основного состояния молекулы. Полосы поглощения, отвечающие колебательным переходам, обычно лежат в диапазоне длин волн от 2000 до 50000 нм или, как принято записывать для ИК-спектров, в диапазоне волновых чисел от 5000 до 200 см-1.

Колебательные спектры подчиняются в сущности тем же закономерностям, что и электронные. Однако для колебательных переходов характерна значительно меньшая интенсивность, чем для электронных. Следовательно, при регистрации ИК-спектра образец должен быть гораздо более концентрированным. Кроме этого, многие полосы ИК-спектров белков, в том числе соответствующие пептидным хромафорам, расположены в той спектральной области, где наблюдается сильное поглощение воды. Использование D2О вместо Н2О иногда помогает обойти эту трудность, но не решает проблему полностью, поскольку полная замена лабильных протонов белка на дейтерий часто связана с потерей его нативной конформации.

Описываемый ниже метод определения вторичной структуры белка основан на использовании ИК-спектров поглощения белков в Н2О [8-10]. Проблема, связанная с их измерением, была решена авторами метода с помощью довольно сложной процедуры компенсации поглощения воды и использования очень узких ячеек (с длиной оптического пути около 6-12 мкм). Поскольку все измерения проводились в Н2О трудностей с поддержанием нативной конформации белков не возникало.

Колебательные полосы поглощения обычно порождаются переходами, которые можно довольно точно отнести к определенным химическим связям. В случае белков наиболее интересными являются три инфракрасные полосы, соответствующие колебательным переходам в пептидном остове. Это полосы, связанные с растяжением связи N-H (около 3300 см-1), растяжением связи C=O (1640-1660 см-1, полоса амид I) и деформацией связи N-H (1520-1550 см-1, полоса амид II). Эти полосы довольно легко зарегистрировать, поскольку каждое пептидное звено дает вклад в их интенсивность.

Образование водородных связей при формировании вторичной структуры белка приводит к сдвигу энергии этих трех пептидных колебаний. Первые две полосы, отвечающие валентным колебаниям, смещаются в область более низких энергий, поскольку наличие водородной связи облегчает смещение атома азота амидной группы и атома кислорода карбонильной группы в направлении акцептора или донора протона соответственно. Полоса амид II смещается в сторону более высоких энергий, так как водородная связь препятствует изгибанию связи N-H.

Влияние водородных связей на полосы амид I и амид II в случае a-спирали и b-структуры оказывается различным, что дает возможность использовать ИК-спектры для определения вторичной структуры белков. Ниже представлена таблица, суммирующая данные о влиянии вторичной структуры на положение полос амид I и амид II. В ней приведены положения максимумов (n0) и значения интенсивности в максимумах (Е0) для полос амид I и амид II, усредненные по нескольким модельным полипептидам и фибриллярным белкам в Н2О [9]:

Тип вторичной Амид I Амид II
структуры

n0, см-1

Е0, л·моль-1·см-1

n0, см-1

Е0, л·моль-1·см-1

a-спираль 1647 700

1551

1520

310

80

b-структура

1695

1619

180

980

1533

1563

340

100

неупорядочен-

ная форма

1651 320 1550 210

Следует отметить, что расщепление полос амид I и амид II происходит за счет взаимосвязанности колебаний в отдельных пептидных группах.

На рисунке 2.1.1 представлены ИК-спектры трех модельных полипептидов, находящихся в конформациях a-спирали, b-структуры и неупорядоченной формы.

2.2 Методы анализа ИК-спектров белков

В целом, проблемы, решаемые при анализе ИК-спектров белков с целью определения их вторичной структуры, очень схожы с проблемами, возникающими при анализе спектров кругового дихроизма белков. При этом также используется набор ИК-спектров белков с известной вторичной структурой, используемых в качестве базисных. Так, например, в методе, описанном в работах [8-10], анализ базисного набора, состоящего из 13 спектров глобулярных белков и 6 спектров фибриллярных белков и полипептидов в Н2О в диапазоне 1800-1480 см-1, осуществляется с помощью методов "регуляризации" [4] и "ортогональных спектров" [6], рассмотренных выше.

Авторы этого метода вводят дополнительную процедуру, позволяющую исключить вклад в ИК-спектр белка поглощения боковых групп аминокислотных остатков. Ими было показано, что этот вклад составляет около 20% от суммарной интенсивности полос амид I и амид II. Возможность проведения такой процедуры определяется тем, что вклады в ИК-спектр поглощения белка от боковых групп аминокислотных остатков и полипептидного остова являются аддитивными. Для оценки поглощения боковых групп было проведено измерение ИК-спектров водных (Н2О) растворов аминокислот. Оказалось, что наиболее сильно поглощают в исследуемой части ИК-диапазона боковые группы аминокислот аспарагина, глутамина, аспарагиновой кислоты, глутаминовой кислоты, аргинина, лизина, тирозина, фенилаланина и гистидина. Было обнаружено также сильное поглощение заряженных a-амино - и a-карбоксильной групп аминокислот. Поэтому их поглощение также необходимо учитывать при анализе белкового спектра. Суммарно, ИК-спектр белка может быть представлен в следующем виде:

. (2.2.1)

 - спектр поглощения полипептидного остова белка, а  - спектр поглощения боковых групп аминокислотных остатков белка, вычисляемый по формуле

, (2.2.2)

где  - спектр поглощения k-ой аминокислоты,  - число k-ых аминокислот в белке, а  - общее число аминокислот в белке. N - и С-концевые - NH2 и - COOH группы белка также должны быть включены в эту формулу наравне с аминокислотами. Пример исключения из ИК-спектра рибонуклеазы А вклада от поглощения боковых групп аминокислотных остатков приведен на рисунке 2.2.1 Таким образом, данный метод анализа ИК-спектров полностью аналогичен методам анализа спектров КД белков, за исключением того, что в нем используются не реальные белковые спектры, а вычисленные с помощью формул (2.2.1) и (2.2.2) спектры поглощения пептидного остова белков.

Авторы метода использовали для анализа шесть типов вторичной структуры белка: упорядоченная (Ho) и неупорядоченная (Hd) формы a-спирали, упорядоченная (Вo) и неупорядоченная (Вd) формы b-структуры, b-изгиб (Т) и остальные формы (R). К неупорядоченной форме a-спирали были отнесены по два аминокислотных остатка с каждой стороны спирального сегмента, а к неупорядоченной форме b-структуры - аминокислотные остатки b-нитей, образующие "неклассические" водородные связи.

Применение к выбранному базисному набору метода "ортогональных спектров" [6] привело к получению 11 ортогональных спектров, амплитуда которых превышает экспериментальную ошибку, возникающую при регистрации ИК-спектров. Пять "наиболее значимых" ортогональных спектров показано на рисунке 2.2.2.

Экспериментальная проверка точности анализа ИК-спектров белков на белках из базисного набора дала следующие коэффициенты корреляции (смотри раздел 1.2):

Метод

Ho

Hd

Bo

Bd

T R
"регуляризации" 0.97 0.77 0.94 0.91 0.80 0.48
"ортогональных спектров" 0.98 0.80 0.93 0.90 0.75 0.48
"регуляризации" (без исключения поглощения боковых групп аминокислот) 0.92 0.68 0.85 0.90 0.53 0.32
2.3 Работа с пакетом программ STRUC по анализу ИК-спектров белков

Пакет программ STRUC разработан в институте белка РАН [10]. Он предназначен для анализа инфракрасных спектров поглощения белков и определения их вторичной структуры. Алгоритм анализа спектров основан на оригинальном методе авторов программы [8-10] (смотри выше). Пакет STRUC состоит из следующих программ и вспомогательных файлов:

-  STRUC.BAT - командный файл, используемый для определения вторичной структуры белка. Он организует работу следующих трех программ:

-  AMACIR (файл amacir.exe) - программа, исключающая из ИК-спектра поглощения белка вклад от поглощения боковых групп аминокислотных остатков по методу [8];

-  SVDIR (файл svdir.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" [6];

-  CONTIR (файл contir.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].

-  VISUAL.BAT - командный файл, предназначенный для графического воспроизведения ИК-спектра поглощения белка. Он организует работу следующих двух программ:

-  PLOTFL (файл plotfl.exe) - программа, осуществляющая преобразование спектров поглощения к формату, используемому программой PLOTNIK;

-  PLOTNIK (файл plotnik.exe) - программа, осуществляющая графическое построение ИК-спектра поглощения белка.

-  SOURCE - файл, содержащий входные данные для программы AMACIR (в том числе сам ИК-спектр поглощения белка).

-  OUT.SVD и OUT.CON - файлы, являющиеся результатом работы программ SVDIR и CONTIR, содержащие данные по оценке вторичной структуры белка соответствующими методами.

Программы, входящие в пакет STRUC, не имеют системы экранного интерфейса, и работа с ними осуществляется из командной строки. Перед началом работы с пакетом необходимо создать текстовый файл SOURCE (рекомендуется скопировать уже имеющийся) и записать в него исходные данные по исследуемому белку и его ИК-спектру поглощения, необходимые для работы программ. Формат этого файла следующий:

Номер строки Содержание
1 Идентификатор файла (длиной не более 70 символов)
2, 3 Формат записи числовых значений спектра в строках 6 - 14. По умолчанию устанавливается формат (10F6.0) - по 10 значений в каждой строке в форме действительного числа с фиксированной десятичной точкой, причем на запись всего числа отводится 6 позиций, из которых 0 позиций - на десятичную часть. (Для действительных чисел с плавающей десятичной точкой вместо символа 'F' следует записать символ 'E'.)
5

Спектральный диапазон (по волновым числам), используемый для вычислений, и число точек в спектре. Максимально допустимый спектральный диапазон составляет 1800 - 1480 см-1 при числе точек в спектре, равном 81. При задании диапазона и числа точек необходимо сохранять интервал между точками равным 4 см-1.

6 - 14

ИК-спектр поглощения белка, выраженный в единицах л моль-1·см-1.

17 Содержит единственный символ '*', положение которого определяет тип записи данных по аминокислотному составу белка: (а) NAmAc - указывается абсолютное количество остатков каждой аминокислоты в белке; (б) NAmAc/N - указывается абсолютное количество остатков каждой аминокислоты в белке, деленное на общее количество аминокислотных остатков.
19 - 40 Аминокислотный состав белка. Здесь же отдельно указываются N - и C-концевые группы белка.
42 Общее количество аминокислотных остатков в белке и значение pH, при котором снимался спектр. Указывать значение pH нужно обязательно, а общее количество аминокислотных остатков - только в том случае, если при записи аминокислотного состава белка записывались относительные доли аминокислотных остатков (вариант (б)).
43 Комментарий к файлу

Пример заполнения файла можно посмотреть в уже имеющемся файле SOURCE.

После подготовки файла SOURCE необходимо запустить вычисления. Для этого в командной строке следует ввести

STRUC SOURCE OUT.SVD OUT.CON и нажать кнопку [Enter]. (Названия файлов SOURCE, OUT.SVD и OUT.CON могут быть любыми, следует лишь соблюдать указанный порядок пр их записи.)

После окончания работы программ результаты вычислений моут быть просмотрены в файлах OUT.SVD и OUT.CON с помощью любого текстового редактора. Первая часть этих файлов содержит информацию о входных данных (взятую из файла SOURCE). Далее следует набор решений, соответствующий различным комбинациям ортогональных спектров (в файле OUT.SVD) или различным значениям параметра регуляризации (в файле OUT.CON). В конце файлов приводится аппроксимированный спектр и окончательно выбранное решение.

Можно просмотреть также промежуточные результаты вычислений программ. Файл PEPT, создаваемый программой AMACIR, содержит ИК-спектр поглощения пептидной цепи. Этот файл является входным для программ SVDIR и CONTIR. Файл AMACIR.RES, также создаваемый программой AMACIR, содержит данные об ионизации отдельных аминокислотных остатков при заданном значении pH, среднем значении массы одного аминокислотного звена данного белка, содержании в белке азота, а также три ИК-спектра поглощения: спектр белка (определенный экспериментально) и спектры боковых групп аминокислотных остатков и пептидной цепи (вычисленные программой AMACIR).

Для того, чтобы построить все три спектра на экране, необходимо запустить файл VISUAL.BAT.

В появляющемся после этого на экране главном меню программы PLOTNIK следует выбрать пункт Suit, позволяющий перейти в раздел задания параметров, необходимых для построения графиков. Ниже перечислены основные из них:

Titles/X

Titles/Y

Scale/X/Upper

Scale/X/Lower

Scale/Y/Upper

Scale/Y/Lower

Misc/Npts

Misc/Data

Волновое число, 1/см

Коэффициент молярной экстинции, 1/ (моль см)

1480

1800

Auto

Auto

Auto

Formatted

Для одновременного построения трех графиков необходимо задать три набора данных (A, B и C) и указать имена файлов, содержащих эти данные:

Set Legend Filename

A

B

C

экспериментальный спектр

спектр поглощения пептидной цепи

спектр поглощения а/к остатков

buf1.dat

buf2.dat

buf3.dat

Файлы buf1.dat, buf2.dat и buf3.dat создаются программой PLOTFL на основе данных файла AMACIR.RES (эти файлы уничтожаются после завершения работы программы PLOTNIK). После задания параметров следует вернуться в главное меню программы PLOTNIK и выбрать в нем пункт View. При этом на экране будут построены требуемые графики.


Список литературы

1.  Кантор Ч., Шиммел П. Биофизическая химия. Том 2: Методы исследования структуры и функции биополимеров. М: Мир, 1984

2.  Saxena V.P., Wetlaufer D.B. (1971) A new basis for interpreting the circular dichroic spectra of proteins. Proc. Natl. Acad. Sci. U.S.A.68, 969-972

3.  Сhang C.T., Wu C. -S.C., Yang J.T. (1978) Circular dichroic analysis of protein conformation: inclusion of the b-turns. Anal. Biochem.91, 13-31

4.  Provencher S.W., Glockner J. Estimation of globular protein secondary structure from circular dichroism. (1981) Biochemistry 20, 33-37

5.  Hennessey J.P., Jr., Johnson W.C., Jr. (1981) Information content in the circular dichroism of proteins. Biochemistry 20, 1085-1094

6.  Compton L.A., Johnson W.C., Jr. (1986) Analysis of protein circular dichroism spectra for secondary structure using a simple matrix multiplication. Anal. Biochem.155, 155-167

7.  Manavalan P., Johnson W.C., Jr. (1987) Variable selection method improves the prediction of protein secondary structure from circular dichroism spectra. Anal. Biochem.167, 76-85

8.  Venyaminov S.Yu., Kalnin N.N. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions.I. Spectral parameters of amino acid residue absorption bands. Biopolymers 30, 1243-1257

9.  Venyaminov S.Yu., Kalnin N.N. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions. II. Amide absorption bands of polypeptides and fibrous proteins in a-, b-, and random coil conformations. Biopolymers 30, 1259-1271

10.  Kalnin N.N., Baikalov I.A., Venyaminov S.Yu. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions. III. Estimation of the protein secondary structure. Biopolymers 30, 1273-1280


Страницы: 1, 2


© 2010 САЙТ РЕФЕРАТОВ