Проект електронної бази даних «Каталог метаболічних шляхів»

Одним із програмних засобів, на які б спиралася коміркова модель екосистеми, може стати електронна база даних (ЕБД) «Каталог метаболічних шляхів», проект якої представлено нижче.

1. Визначення і структура ЕБД

Метаболізм має характерну рису, яка відрізняє його від обміну речовин у неживих системах – більшість хімічних реакцій у біосистемах перебувають під керуванням генів, тобто речовинних носіїв інформації – полімерів нуклеїнових кислотах. Між генетичним кодом і самою реакцією існує значна кількість проміжних ланок: по-перше, це продукти експресії генів: (мРНК → поліпептиди → білкові субодиниці), по-друге, ферменти; по-третє, численні міжмолекулярні взаємодії.

На наш погляд, область знань, що займається вивченням обміну речовин у біосистемах, вирізняється категоріями сутностей і сутностями, які перелічені в таблиці 1.

Таблиця 1. – Категорії сутностей і сутності обміну речовин у біосистемах

Категорії сутностей

Сутності та їхнє описання

1. Матеріали (речовини):

а) неспецифічні речовини;
б) генетично кодовані – специфічні речовини:
перший ієрархічний рівень – безпосередні продукти експресії генів: 1) РНК-транскрипти; 2) поліпептиди, які формують білкові субодиниці;
другий ієрархічний рівень – речовини, що складаються з продуктів генної експресії (і неспецифічних речовин): 3) ферменти;        4) сигнальні молекули (сюди ми відносимо зокрема т-РНК, медіатори клітинної сигналізації) 5) решта функціональних білків.

2. Речовинні носії інформації:

1) структурні гени; 2) регуляторні ділянки геному.

3. Взаємодії:

а) якими супроводжуються хімічні перетворення;
б) якими супроводжується сигналізація;
в) якими супроводжується низка інших процесів, причетних до метаболізму, зокрема активний транспорт, зміни конформації біомолекул.
Взаємодії можуть відбуватися за принципами: 1) дії ефекторів; окремими випадками дії ефекторів є 2) кофакторна дія та 3) дії простетичних груп в активних центрах біокаталізаторів; 4) дії інгібіторів та супресорів; 5) дії сигнальних молекул; останній принцип взаємодії може бути також стимулюючим або пригнічувальним, але на відміну від простої дії каталізаторів (ефекторів) та інгібіторів із супресорами вони регулюють не одиничний процес (наприклад, реакцію), а низку пов’язаних між собою одиничних процесів (наприклад, експресію гена або сприйняття зміни стану середовища).

4. Процеси:

 

Залежності між зазначеними в табл. сутностями клітинного метаболізму ми представили у вигляді схеми, що складається з чотирьох підплощин (рис.1).

Зображені на рис. прямокутники відповідають окремим категоріям сутностей ЕБД, а цифри в надписах – номерам таблиць, у яких описуються ці категорії. Штрихові лінії розбивають схему на чотири підплощини для таких класів категорій: речовинні носії інформації; неспецифічні речовини; специфічні речовини; процеси. Категорії п’ятого класу – взаємодії. Вони реалізуються завдяки речовинам-регуляторам: як неспецифічним, так і специфічним; тому прямокутники взаємодій розташовано відразу в двох підплощинах; зважаючи на те, що об’єкти останнього класу ідентифікуються не видом речовин, а самою взаємодією, відповідні їм написи у прямокутниках подано не горизонтально, як для інших функціональних класів речовин, а вертикально. Лінії, якими з’єднуються прямокутники, відображають зв’язки між сутностями БД. Подвійна лінія означає, що окрема сутність з однієї таблиці відповідає такій же сутності в іншій – це звязок-відповідність. Стрілка використовується для позначення зв’язку-залежності: категорія, з прямокутника якої виходить стрілка, може бути: 1) структурним компонентом, 2) контролювати (шляхом впливу або керування) категорією, до прямокутника якої стрілка входить.


Рис. 1. Схема залежностей між об’єктами клітинного метаболізму, якою керувалися в ході розробки бази даних.

З метою уникнення плутанини при створенні розроблюваної ЕБД і користуванні нею ми вважали за необхідне дати чіткі визначення категоріям сутностей, якими вона оперує:

1. Вид речовини визначається унікальністю атомарного складу, хімічною будовою, заряду та енергетичного стану її атомів, а також агрегатним станом. Два види речовин можуть відрізнятися один від одного 1) за кількістю атомів кожного з елементів, 2) мережею зв’язків між цими атомами (йдеться про ізомерію) 3) зарядом, 4) конфігурацією електронних оболонок складових атомів, 5) агрегатним станом. Але, наприклад,  H2O, D2O, T2O у базі даних мають розглядатися як єдина речовина – зміна будови атомних ядер речовини не впливає істотно на реакційні властивості

2. Фермент – це речовина біотичного походження, яка каталізує хімічне (хімічні) перетворення, до складу якої обов’язково входять специфічні поліпептиди. Безбілкові біокаталізатори, скажімо, добре відомі рибозими та деякі гумінові речовини [1], також можуть каталізувати реакції, але ми їх не розглядаємо в ролі ферментів. Можливо, в подальшому для небілкових біокаталізаторів варто буде розробити одну або й декілька окремих таблиць.

3. Кофактор – це неспецифічна або специфічна речовина, яка, приєднуючись до ферменту поза активним центром завдяки будь-яким зв’язкам, покращує його каталітичні властивості. Кофактори просто адсорбуються поверхнею ферменту або ж формують простетичну групу завдяки значно міцнішим хімічним зв’язкам.

4. Кофермент активного центру – це простетична група ферментного білка, яка бере участь у формуванні активного центру для каталізу.

5. Ефектор реакції – це неспецифічна або специфічна речовина-стимулятор біохімічного перетворення неферментної природи. У процесі реакції ефектори безпосередньо не впливають на ферменти, натомість виступають як засоби модифікації фізико-хімічних властивостей речовин-учасників реакції (субстратів і продуктів) або властивостей середовища (наприклад, кінематичної в’язкості). Через ефектори може опосередковано регулюватися можливість контакту між субстратами і ферментами (доступність субстратів до ферментів або навпаки).

6. Інгібітор, супресор – неспецифічні або специфічні речовини, які пригнічують 1) біохімічне перетворення безпосередньо, 2) через вплив на фермент, а також активності 3) сигнальних молекул, 4) функціональних білків і 5) експресію генів. За інгібітори доцільно вважати речовини, що пригнічують реакції безпосередньо, а за супресори – ті, що негативно впливають на активність біомолекул.

7. Структурний ген – це ділянка геному, що кодує будову продукту/продуктів своєї експресії: Кінцевими продуктами експресії структурних генів можуть бути специфічні поліпептиди або РНК-транскрипти.

8. Регуляторна ділянка геному являє собою ген, який внаслідок взаємодії з сигнальними молекулами впливає на експресію підконтрольного їй структурного гену/підконтрольних структурних генів. Варто не забувати, що існує явище перекриття генів, тобто одна й та ж ділянка геному може виступати і структурним геном, і оператором експресії іншого гену.

9. Біохімічне (і взагалі хімічне) перетворення – це процес зміни одного виду речовини/одних видів речовин в інший/інші.

10. Сигнальна молекула – це неспецифічна або специфічна молекула, яка регулює будь-який клітинний процес, не змінюючи при цьому докорінно хімічної будови речовин, на які вона впливає. Це означає, що сигнальні молекули можуть взаємодіяти з молекулами інших речовин, не змінюючи атомарного складу останніх. Дія сигнальних молекул здебільшого обмежується або ізомеризацією контрольованих молекул, або зміною їхньої конформації. Таким чином відбуваються вмикання/вимикання/перемикання у механізмах діяльності живих об’єктів. Як сигнальні молекули ми також розглядаємо тРНК та рРНК.

11. Білкова субодиниця – це поліпептидний продукт експресії гену після завершення його посттрансляційної модифікації.

12. Функціональний білок – специфічна речовина, яка обов’язково містить один або декілька поліпептидних компонентів, причетна до виконання функції/функцій, пов’язаної/пов’язаних з будь-яким проявом обміну речовин у живому організмі. Ферменти, кофактори та супресори поліпептидної природи – це теж функціональні білки, але в таблиці «Функціональні білки» повинні описуватися саме ті білки, що не знаходять свого відображення у таблицях «Кофактори», «Інгібітори та супресори» і «Ферменти».

Для ефективної роботи з електронними базами даних в процесі їхнього створення потрібно визначати формати, в яких відображатимуться дані про окремі атрибути – в кожному з полів бази. Так, у програмному додатку Microsoft Access передбачено 1) числовий (далі будемо його умовно позначати як num); 2) текстовий (txt); 3) логічний (lgc); 4) лічильник (cnt); 5) поле МЕМО (memo), 6) гіперпосилання (hlnk), 7) поле об’єкту OLE (ole) та деякі інші формати [2].

Цілком очевидно, що для повноцінної біохімічної електронної бази даних потрібно передбачити ще й інші формати: 8) числовий, в якому б указувалося не одне, а серія натуральних чисел-номерів мономерів у полімерній молекулі (num*); 9) розширеного логічного та його різновиду – логічного перемикача (останній призначений для полів зі службовою функцією, про що піде мова далі) (lgc*); 10) особливого текстового формату, кожний символ якого прочитувався б комп’ютером як нуклеотид або амінокислота відповідно в ланцюгах нуклеїнових кислот і поліпептидів (txt*); а крім того формати редакторів 11) хімічних (напр., cwg або skc) і 12) математичних (eq) формул та 13) графіка математичних функціональних залежностей (plot).

«Каталог метаболічних шляхів» запроектовано як електронну реляційну базу даних на 12 таблиць, між якими встановлюється біля 50 зв’язків: 15 обов’язкових, 32 факультативних і 4 допоміжних.

2. технічні особливості ЕБД
ЕБД «Каталог метаболічних шляхів» має декілька нижче перелічених особливостей.

1. Системи альтернативних зв’язків. Для поля однієї з таблиць можуть бути передбачені зв’язки з полями кількох полів інших таблиць, але для кожного окремого запису наявність зв’язку з одним із таких полів виключає зв’язки з іншими полями.

2. Можливість довільного визначення кількості однойменних полів для кожного окремого запису укладачами ЕБД. Ця опція передбачена для тих випадків, коли різні об’єкти однієї і тієї ж категорії можуть мати різну кількість однойменних атрибутів, наприклад, до складу різних білків може входити різна кількість неоднакових субодиниць. Саме тому в процесі проектування бази важко передбачити, яка найбільша кількість таких однойменних полів необхідна в таблиці.

3. Можливість відображення декількох (альтернативних) інваріантів одного запису в окремих комірках із непершочерговою інформацією без створення окремого запису для всієї таблиці.

4. Існування в ЕБД окрім таблиць із основною інформацією ще двох родів таблиць-дублів зі службовою інформацією: а) гіперпосилання; методи визначення або посилання на джерела, що відповідають основній інформації; б) оцінка надійності даних, що потрібно для розв’язання, так званих задач, із нечіткими висновками. Ми вважаємо, що в разі налагодження обміну даними з програмами з інших галузей знань (наприклад, з біосистематики) проектована електронна база зможе автоматично (без допомоги людини) оцінювати надійність цілої низки даних або принаймні допомагати зробити це укладачам бази.

Заключне слово
Заповнення ЕБД “Каталог метаболічних шляхів” можливе завдяки співпраці багатьох дослідників, але значний поступ у цій справі можуть дати програми для обміну цілими масивами даних із іншими інформаційними ресурсами, що є на сьогодні в світі поширеною практикою наповнення електронних баз знань інформацією [3].

СПИСОК ЛІТЕРАТУРИ

  1. Алиев С.А. Азотфиксация и физиологическая активность органического вещества почв. – Новосибирск: Наука, 1988. – 145 с.
  2. Глушаков С.В., Сурядний А.С. Microsoft Office xp: Учеб. издание. – Харьков: Фолио, 2006. – 750 с.
  3. Goble C.A., Stevens R., Ng G., Bechhofer S., Paton N.W., Baker P.G., Peim M., Brass A. Transparent access to multiple bioinformatics information sources // IBM Systems Journal. – 2001. – Vol. 40, No 2. – P. 532-550.
  4. УДК 577.121:004.652  

Вітер А.В. Проект електронної бази даних «Каталог метаболічних шляхів» [Електронний ресурс]  / [Вітер А.В.] // Збірник наукових статей “ІІІ-го Всеукраїнського з’їзду екологів з міжнародною участю”. – Вінниця, 2011. – Том.1. – С.172–174. Режим доступу: http://eco.com.ua/

Скачати в форматі pdf:

Оцінка: 
0
No votes yet