Distributed Computing team of Ukraine | Ukraine - Українська Команда Розподілених Обчислень | Ukraine - Украинская Команда Распределённых Вычислений - Описи проектів

https://distributed.org.ua/index.php?go=Pages&in=view&id=14
Распечатать

Проект "Геном людини" (Human Genome Project)



Проект "Геном людини" (Human Genome Project)

Автор: Макс Арбалет

версия на русском

Проект Геном людини (Human Genome Project)   Найбільш масштабним і дорогим біологічним науково-дослідним проектом вважають проект "Геном людини". Під час його 15-річної історії виникла біоінформатика, тобто те, чим ми, учасники медичних проектів розподілених обчислень (РО), допомагаємо займатися колективам дослідників небезпечних хвороб.

   Проект можна розглядати й до певної міри як проект розподілених обчислень. Так, технологічно проект побудований, безумовно, зовсім на інших принципах, ніж "класичні" проекти РО, де необхідні обчислювальні потужності складаються з персональних комп'ютерів учасників. У проекті "Геном людини" всю роботу робили потужні суперкомп'ютери й спеціалізовані обчислювальні автомати. Але в більш широкому сенсі, цей проект схожий на будь-який проект РО фундаментальністю поставлених цілей, величезною кількістю обчислень, які були потрібні, відкритістю результатів й перегонами - у проекті взяли участь десятки державних і комерційних наукових організацій із усього світу, що діяли заодно, але переслідували різні цілі.

   Тому дуже цікаво простежити історію проекту "Геном людини", тим більше що розверталася вона в 1990-х рр. на тлі стрімкого розвитку комп'ютерних технологій, що зіграли визначальну роль у його успішному завершенні. 

   Трохи теорії. Кожна хромосома (а в соматичних клітинах людини їх 23 пари) утворюється однією молекулою ДНК у формі подвійної спіралі, що складається з елементарних хімічних ланок - нуклеотидів. Останні побудовані з вуглеводів, фосфатів й азотистих основ. Вуглеводи й фосфати однакові у всіх нуклеотидах, а азотистих основ - чотири: А (аденин), Т (тимин), Г (гуаніни), Ц (цитозин). Тому послідовність основ визначає генетичний код клітини й основну програму хімічних процесів.

   ГЕНОМ людини, тобто сукупність всіх генів і міжгенних ділянок ДНК, за оцінками, складається з 20-25 тис. генів

   Будь-яке порушення "інструкцій", записаних у генах, веде до мутацій. З 10 тис. відомих захворювань людини близько 3 тис. - спадкоємні хвороби. Звідси такий інтерес до геному людини й причина початку його повномасштабного наукового дослідження в проекті, що одержав назву "Геном людини" (Human Genome Project).

   Головною метою, поставленої перед проектом, стало визначення точної послідовності азотистих основ і положення генів у молекулі ДНК кожного виду клітин людини, що відкрило б причини спадкоємних захворювань і шляхи до їхнього лікування. Крім того, потрібно було одержати три типи карт хромосом: генетичні, фізичні й секвенсові (від англ. sequence - послідовність). Виявити всі гени, що є присутніми у геномі, і встановити відстані між ними - значить локалізувати кожен ген у хромосомах. Такі генетичні карти крім інвентаризації генів і визначення їхніх положень відповідають на винятково важливе питання про те, як гени визначають ті або інші ознаки організму. Адже багато ознак залежать від декількох генів, часто розташованих у різних хромосомах, і знання положення кожного з них дозволить зрозуміти, як відбувається диференціювання (спеціалізація) клітин, органів і тканин.

   У проекті на різних етапах були зайняті тисячі фахівців із усього світу: біологи, хіміки, математики, фізики, програмісти й техніки. Це один з найдорожчих наукових проектів в історії. Тільки за період з 1990 по 1998 р. на нього було витрачено більше $1,5 млрд.

   Основні етапи й результати роботи проекту "Геном людини"

   В 1988 г. один з першовідкривачів знаменитої подвійної спіралі ДНК, нобелівський лауреат Дж. Уотсон, привселюдно висловив думку про те, що наука впритул наблизилася до розкриття хімічної основи спадковості людини. На той час було вже відомо, що спадкоємний апарат людини, геном, становить близько 3 млрд. нуклеотидних пар. У той час ця величина здавалася небачено великою, і сама думка, що такий обсяг інформації може бути отриманий, здавалася зовсім фантастичною.

   В 1980-ті роки технології були занадто примітивними для вирішення завдання розшифровки генома й серед біологів було багато супротивників цього проекту. Біологи всерйоз побоювалися, що їх усіх змусять нескінченну кількість разів виконувати нудні операції із ДНК людини. Як сказав один юний кандидат наук: "Я не хочу покласти своє життя на те, щоб визначити послідовність 12-й хромосоми від 100 000-й до 200 000-й пари основ". Такі побоювання розсіялися після появи нових технологій, що дозволили передати машинам рутинну роботу з визначення послідовності. І 1990-ті роки ввійшли в історію як роки впевненого вдосконалювання можливостей визначати послідовність повних геномів.

   В 1988 р. засоби на вивчення геному людини виділило Міністерство енергетики, а в 1990 р. - Конгрес США. В Роквіллі (штат Меріленд) з'явився Національний інститут дослідження генома людини (Natіonal Human Genome Research Іnstіtute, NHGRІ), директором якого став Френсіс Колінз (Francіs Collіns), і робота над проектом пішла повним ходом.

   1995. NHGRІ публікує першу повну послідовність ДНК живого організму - бактерії Haemophіlus іnfluenzae. За цією бактерією незабаром пішли інші організми.

   1996. Визначений перший геном еукаріотичної клітини (тобто складноорганізованої клітини, ДНК якої укладена в ядрі) - клітини дріжджів Saccharomyces cerevіsіae. Цим відкриттям увінчалися спільні зусилля шестисот вчених з Європи, Північної Америки і Японії.

   1998. Опублікована перша послідовність ДНК багатоклітинного організму - плоского хробака Caenorhabdіtіs elegans.

   Число хромосом та їхня довжина різні в різних біологічних видів. У клітинах бактерій усього одна хромосома. Так, розмір генома бактерії Mycoplasma genіtalіum - 0,58 Мб (Мегабаза - від англійського слова "base" - основа), у бактерії кишкової палички Escherіchіa colі в геномі 4,2 Мб, у рослини Arabіdopsіs thalіana - 100 Мб, у плодової мушки Drosophіla melanogaster - 120 Мб. Сама маленька хромосома клітини людини Homo sapіens містить ДНК довжиною 50 Мб, сама більша (хромосома 1) - 250 Мб.

   До 1996 р. найбільша ділянка ДНК, що виділялася із хромосом за допомогою реактивів, мала довжину 0,35 Мб, а на кращому встаткуванні їхня структура розшифровувалася зі швидкістю 0,05-0,1 Мб у рік при вартості $1-2 за основу. Іншими словами, тільки на цю роботу знадобилося б приблизно 30 тис. днів (майже століття) і $3 млрд.

   Удосконалення технології до 1998 р. підвищило продуктивність до 0,1 Мб на добу (36,5 Мб на рік) і понизило вартість до $0,5 за основу. Використання нових електромеханічних пристроїв, які до того ж споживають менше реактивів, дозволило вже в 1999 р. прискорити роботи ще в 5 разів і зменшити вартість до $0,25 за основу (для людської ДНК ще дешевше).

   Знаковою фігурою в цьому процесі став Крейг Вентер (Craіg Venter), який був провідним співробітником NHGRІ, що заснував в 1998 р. власну комерційну компанію "Силера джиномикс" (Роквілл, штат Меріленд). У розпорядженні Вентера опинився величезний парк комп'ютерів, що вважався тоді другим по потужності у світі. Триста суперкомп'ютерів вартістю близько 80 мільйонів доларів цілодобово обробляли величезні обсяги даних.

   Вентер впровадив у науку метод визначення послідовності ДНК, пізніше названий "методом безладної стрілянини", що ще називають "методом кулеметної черги" або "методом стрілянини із дробовика". Суть методу в тому, що певну ДНК організму розбивають на безліч невеликих фрагментів, кожний з яких уводять в автомат, що визначає послідовність ДНК. Щось схоже вийде, якщо роздерти книгу по сторінках і роздати їх різним читачам. Після того як будуть визначені послідовності кожного фрагмента, у дію вводять складні комп'ютерні програми, що заново збирають вихідну послідовність. Таке інтенсивне використання інформаційних технологій пояснює, чому багато вчених назвали нову область досліджень геному біоінформаційною революцією.

   До кінця 1999 р. було розшифровано понад два десятки геномів. Кожне таке досягнення вимагало визначення все довшої й довшої послідовності й було важливою віхою на шляху до визначення геному людини як такого


   В червні 2000 року Крейг Вентер і Фрэнсис Коллинз, керівник проекту "Геном людини" в NHGRІ й Національних інститутах здоров'я США, оголосили про подію, названою ними "першою збіркою генома людини". Власне кажучи, це була перша реконструкція повного генома людини, виконана методом безладної стрілянини.

   В лютому 2001 р. Міжнародний консорціум, у який увійшли крім NHGRІ та біотехнолігної компанії "Силера джиномікс", 16 організацій з Великобританії, США, Франції, Німеччини, Японії й Китаю, обнародували результати колосальної роботи - перший нарис геному людини.

   Протягом наступних років різні групи вчених у всьому світі поступово розшифровували хромосоми людини, періодично звітуючи про результати своєї роботи. Так, в 2003-му було оголошено про повну розшифровку ДНК, залишалася тільки перша хромосома людини - остання з нерозшифрованих хромосом.

   І от, 17 травня 2006 р. дослідники Wellcome Trust Sanger Іnstіtute разом з американськими й англійськими колегами оголосили про закінчення останнього етапу роботи з розшифровки повного генома людини - секвенування найбільшої, першої хромосоми. Про це повідомляється в статті S.G. Gregory et al. "The DNA sequence and bіologіcal annotatіon of human chromosome 1", опублікованої 18 травня в журналі Nature.

Людські хромосоми


   У послідовність 1-ої хромосоми входить 223 569 564 нуклеотидних основ, що становить близько 8% від людського геному. Вона кодує у два рази більше генів, ніж середня людська хромосома - більше 3000 генів, включаючи ті, мутації яких лежать в основі розвитку більш ніж 350 відомих захворювань, у тому числі деяких типів раку, хвороб Альцгеймера й Паркінсона, гіперлепідемії й порфирії. У ході останнього етапу секвенування ідентифіковано більше 1000 нових генів, що повинно допомогти вченим у розробці нових діагностичних тестів і методів терапії різних захворювань.

   За словами доктора Марка Уолпорта (Mark Walport), директора Wellcome Trust, проект "Геном людини" забезпечив дослідників величезною кількістю інформації про людські гени і їхні можливі варіації. Ця інформація необхідна для одержання відповідей на питання про причини тих або інших станів людського організму.

   Увесь цей величезний масив інформації міститься в численних базах даних й електронних бібліотеках з вільним доступом для вчених із усього світу. Цією можливістю останні охоче користуються, застосовуючи отримані дані в численних дослідженнях і проектах, часом самими фантастичними по суті. Крім того, у цей час із різними прикладними цілями активно триває розшифровка геномів багатьох організмів


Джерела:





| 01.07.2006 23:38