Генетика и молекулярная биология https://geneforum.ru/ |
|
АЛГОРИТМ ГЕНЕТИЧЕСКОГО КОДА. ИННОВАЦИОННЫЙ МЕТОД СЕКВЕНИРОВА https://geneforum.ru/viewtopic.php?f=29&t=27013 |
Страница 1 из 1 |
Автор: | Ахмед Мурзабулатов [ Вт окт 27, 2015 5:19 pm ] |
Заголовок сообщения: | АЛГОРИТМ ГЕНЕТИЧЕСКОГО КОДА. ИННОВАЦИОННЫЙ МЕТОД СЕКВЕНИРОВА |
Современные методы секвенирования генома очень эффективны. Эти методы показывают значительные результаты. Вместе с тем, можно повысить продуктивность секвенирования. Повышение продуктивности достигается за счёт инновационного метода. Современные способы секвенирования базируются на принципе исследования от частного к общему (индукция). Инновационный подход заключается в принципе исследования от общего к частному (дедукция). В рамках инновационного метода производятся 2 основных этапа - 1 ЭТАП - определение математической формулы ДНК как интерпретация данных генома. 2 ЭТАП - на основе математической формулы ДНК составляется алгоритм генетического кода. ЧАСТЬ 1.МАТЕМАТИЧЕСКАЯ ФОРМУЛА ДНК. Интерпретация данных генома предполагает использование математических инструментов. С помощью этих инструментов составляется математическая формула ДНК. Математическая формула ДНК имеет следующий вид- (323 000 х 3) х 3 333 = 3 200 000 000 1) где 3 200 000 000 = количество пар нуклеотидов в геноме человека. 2) где 323 000 = множество А4, множество А4 = 11 множеств А3 и В3, множество А3 = В2,А2,В2; множество В3 = А2,В2,А2. множество А2 = В1 ,А1,В1; множество В2 = А1,В1,А1. множество А1 = В,А,В,А,В,А,В,А,В,А,В; множество В1 = А,В,А,В,А,В,А,В,А,В,А. множества А и В = 2 строенных множества из стандартных и постстандартных множеств триплетов. 2А) где А) стандартное множество триплетов (СМ ) - AAC, CTC, GGC, TGC,TCT, CCT, GCT, CCC, CGC, GCC,TCC, TGT,CGT, GGT, GGG, TGG, AAC,TCG, CCG, GCG, GTC, TTC, TTT , CTT, GTT, AGC, ACT, ACC, GAC, TAC, TAТ, CAT, TTG. Стандартное множество состоит из 33 триплетов, или 99 пар нуклеотидов. 2Б) постстандартное множество триплетов (ПМ) - ATT, GAT, CAC, GGA, TGA, TCA, CCA, GCA, CGG,GTA, TTA, CTA, TAG, GAG, ACG, AGA, TAA,CGA, AGG, ACA, CAG, AAG, AAA, GAA, CAA, CTG, ATG, ATA, GTG, AGT, AAT, ATC,TAA. Постстандартное множество состоит из 33 триплетов, или 99 пар нуклеотидов. Стандартное и постстандартное множества вместе представляют полный набор из 64 кодонов, из которых 61 кодон кодируют аминокислоты, а 3 стоп- кодона ( TGA,TAG, TAA ) не кодируют аминокислоты. ПРИМЕЧАНИЕ 1- В ДНК триплеты размещены непрерывно и без пробелов. Однако, в технических целях - для наглядности в математической формуле ДНК между триплетами ставится знак препинания - запятая. 2А1) множество А состоит из ПМ - СМ - ПМ - ATT, GAT, CAC, GGA, TGA, TCA, CCA, GCA, CGG,GTA, TTA, CTA, TAG, GAG, ACG, AGA, TAA,CGA, AGG, ACA, CAG, AAG, AAA, GAA, CAA, CTG, ATG, ATA, GTG, AGT, AAT, ATC,TAA, AAC, CTC, GGC, TGC,TCT, CCT, GCT, CCC, CGC, GCC,TCC, TGT,CGT, GGT, GGG, TGG, AAC,TCG, CCG, GCG, GTC, TTC, TTT , CTT, GTT, AGC, ACT, ACC, GAC, TAC, TAТ, CAT, TTG,. ATT, GAT, CAC, GGA, TGA, TCA, CCA, GCA, CGG,GTA, TTA, CTA, TAG, GAG, ACG, AGA, TAA,CGA, AGG, ACA, CAG, AAG, AAA, GAA, CAA, CTG, ATG, ATA, GTG, AGT, AAT, ATC,TAA. Множество А состоит из 99 триплетов, или 297 пар нуклеотидов.. 2Б1) множество В состоит из СМ- ПМ - СМ - AAC, CTC, GGC, TGC,TCT, CCT, GCT, CCC, CGC, GCC,TCC, TGT,CGT, GGT, GGG, TGG, AAC,TCG, CCG, GCG, GTC, TTC, TTT , CTT, GTT, AGC, ACT, ACC, GAC, TAC, TAТ, CAT, TTG. ATT, GAT, CAC, GGA, TGA, TCA, CCA, GCA, CGG,GTA, TTA, CTA, TAG, GAG, ACG, AGA, TAA,CGA, AGG, ACA, CAG, AAG, AAA, GAA, CAA, CTG, ATG, ATA, GTG, AGT, AAT, ATC,TAA. AAC, CTC, GGC, TGC,TCT, CCT, GCT, CCC, CGC, GCC,TCC, TGT,CGT, GGT, GGG, TGG, AAC,TCG, CCG, GCG, GTC, TTC, TTT , CTT, GTT, AGC, ACT, ACC, GAC, TAC, TAТ, CAT, TTG. Множество В состоит из 99 триплетов, или 297 пар нуклеотидов. Таким образом, множества А и В представляют строенные стандартное и постстандартное множества триплетов. Математическая формула ДНК строится по следующему алгоритму- 1) 297 х 11 = 3 267 2) 3 267 х 3 = 9 801 3) 9 801 х 3 = 29 403 4) 29 403 х 11 = 323 430 5) (323 430 х 3) х 3 333 = округлённо 3 200 000 000 Приведём более детальное изложение алгоритма математической формулы ДНК - 1 ДЕЙСТВИЕ - 1 ШАГ- в качестве исходных множеств берутся множество А и множество В, 2 ШАГ- перед и после исходного множества А (и множества В) размещаются по 5 множеств, которые равны по количеству элементов множеству А (и множеству В), то есть 10 множеств А и В. В результате формируется - А) множество В,А,В,А,В, ----- А, ----- В,А,В,А,В, Обозначим данное множество символом А1. Б) множество А,В,А,В,А,---- В,----- А,В,А.В,А. Обозначим данное множество символом В1. В множестве А1, и в множестве В1 содержатся по 11 элементов, то есть 11 множеств А и В, то есть 10 множеств А и В + 1 множество А (или 1 множество В). то есть 2970 +297= 3 267 элементов (пар нуклеотидов). 2 ДЕЙСТВИЕ - 1 ШАГ- перед и после множества А1 (и множества В1) размещаются по 1 множеству, которые равны по количеству элементов множеству А1 (и множеству В1), то есть - А) В1,------ А1, ----- В1. Обозначим данное множество символом А2. Б) А1,---- В1,---- А1. Обозначим данное множество символом В2. В множестве А2, и в множество В2 содержатся по 3 множества А1 и В1. то есть 3 267 + 3 267 + 3 267 = 9 801 элемент (пар нуклеотидов). 3 ДЕЙСТВИЕ - 1 ШАГ- перед и после множества А2 (и множества В2) размещаются по 1 множеству, которые равны по количеству элементов множеству А2 (и множеству В2), то есть - А) В2, ------ А2, ----- В2, Обозначим данное множество символом А3. Б) А2, ------ В2,---- А2. Обозначим данное множество символом В3. В множестве А3, и в множестве В3 содержатся по 3 множества А2 и В2, то есть 9 801 + 9 801 + 9 801= 29 403 элемента (пар нуклеотидов). 4 ДЕЙСТВИЕ - 1 ШАГ- перед и после множества А3 размещаются по 5 множеств, которые равны по количеству элементов множеству А3 (и множеству В3), то есть - В3,А3,В3,А3,В3,------ А3, ------ В3,А3,В3,А3,В3. Обозначим данное множество символом А4. Множество А4 состоит из 11 множеств А3 и В3, то есть 10 множеств А3 и В3 + 1 множество А3, то есть 29 403 х 11= 323 430 элементов (пар нуклеотидов). ДАЛЬНЕЙШИЕ ДЕЙСТВИЯ- на каждом следующем шаге производится операция, которая аналогична 2 шагу 1 действия, то есть перед и после определённого исходного множества размещаются по 1 множеству, которое равно по количеству элементов данному исходному множеству. Например- А4, ------ А4, ----- А4 = 3 А4, или А5, ---- А5, ------ А5 = 3 А5, или А6, ----- А6, ------ А6 = 3 А6 Данная операции умножения на 3 производятся 3 333 раза, то есть - (A4 х 3) х 3 333 = округлённо 3 200 000 000 пар нуклеотидов. 3 200 000 000 = количество пар нуклеотидов, которое содержится в геноме человека. ЧАСТЬ 2. АЛГОРИТМ ГЕНЕТИЧЕСКОГО КОДА. На основе математической формулы ДНК строится алгоритм генетического кода. АЛГОРИТМ ГЕНЕТИЧЕСКОГО КОДА имеет следующий вид- 1) 297 х 11 = 3 267 (множество пар нуклеотидов, представляющих 1 ген). 2) 3 267 х 3 = 9 801. 3) 9 801 х 3 = 29 403. 4) 29 403 х 11 = 323 430 (множество пар нуклеотидов, представляющих 3 гена). 5) (323 430 х 3) х 3 333 = 3 200 000 000 (множество пар нуклеотидов, представляющих 30 000 отображений энхансеров). 6) 30 000 - 1 500 = 28 500 генов. Приведём более детальное изложение алгоритма генетического кода - 1 ДЕЙСТВИЕ - 1 ШАГ- в качестве исходных множеств берутся множество А и множество В, 2 ШАГ- перед и после исходного множества А (и множества В) размещаются по 5 множеств, которые равны по количеству элементов множеству А (и множеству В), то есть 10 множеств А и В. В результате формируется - А) множество В,А,В,А,В, ----- А, ----- В,А,В,А,В Обозначим данное множество символом А1. Б) множество А,В,А,В,А,---- В,----- А,В,А.В,А. Обозначим данное множество символом В1. В множестве А1 и в множестве В1 содержатся по 11 элементов, то есть 11 множеств А и В, то есть 10 множеств А и В + 1 множество А (и множество 1В). то есть 2970 +297= 3 267 элементов (пар нуклеотидов). 2 ДЕЙСТВИЕ - 1 ШАГ- перед и после множества А1 (и множества В1) размещаются по 1 множеству, которые равны по количеству элементов множеству А1 (и множеству В1), то есть - А) В1,------ А1, ----- В1. Обозначим данное множество символом А2. Б) А1,---- В1,---- А1. Обозначим данное множество символом В2. В множестве А2, и в множество В2 содержатся по 3 множества А1 и В1. то есть 3 267 + 3 267 + 3 267 = 9 801 элемент (пар нуклеотидов). 3 ДЕЙСТВИЕ - 1 ШАГ- перед и после множества А2 (и множества В2) размещаются по 1 множеству, которые равны по количеству элементов множеству А2 (и множеству В2), то есть - А) В2, ------ А2, ----- В2, Обозначим данное множество символом А3. Б) А2, ------ В2,---- А2. Обозначим данное множество символом В3. В множестве А3, и в множестве В3 содержатся по 3 множества А2 и В2, то есть 9 801 + 9 801 + 9 801= 29 403 элемента (пар нуклеотидов). ПРИМЕЧАНИЕ 2 - Множество А3 представляет полный комплект множеств с изменёнными позициями триплетов - от 1 до 99 тройки букв (смотрите ПРИЛОЖЕНИЕ 1). Множество А3 представляет множество из 61энхансера. Каждый энхансер представлен множеством А, или множеством В. Каждый энхансер определяет структуру гена. Множества, которые не входят в состав множества А3, однако идентичны определённым генам, также представляют соответствующие энхансеры. 4 ДЕЙСТВИЕ - 1 ШАГ- перед и после множества А3 размещаются по 5 множеств, которые равны по количеству элементов множеству А3 (и множеству В3) то есть - В3,А3,В3,А3,В3,------ А3, ------- В3,А3,В3,А3,В3. Обозначим данное множество символом А4. Множество А4 состоит из 11 множеств А3 и В3, то есть 10 множеств А3 и В3 + 1 множество А3, то есть 29 403 х 11= 323 430 элементов (пар нуклеотидов). 5 ДЕЙСТВИЕ - 1 ШАГ- в множестве А4 выделяем элементы № 1 и № 11, то есть В3, ----- А3,В3,А3,В3,А3,В3,А3,В3,А3,------- В3. В результате получается множество из 9 элементов - А3,В3,А3,В3,А3,В3,А3,В3,А3, 2 ШАГ- Множество А3,В3,А3,В3,А3,В3,А3,В3,А3 делится на 3 равные части, то есть А3,В3,А3,--------- В3,А3,В3,-------- А3,В3,А3. 3 ШАГ - В каждом из 3 данных множеств выделяется второй (то есть центральный) элемент, то есть А3,/В3,/А3,--------- В3,/А3,/В3,-------- А3,/В3,/А3. В результате получаем 3 множества - В3, А3, В3, 4 ШАГ- В каждом множестве В3, А3, В3 выделяем по 1 центральному элементу, то есть множества В2, А2, В2. 5 ШАГ- В каждом множестве В2, А2 ,В2 выделяем по 1 центральному элементу, то есть множества В1,А1,В1. 6 ШАГ - В каждом множестве В1,А1,В1 выделяем второй (центральный) элемент, то есть - множество А1. Каждое множество А1 имеет следующий вид - В,А,В,А,В,А,В,А,В,А,В 7 ШАГ - В каждом множестве А1, то есть - В,А,В,А,В,А,В,А,В,А,В выделяются элементы № 3, № 6, № 9, то есть - В,А,------ /В,/ ----- А,В,----- /А,/ ------ В,А,------ /В,/ ------ А,В. В результате получаем 3 множества - В № 2, А № 3, В № 5. 6 ДЕЙСТВИЕ - 1 ШАГ- Каждое из 3 множеств В № 2, А № 3, В № 5 отображает (процесс рефлексии) энхансер № 1 (смотрите ПРИЛОЖЕНИЕ 3). Энхансер с непрерывно размещёнными элементами будет отображаться прерывно (дискретно - фрагментарно - по отдельным частям) на множествах В № 2, А № 3, В № 5. Таким образом, отображаемые части расположены равномерно по всему множеству А1. В множестве В № 2 выделяем постстандартное множество триплетов. В множестве А № 3 выделяем стандартное множество триплетов, В множестве В № 5 выделяем постстандартное множество триплетов. В множествах А № 1 и А № 5 на соответствующих триплетах также будут отображаться части энхансера, представленные переносимыми из начала в конец триплетами. Все выделенные элементы множества А1, которые отображают элементы энхансера представляют экзоны. (смотрите ПРИЛОЖЕНИЕ 3). Оставшиеся элементы множества А1, которые не отображают энхасер представляют интроны. 1 единица экзонов = 297 пар нуклеотидов. Поэтому, оставшиеся элементы, которые представляют интроны составляют 10 единиц интронов по 297 пар нуклеотидов. Таким образом, множество А1 представляет 1 ген, в том числе 1 единицу экзонов и 10 единиц интронов. ПРИМЕЧАНИЕ 3 - Экзоны являются своеобразными копиями (отображением - проекцией) энхансера. Энхансер представляет из себя множество из 297 триплетов, которые располагаются непрерывно. В отличии от энхансера, экзоны представлены фрагментарно (дискретно- по частям). Основная часть экзонов представлена множествами В № 2, А № 3, В № 5 В процессе изменения позиций триплетов (смотрите ПРИЛОЖЕНИЕ 1) переносимые из начала в конец триплеты располагаются по отдельности среди множеств А № 1 и А № 5. 2 ШАГ- В множестве В1 № 1 множества А2 выделяем элемент № 11. Данный элемент представляет промотор. В множестве В1 № 2 множества А2 выделяем элемент № 1. Данный элемент представляет сайленсер. (смотрите ПРИЛОЖЕНИЕ 3) 3 ШАГ- В множестве В1 № 1 множества А2 выделяем элемент № 10. Данный элемент представляет инсулятор. В множестве В1 № 2 множества А2 выделяем элемент № 2. Данный элемент представляет инсулятор. (смотрите ПРИЛОЖЕНИЕ 3) Таким образом, множество А1 представляет 1 ген, в том числе 1 единицу экзонов и 10 единиц интронов, ПРИМЕЧАНИЕ 4 - Множества А и В представляют строенный набор кодонов - стандартных и постстандартных множеств триплетов. 3 стандартных и 3 постстандартных множеств триплетов в множествах А и В представляют полный набор кодонов. В множествах А и В размещается триплет № 50. Триплет № 50 имеет принципиальное значение. В множествах А и В на каждом следующем шаге построения математической формулы ДНК изменяется изменяется позиция триплетов (смотрите ПРИЛОЖЕНИЕ 1). В случае если в процессе изменения позиций триплетов триплет № 50 будет представлен одним из трёх стоп- кодонов ( TGA,TAG, TAA ), то множество А (или множество В) не будет представлять ген. 7 ДЕЙСТВИЕ - 1 ШАГ- В множествах А3,В3,А3,--------- В3,А3,В3,-------- А3,В3,А3. (смотрите 2 шаг 5 действия) выделяются первое и третье множества, то есть множества А3,В3,А3 и А3,В3,А3 повторяют операцию отображения энхансера. При этом эти множества отображают соответственно энхансер № 2 и энхансер № 3 (смотрите ПРИЛОЖЕНИЕ 3). Таким образом множество А3,В3,А3,--------- В3,А3,В3,-------- А3,В3,А3 из множества А4 представляет 3 гена. В целом множество А4 вместе с элементами № 1 и № 11 представляет 3 гена, в том числе 3 единицы экзонов и 30 единиц интронов, а также 3 промотора, 3 сайленсера,6 инсуляторов. Множество А4 состоит из 11 множеств А3 и В3, то есть 29 403 Х 11= 323 430 элементов. Множество А4 является множеством пар нуклеотидов, которые представляют тройку генов. Множество А4 имеет принципиально важное значение в алгоритме генетического кода, и является его своеобразной единицей. ДАЛЬНЕЙШИЕ ДЕЙСТВИЯ - последующие шаги аналогичны действиям алгоритма математической формулы ДНК, то есть то есть перед и после определённого исходного множества размещаются по 1 множеству, которое равно по количеству элементов данному исходному множеству то есть А4, ------ А4, ----- А4 = 3 А4, Множество А4, которое представляет 3 гена на умножается 3. Процесс умножения на 3 производится 3 333 раза В результате получается округлённо 3 200 000 000 пар нуклеотидов, в том числе 30 000 отображений энхансеров. ПОСЛЕДНЕЕ ДЕЙСТВИЕ - из 30 000 отображений энхансеров вычитается 5%. Данные 5% представляют 3 стоп- кодона в каждом множестве из 64 кодонов. По 6 стоп - кодонов в множестве А, и 3 стоп -кодона в множестве В. Всего 9 стоп - кодонов в строенном множестве СМ - ПМ - СМ, и в строенном множестве ПМ -СМ- ПМ. В среднем 4,5 стоп - кодона. По отношению к 99 триплетам 4,5 кодона означают около 5 % от общей численности кодонов. 5% = 1500 стоп - кодонов. Наличие в множестве А, или в множестве В триплета № 50, который представлен одним из трёх стоп - кодонов исключает его из множества генов. Следовательно, 1500 стоп - кодонов означают, что множества А, или множества В, в составе которых триплет № 50 представлен стоп - кодоном, не входит в множество генов, то есть - 30 000 - 1500 = 28 500 генов. Таким образом, формируется множество из 28 500 генов, включая 300 000 интронов (300 000 интронов - стандартное количество интронов в геноме человека). ПРИЛОЖЕНИЯ по ссылке - https://www.facebook.com/%D0%9C%D0%B0%D ... 5%D0%BC%D0…/ Библиография . 1.Н.Грин, У. Стаут, Д.Тейлор. Биология.т.1.Стр.155,156.М.Мир.1990 2.Р.Бохински. Современные воззрения в биохимии.М.Мир. 1987.Стр.61-94,102 3.Ч.Кантор, П.Шиммел. Биофизическая химия.М.Мир.1984,Стр.148-156, 4.М.Волькенштейн Молекулы и жизнь. Введение в молекулярную биофизику.М.наука.1965,Стр.244-281,5.А.Ленинджер. Основы биохиии. М.Мир. 1985.Стр.79-85, 6. Г.Дюга, К.Пенн. Биоорганическая химия, М.Мир.1983,Стр.109-117, 7 П.Зенгбуш, Молекулярная и клеточная биология,т 1, Стр 32-63, М.Мир.1982, 8 А.Уайт, Ф.Хендлер, Основы биохимии,т 1, Стр.100-120. |
Страница 1 из 1 | Часовой пояс: UTC + 4 часа |
Powered by phpBB® Forum Software © phpBB Group https://www.phpbb.com/ |