Труды сотрудников ИВМ СО РАН

w10=
Найдено документов в текущей БД: 1
573.22
С 30

    Семикластерная структура геномов хлоропластов отражает филогению их носителей
[Текст] : научное издание / М. Ю. Сенашова, М. Г. Садовский // Международный журнал прикладных и фундаментальных исследований. - 2016. - № 12-7. - С. 1167-1173 . - ISSN 1996-3955
   Перевод заглавия: 7-cluster pattern of chloroplast genomes correlates to phylogeny of their bearers
УДК

Кл.слова (ненормированные):
триплет -- частота -- структура данных -- таксономия -- triplet -- frequency -- data pattern -- taxonomy

Аннотация: Представлены предварительные результаты исследования структуры геномов хлоропластов. Под структурой понимается кластеризация точек, соответствующих отдельным фрагментам генома хлоропласта (длиной порядка 200 нуклеотидов) в пространстве частот триплетов; частоты триплетов подсчитывались с пересечением, так, что каждый нуклеотид давал старт триплету. Было проанализировано 188 геномов хлоропластов растений самых разных таксономических уровней. Геном хлоропластов преобразовывался в частотные словари триплетов. Затем для каждого генома в 63-мерном пространстве этих частот при помощи программы VidaExpert были построены проекции данных, соответствующих выделяемым фрагментам генома, в пространстве первых трёх главных компонент. Было обнаружено, что подавляющее большинство геномов в пространстве первых трёх главных компонент имеет очень похожую пространственную структуру. Кроме того, для геномов вычислялся CG-контент, который является ведущим параметром классификации семикластерных структур геномов бактерий; ожидалось, что хлоропласты, ведущие своё происхождение от бактерий, будут также подчиняться этому правилу. Было установлено, что для хлоропластов данный параметр не является ведущим в классификации структур, наблюдаемых при анализе главных компонент распределения фрагментов геномов в пространстве частот триплетов.
Some preliminary results on the chloroplast genomes structure are provided. Structure here is an order observed within a set of points in 63-dimenstional metric space, where each point is the frequency dictionary of a fragment of a chromosome of the length app. 200 nucleotides; the fragments are identified with a step in 10 nucleotides. Frequency dictionary contains all triplets (with on exception), and the triplets have been counted so that these latter intersected, and each nucleotide gives a start for a triplet. Thus, about 15 000 fragments were identified, and converted into the points. The triplet yielding the least standard deviation over the set of the points has been eliminated. 188 chloroplast genomes of plants of various taxonomy were analyzed. Cluster stricture of the set of the points was elaborated with ViDaExpert software. It was found the genomes exhibit rather similar seven-cluster structure, especially apparent in principal component space; alongside the clusterisation, GC-content has been counted, for each genome, since it is suspected to be the key factor in pattern regulation. Unlike for bacterial genomes, GC-content was not found to be the key factor.

РИНЦ

Держатели документа:
ФГБУН «Федеральный исследовательский центр «Красноярский научный центр Сибирского отделения Российской академии наук»» — обособленное подразделение «Институт вычислительного моделирования Сибирского отделения Российской академии наук»

Доп.точки доступа:
Сенашова, М. Ю.; Senashova M. Yu.; Садовский, М. Г.; Sadovskiy M. G.