Труды сотрудников ИВМ СО РАН

w10=
Найдено документов в текущей БД: 2
573.22
С 30

    Семикластерная структура геномов хлоропластов отражает филогению их носителей
[Текст] : научное издание / М. Ю. Сенашова, М. Г. Садовский // Международный журнал прикладных и фундаментальных исследований. - 2016. - № 12-7. - С. 1167-1173 . - ISSN 1996-3955
   Перевод заглавия: 7-cluster pattern of chloroplast genomes correlates to phylogeny of their bearers
УДК

Кл.слова (ненормированные):
триплет -- частота -- структура данных -- таксономия -- triplet -- frequency -- data pattern -- taxonomy

Аннотация: Представлены предварительные результаты исследования структуры геномов хлоропластов. Под структурой понимается кластеризация точек, соответствующих отдельным фрагментам генома хлоропласта (длиной порядка 200 нуклеотидов) в пространстве частот триплетов; частоты триплетов подсчитывались с пересечением, так, что каждый нуклеотид давал старт триплету. Было проанализировано 188 геномов хлоропластов растений самых разных таксономических уровней. Геном хлоропластов преобразовывался в частотные словари триплетов. Затем для каждого генома в 63-мерном пространстве этих частот при помощи программы VidaExpert были построены проекции данных, соответствующих выделяемым фрагментам генома, в пространстве первых трёх главных компонент. Было обнаружено, что подавляющее большинство геномов в пространстве первых трёх главных компонент имеет очень похожую пространственную структуру. Кроме того, для геномов вычислялся CG-контент, который является ведущим параметром классификации семикластерных структур геномов бактерий; ожидалось, что хлоропласты, ведущие своё происхождение от бактерий, будут также подчиняться этому правилу. Было установлено, что для хлоропластов данный параметр не является ведущим в классификации структур, наблюдаемых при анализе главных компонент распределения фрагментов геномов в пространстве частот триплетов.
Some preliminary results on the chloroplast genomes structure are provided. Structure here is an order observed within a set of points in 63-dimenstional metric space, where each point is the frequency dictionary of a fragment of a chromosome of the length app. 200 nucleotides; the fragments are identified with a step in 10 nucleotides. Frequency dictionary contains all triplets (with on exception), and the triplets have been counted so that these latter intersected, and each nucleotide gives a start for a triplet. Thus, about 15 000 fragments were identified, and converted into the points. The triplet yielding the least standard deviation over the set of the points has been eliminated. 188 chloroplast genomes of plants of various taxonomy were analyzed. Cluster stricture of the set of the points was elaborated with ViDaExpert software. It was found the genomes exhibit rather similar seven-cluster structure, especially apparent in principal component space; alongside the clusterisation, GC-content has been counted, for each genome, since it is suspected to be the key factor in pattern regulation. Unlike for bacterial genomes, GC-content was not found to be the key factor.

РИНЦ

Держатели документа:
ФГБУН «Федеральный исследовательский центр «Красноярский научный центр Сибирского отделения Российской академии наук»» — обособленное подразделение «Институт вычислительного моделирования Сибирского отделения Российской академии наук»

Доп.точки доступа:
Сенашова, М. Ю.; Senashova M. Yu.; Садовский, М. Г.; Sadovskiy M. G.
573.22
П 82

    Пространственная структура геномов цианобактерий
[Текст] : статья / М. Ю. Сенашова, М. Г. Садовский // Международный журнал прикладных и фундаментальных исследований. - 2017. - № 11-2. - С. 255-259 . - ISSN 1996-3955
   Перевод заглавия: Spatial structure of genomes of cyanobacteria
УДК

Кл.слова (ненормированные):
геном -- триплет -- частота -- структура данных -- genom -- triplet -- frequency -- data pattern

Аннотация: Представлены результаты, полученные при изучении пространственной структуры геномов цианобактерий. В качестве структуры в нашей работе понимается расположение в пространстве частот триплетов точек, соответствующих выделенным участкам генома цианобактерий. Для каждого участка длины ? со сдвигом t вычислялся частотный словарь троек символов без пересечений. Частоты рассматривались как координаты в 64-мерном пространстве. Таким образом, каждому участку генома сопоставлялась точка в пространстве частот. Было проанализировано 7 геномов цианобактерий, размещенных в EMBL-банке. Одна координата (с минимальным стандартным отклонением) отбрасывалась и в дальнейшем рассматривалось 63-мерное пространство частот. Для визуализации полученного множества точек была использована программа VidaExpert. С ее помощью для каждого генома были построены проекции в пространство первых трёх главных компонент из 63-мерного пространства частот. Мы обнаружили, что геномы цианобактерий обладают одинаковой структурой, представляющей собой своеобразный клубок из нитей. Причем нити образованы точками, соответствующими последовательным участкам генома.
The results obtained in the study of the structure of the genomes of cyanobacteria are presented. By structure in our work is meant the location in space of triplet frequencies of points corresponding to fragments of the genome of cyanobacteria. For each length-shifted fragments, a frequency dictionary of symbol triples without intersections was computed. Frequencies were considered as coordinates in a 64-dimensional space. Thus, each point of the genome was compared with a point in the frequency space. Seven genomes of cyanobacteria located in the EMBL-bank were analyzed. One coordinate (with a minimal standard deviation) was discarded and a 63-dimensional frequency space was subsequently considered. For each genome in space of frequencies by means of program VidaExpert projections from 63-dimensional space in space of first three main components have been constructed. This allowed us to visualize the structure of genomes. It was found that the genomes of cyanobacteria have the same structure, which is a kind of tangle of filaments. And the threads are formed by points corresponding to consecutive fragments of the genome.

РИНЦ

Держатели документа:
ФГАОУ «Сибирский федеральный университет», институт фундаментальной биологии и биотехнологии
ФГБУН «Федеральный исследовательский центр “Красноярский научный центр Сибирского отделения Российской академии наук”» - обособленное подразделение «Институт вычислительного моделирования» Сибирского отделения Российской академии наук»

Доп.точки доступа:
Сенашова, М.Ю.; Senashova M.Yu.; Садовский, М.Г.; Sadovskiy M.G.