Команда


created: 18.04.2013
updated: 18.12.2013

Мы - группа друзей энтузиастов. Нас объединяет множество интересов, но по роду деятельности большинство из нас связаны с биологическими и информационными науками.

В 2011 году мы решили создать базу данных, которая будет лежать в основе инструмента для решения задач персонализированной медицины.

С тех самых пор мы регулярно собираем данные из научных статей, формализуем их, и интегрируем в нашу базу данных. За прошедшие 2 года мы много раз пересматривали структуру базы данных, добавляли новые сущности, связи и атрибуты. Регулярно спорили, видели несколько вариантов решения, приходили к компромиссу. Иногда приходилось вернуться назад: отказаться от некоторых задумок в пользу другого пути, более подходящего. Это нормальная практика – в биологических направлениях постоянные изменения являются нормой, там нет постоянства: каждый день появляется что-то новое, пересматриваются старые парадигмы.

Осенью 2013 года мы представили в свободный доступ первую версию инструмента по исследованию валидированных таргетов микроРНК участвующих в раке (карциномы, саркомы, лимфомы и др.). С помощью которого любой исследователь сможет найти связи между экспрессией микроРНК с молекулярными патологическими процессами отражающими развитие и прогрессию рака. Если вас интересует более широкий функционал и более частные задачи, -- смело пишите.

Кроме этого, в базе данных содержится информация о транскрипционной регуляции генов микроРНК и регуляторных цепях (и петлях) вовлеченных в канцерогенез.

Таким образом, вы сможете использовать анализ сетей взаимодействий между тремя типами объектов: микроРНК, транскрипционных факторов и генов мишеней (мРНК) для более функционального анализа и предсказания данных пациента.

Кроме этого, мы планируем включить в базу lncRNA и псевдогены (pseudogenes) участвующие или ассоциированные с канцерогенезом, а также связь с SNP, CNV, лекарствами и болезнями.

База позволит пользователю найти прямые мишени микроРНК участвующих в раке, а также транснкрипционную регуляцию этих микроРНК. Увидеть при каких типах рака эти микроРНК изменили экспрессию, с какими типами рака ассоциируется, а также увидеть в какие патологические процессы вовлеченны они сами и их гены мишени.

В дальнейшем мы добавим функционал визуализации регуляторных цепей(петель), которые формирующиеся при канцерогенезе.

На первом этапе, продукт будет охватывь основные типы рака:
breast cancer, colorectal cancer, gliomas, HCCs, gastric cancer, prostate cancer, endometrial cancer, ovarian cancer, skin cancer (including melanoma), renal cancer, lung cancer и другие.

Для визуализации данных мы используем различные инструменты:

  • graphviz
  • cytoscape.js/cytoscape web
  • angularjs
  • d3js
  • pure javascript

Например, так сейчас выглядит нетворк гена tp53 (graphviz / данные на 21_09_2012):

tp53__map__21_09_2012
(*изображение специально заблерено)

Коктейль Яманаки + NANOG (cytoscape web):

Здесь тестовое приложение, визуализирующая триединые сущности ген-РНК-белок в виде единых класстеров. (Еще будет версия на cytoscape.js, само собой).

Сейчас мы пишем алгоритмы и систему фильтров, чтобы не возникало вот таких сложных и непонятных нетворков (сетей):

Общая цель – моделирование клеточных и тканевых процессов передачи информации, выраженной во взаимодействиях белков, РНК. ДНК и других биоактивных молекул, и определяющей жизнедеятельность клетки: активность метаболизма, фазу клеточного цикла, состояние дифференцированности и готовность клетки к дальнейшей дифференцировке, движению, патологическим трансформациям, апоптозу.
Такое моделирование должно осуществляться не для «абстрактной» клетки, но для клетки с определенным генотипом, связанным с потенциальными предрасположенностями к различным патологическим состояниям, той или иной активностью метаболизма, различной устойчивостью к разным видам стресса и т.д.

Задачи, решаемые с использованием «рабочей модели»:
1. Оценка предрасположенности человека к различным заболеваниям по данным индивидуального генотипа.
2. Моделирование развития патологических процессов с учетом данных генотипов и экспрессионных и протеомных данных.
3. Поиск целевых узлов патологических сигнальных и метаболических путей для терапии патологических процессов и состояний.
4. Прогнозирование эффективности терапевтических воздействий на разные типы онкологических заболеваний с учетом генотипа индивидуальной опухоли, данных по делеционным и амплификационным характеристикам ее генома и, соответственно, наличию/отсутствию целевых проапоптических и промитотических сигнальных каскадов для соответствующей химиотерапии.
5. Реконструкция процессов дифференцировки клеток и поиск главных компонентов сигнальных каскадов, определяющих заданное направление дифференцировки.
6. Оценка взаимосвязей и возможных синергических взаимодействий различных локусов в составе общего сигнального каскада в заданной клеточной системе и при межклеточных взаимодействиях, приводящих к неаддитивным эффектам генетических взаимодействий данных локусов при формировании признаков (патологий).
7. Оценка возможных эффектов ксенобиотиков с известным или предполагаемым сродством к белкам-мишеням.
8. Поиск новых взаимосвязей параметров индивидуального генотипа (SNP’s) и особенностей формирования патологических сигнальных путей (по данным экспрессионной активности в пораженных клетках/тканях/органах).
9. При наличии в анализируемой выборке образцов от людей, связанных разной степенью родства и имеющих разную степень выраженности анализируемого признака (например, в случае заболевания – с отсутствием и разной степенью тяжести), можно с использованием методов QTL – картирования целевых генов, основанных на использовании IBD – алгоритмов (идентичности по происхождению), определять генетические основы признака (патологии) и выявлять новые сигнальные каскады, участвующие в формировании данного признака.

Перспективные планы.
При внесении в БД информации по геномам наиболее распространенных экспериментальных объектов (мышь, крыса, курица, данио-рерио, дрозофила, аскарида), а также данные по ортологам генов человека и вышеперечисленных видов, появятся дополнительные возможности: выявления наиболее консервативных сигнальных каскадов и наиболее надежных целевых узлов сигнальной сети; поиск новых сигнальных каскадов у человека, показанных для генов-ортологов у других видов; проверка адекватности для человека животных моделей заболеваний. Вместе с тем новая информация будет востребована огромным количеством лабораторий и институтов, занимающихся анализом фундаментальных биологических проблем исключительно на животных моделях.

Одной из перспективных задач является существенная формализация внутриклеточных процессов и процессов деления, дифференцировки и позиционирования клеток, для моделирования на более высоком уровне процессов, идущих на уровне органов и тканей. В ходе решения этих задач должны быть определены «правила поведения» клеток, входящих в состав данной ткани/органа, зависимость их состояния и влияния на окружающие клетки от таких факторов, как интенсивность питания и дыхания, процессов экспорта и поглощения биоактивных молекул, состояния мембранного потенциала, наличия сигнальных белков, рецепторов, адгезионных комплексов и других участников межклеточных контактов и контактов клетки с матриксом, интенсивности разнообразных внешних сигналов, приходящих к данной клетке.

Несмотря на обилие информации, значимые клеточные процессы, такие как деление, дифференцировка, перемещение, апоптоз, поддержание состояния стволовости, осуществляются под контролем согласованных действий ограниченного числа генов. Поэтому можно ожидать, что после детального анализа моделей поведения клеток в зависимости от разных наборов внешних и внутренних факторов, специфичных в норме для данного типа клеток, будет выявлено ограниченное количество «правил поведения», позволяющих с достаточной полнотой описывать процессы развития, регенерации и старения, наблюдаемые в большинстве тканей/органов.

Чтобы "волосяные шары" не мешали восприятию, малосвязанные гены (не играющие важной роли), можно будет отсеить (вниз убраны ранее связанные гены, чтобы облегчить восприятие):

На данный момент мы выложили в открытый доступ инструмент визуализации генных сетей по различным фильтрам, а также поиск и визуализатор кратчайших путей по различным критерием.

Летом 2013 года визуализатор строил генные сети такого вида -- пример. Вы и сами можете построить различные интересующие генные сети или, став своего рода навигатором, пройтись различными путями между указанными молекулярно-генетическими агентами, через указанные путевые точки.

Последнюю версию нашего инструмента по визуализации генных сетей и поска кратчайших путей между группами генов (MirOB) вы можете посмотреть он-лайн по этой ссылке. База данных постоянно пополняется. Мы постоянно эксперементируем и поступательно совершенствуем наш инструмент, тестируем различные новые технологии, алгоритмы и способы визуализации.

Осенью 2013 года мы заинтересовались анализом "сырых" данных полученных секвенаторами нового поколения (NGS). Т.е. мы решили подойти комплексно к анализу биологических данных. Часто бывает так, что в лаборатории есть дорогой секвинатор, получены данные, но что с ними дальше делать и как интерпретировать? Это направление многих ставит в тупик, -- до сих пор не так много специалистов, которые готовы проанализировать и интерпретировать полученные данны, и выдать готовый отчет, с понятной визуализацией данных. Возможно добавить к этому свои рекоммендации, в том числе по постановке и решению последующих важных задач, о которых вы можете даже не догадываться.

Как мы анализируем NGS:

  • Анализ сырых данных (CHiP-seq, RNA-seq)
  • Выравнивание данных (TopHat – для для RNA-seq)
  • GWAS
  • После выравнивания определяем транскрипционные уровни, нормализованные в соответствии с количеством ридов. (транскрипты, гены, изоформы) [например, с помощью Cufflinks]
  • Определяем гены имеющие различия в уровни экспрессии (например, с помощью Cuffdiff)
  • Получаем готовый транскриптом, и строим графики распределения и генные сети отображающие связи между полученными генами/белками/микроРНК/болезнями/лекарствами. В этом случае мы пользуемся R, Cytoscape JS, нашими собственными разработками на JS/D3, а также сторонними программами.
  • И многие другие способы анализа. Мы очень любопытные.

upd.(18.12.2013):
Creating cancer type-specific networks

Биоинформационный анализ результатов секвенирования
МикроРНК - новые биомаркеры онкологических заболеваний
Направления наших исследований.
Проект "Виртуальная печень".
Вопросы, на которые мы хотим узнать ответы.
По любым вопросам сотрудничества, обращайтесь здесь.

Add new comment

Filtered HTML

  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Lines and paragraphs break automatically.

Plain text

  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.
CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
1 + 5 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.