филогенетическое дерево животных майнкрафт
Создано первое интерактивное Древо Жизни: все живые существа на одной схеме
С тех пор как секвенирование ДНК стало относительно дешевым и быстрым, ученые получили огромное количество данных о генетическом родстве разных видов живых существ. Одну из самых больших баз данных по филогенетике (науке об эволюционных взаимоотношениях организмов) ведет Национальный центр биотехнологической информации США (NCBI). По состоянию на октябрь 2016 года в ней содержалась информация об 1,4 миллионах видов.
Недавно в журнале PNAS была опубликована работа, в которой ученые предложили в распоряжение коллег первую всеобъемлющую версию филогенетического древа жизни — Open Tree of Life (OTOL). Однако пользоваться этим древом могут только специалисты: работа с ним требует многих специальных знаний и навыков, а выглядит оно как компьютерная программа со сложным интерфейсом. Филогенетического древа с простой и понятной обычному пользователю интерактивной структурой до сих пор не существовало
Теперь такой ресурс есть. Дамьен де Вьен объединил современные способы визуализации информации (такие, как OpenStreetMap) и разработал Lifemap — платформу, на которой появилось Древо Жизни (Tree of Life), в котором на данный момент содержится информация о 802 639 (в версии для широкой аудитории) видах, существующих и вымерших.
Lifemap состоит из трех основных групп (доменов), выделение которых предположил в 1990 году основатель молекулярной филогенетики Карл Вёзе. Первый домен — археи, одноклеточные организмы, не имеющие ни ядра, ни других органелл: в Древе сейчас есть 3733 вида архей. Вторая — бактерии (277 426 видов), третья — эукариоты, то есть организмы, в клетках которых есть ядро (521480 видов на сегодняшний день в Lifemap general public). К таким относится множество живых существ от мухомора до человека.
На все узлы древа можно нажать, чтобы получить подробную информацию о таксоне или виде. В строку поиска можно вводить английское или латинское название вида или другого таксона. С помощью команды View full ancestry можно проследить эволюционную историю выбранного вида, а заполнив вторую поисковую строку, можно найти ближайшего общего предка любых двух видов, относящихся к одному домену. При этом система выдает полный кликабельный список всех предков обоих видов вплоть до ближайшего общего.
XKCD 2269. Филогенетическое дерево
А ещё меня забанили букмекеры, из-за того, что я доставал их доказательствами об эндосимбиозе НБА и АБА
Оригинал
Дубликаты не найдены
Комиксы
38.9K постов 36K подписчиков
Правила сообщества
1. Никаких глупых срачей. Переводчик может ошибиться. Скажите, где он ошибся и как надо перевести лучше. Не надо материть или угрожать человеку за ошибку. Это приведет к пермабану.
2. Порой вы можете увидеть ссылку на взятый комикс или ватермарку. Чаще всего это делают те люди, которые рисуют и переводят комиксы постоянно и хотят отметить свою работу. Не ругайтесь, пожалуйста. Напоминаем, что за ложный вызов модератора полагается наказание.
3. По возможности добавляйте ссылки на достоверный источник перевода и на оригинал комикса.
Без поддержек это не дерево, а так, почеркушки в векторе.
XKCD 2083.Экза-экзабайт
Чтобы представить 10^18, просто представь 10^13, а затем представь отзеркаленную 3 поверх обычной.
Свидание у биологов
А чем могут закончиться свидания химиков, физиков, математиков и т.д.?
Обнаружена биологическая основа эффекта плацебо
Американские ученые обнаружили область мозга, отвечающую за ответ на применение плацебо. В эксперименте активность этой области и ее нейрональные связи помогли надежно предсказать, у каких пациентов плацебо будет эффективным, а также величину этого эффекта. Результаты работы опубликованы в журнале PLOS Biology.
Плацебо-эффект — хорошо известный феномен, состоящий в том, что назначение препарата, не содержащего действующего вещества, оказывает ощутимое действие. Наиболее сильно он проявляется при хронических болях и неврологических расстройствах. Несмотря на то, что этот эффект используется врачами и учитывается при проведении контролируемых клинических испытаний, его биологическая природа изучена недостаточно.
Чтобы восполнить этот пробел в знаниях, сотрудники Северо-Западного университета в Чикаго провели серию экспериментов на добровольцах с хроническим болевым синдромом, вызванным остеоартритом. Перед началом терапии всем участникам проводили функциональную МРТ (фМРТ) головного мозга в состоянии покоя, что позволило определить базовый уровень активности различных участков мозга.
На первой стадии экспериментов 17 пациентам в качестве обезболивания назначили плацебо, причем добровольцы, в отличие от врачей, об этом не знали. У восьми из них лечение оказалось эффективным. Сопоставляя ответ на плацебо с результатами фМРТ, ученые пришли к выводу, что наиболее тесно он связан с активностью и плотностью нейрональных связей правой средней лобной извилины мозга.
39 участников второго эксперимента, на этот раз двойного слепого (при котором ни врач, ни пациент заранее не знают, что он принимает), после проведения фМРТ случайным образом разделили на две группы: одна в течение трех месяцев получала плацебо, другая — антидепрессант дулоксетин, эффективный при хронических болях. Определенная предварительно активность правой средней лобной извилины позволила правильно предсказать ответ на плацебо в 95 процентах случаев.
Моделируя величину плацебо-эффекта у добровольцев, получавших дулоксетин, ученые выяснили, что у некоторых из них (6 из 19) активный препарат усиливал предсказанный эффект плацебо, а у других (тоже 6 из 19) — ослаблял его. Также моделирование выявило область мозга, отвечавшую за ответ на дулоксетин после введения поправки на эффект плацебо, — ею оказалась правая парагиппокампальная извилина.
Полученные результаты подтверждают то, что плацебо-эффект имеет биологическую основу. Кроме того, они позволяют с помощью фМРТ предсказать силу этого эффекта у конкретного пациента и его роль в действии активных лекарственных веществ, что может повысить точность клинических испытаний, пишут исследователи.
Ранее ученым удалось подтвердить эффективность плацебо при паркинсонизме на нейронном уровне и показать, что плацебо-эффект может улучшить результаты тестов на уровень интеллекта. Также исследования показали, что при некоторых состояниях плацебо сохраняет эффективность, даже если пациент знает, что принимает «пустышку».
Как прочитать эволюцию по генам?
Кладограмма бактерий и архей, построенная на основании 24-х генов с использованием Байесова вывода
Автор
Редакторы
Статья на конкурс «био/мол/текст»: Проникновение в тайны эволюции — одно из самых захватывающих направлений в современной биологии. Однако тут есть небольшая проблема: пока не изобретена машина времени, чтобы можно было своими глазами увидеть, как развивалась жизнь на Земле. Впрочем, в наше время существуют методики, которые позволяют приподнять завесу тайны над эволюцией, и одна из основных среди них — построение филогении всего живого, то есть «древа жизни». Для этого можно использовать различные признаки, главный среди которых — это последовательность ДНК, в которой закодировано все разнообразие современных и ископаемых существ. В этой статье рассказывается о методиках построения таких филогений, частично заменяющих ученым машину времени.
Конкурс «био/мол/текст»-2013
Эта статья представлена на конкурс научно-популярных работ «био/мол/текст»-2013 в номинации «Лучший обзор».
Спонсор конкурса — дальновидная компания Thermo Fisher Scientific. Спонсор приза зрительских симпатий — фирма Helicon.
Что такое филогения и филогенетический анализ?
Филогения всех живых существ, или древо жизни, является нашим представлением о степени родства организмов и о том, как шла эволюция живых существ. Кто является ближайшим родственником человека, и каким был наш общий предок? Вымерли ли динозавры, или их потомки до сих пор живут рядом с нами? Произошли ли теплокровность и способность к полету среди позвоночных единожды? Откуда вообще взялись позвоночные? На все эти вопросы уже есть ответы, и получены они были главным образом с помощью филогенетического анализа.
Филогения фактически является той основой, на которую «навешиваются» знания об организмах. Именно она наделяет биологию важным качеством — предсказательностью. Зная те или иные свойства организмов одного вида, с помощью филогении мы можем судить о свойствах родственных ему существ, и даже проследить эволюцию признаков. Древо жизни используется не только в теоретической биологии, но также и в прикладных науках. Например, в медицине и фармакологии филогении используются для того, чтобы понять, откуда были завезены тe или иные вирусы или бактерии, и какие лекарства на них действуют лучше всего [19].
Построение древа жизни является задачей вовсе не тривиальной, и это направление науки, как ни странно, можно считать относительно новым. Разные исследователи пытались проанализировать родственные отношения организмов с самых ранних времен, однако настоящая филогенетическая «революция» случилась только в 50—60-х годах XX века. До 80-х годов деревья строились главным образом на основании морфологических данных, но привлечение ДНК было лишь вопросом времени, поскольку именно в этой молекуле закодированы все признаки организма.
Немного о ДНК
Чтобы понять, как анализируют ДНК, надо вспомнить, как она устроена. ДНК, или дезоксирибонуклиновая кислота, — это очень длинная молекула, которая находится в ядре клетки. ДНК, как правило, состоит из двух закрученных спиралей, а каждая спираль состоит из множества нукеотидов. Нуклеотиды по большей части отличаются друг от друга азотистыми основаниями, которых в ДНК всего четыре: аденин, тимин, гуанин и цитозин. Именно нуклеотиды создают слабые химические связи, которыми соединяются спирали ДНК. Аденин одной спирали связывается с тимином другой спирали, а гуанин связывается с цитозином (рис. 1). Мутация происходит, когда одно основание заменяется на любое другое. Чаще всего замены происходят в парах аденин—гуанин и тимин—цитозин.
Рисунок 1. ДНК. A — аденин, C — цитозин, G — гуанин, T — тимин.
В ДНК есть последовательности нуклеотидов, которые кодируют белки, и есть участки, которые ничего не кодируют. Кодирующие последовательности — это гены. Они могут быть разной длины, но чаще всего имеют определенную структуру, по которой можно сказать — ген это или нет. Именно гены обычно используют для филогенетического анализа.
Основные принципы построения филогений
Наверное, самое главное правило, которым руководствуются для построения филогений в наше время — это принцип дихотомии: считается, что из трех таксонов, два должны быть более родственны друг другу, чем третий. Поэтому филогении обычно выглядят как дихотомически разветвленные деревья. Если порядок ветвления установлен для всего дерева, то говорят, что оно полностью разрешенное. Иногда в филогениях бывают «кусты» или политомии — это те места, где порядок ветвления неясен, тогда говорят, что дерево не полностью разрешенное. Этот принцип несовершенен, потому что эволюция таксонов далеко не всегда происходит дихотомически. Когда становится понятно, что дихотомия не отражает реальный случай, исследователи привлекают другие схемы — например, филогенетические сети [8].
Методы построения филогений еще в 60-х годах XX века разделились на две основные ветви — фенетические и кладистические. В то время анализ родственных связей основывался на морфологических признаках [12]; с привлечением к построению филогений молекулярных признаков основные принципы анализа родственных связей остались фактически теми же.
Чтобы было более понятно, представьте три вида животных: домашнюю мышь, сумчатую мышь и кенгуру. Домашняя мышь и сумчатая мышь очень похожи друг на друга внешне, но у сумчатой мыши и кенгуру есть общая апоморфия — сумка, — что говорит о том, что эти два вида родственные. Но, естественно, филогенетический анализ основывается на гораздо большем количестве признаков, и группы могут иметь несколько апоморфий.
Рисунок 2. Полностью разрешенная кладограмма. Каждое ветвление — это клада. Обозначенные признаки являются апоморфиями.
Первые шаги. ДНК—ДНК гибридизация
Первые попытки использовать ДНК в качестве основы для построения древа жизни были фенетическими. В 1984 году американские ученые Сибли и Алкист [13] впервые попытались использовать ДНК для прояснения филогении различных видов приматов. Они применили технологию, которая называется «ДНК—ДНК гибридизация». Метод основывается на том, что при копировании в ДНК постоянно происходят мутации. Это приводит к тому, что даже у двух близких родственников последовательности ДНК будут отличаться, не говоря уже о видах. Иными словами, чем дальше находятся организмы на филогенетическом древе, тем больше у них различается ДНК. В данном методе одиночные молекулы ДНК двух видов смешиваются, чтобы они могли образовать «гибридные» двойные спирали, в которых одна половина принадлежит одному виду, а вторая — другому. Затем такие «гибриды» нагреваются, и исследователь смотрит, при какой температуре двойная спираль распадается (или диссоциирует) на две части. Считается, что чем выше температура, требующаяся для распада «гибрида», тем прочнее связь молекул ДНК двух разных видов, и, соответственно, тем ближе эти виды друг к другу (рис. 3).
Рисунок 3. ДНК—ДНК гибридизация. а — Нагревание ДНК двух видов, в результате которого двойная спираль распадается на две части. б — Охлаждение ДНК, в результате которого молекулы ДНК разных видов гибридизуются друг с другом. в — Нагревание ДНК, в результате которого гибридные молекулы ДНК распадаются.
ThinkQuest, рисунок с изменениями
Метод матрицы расстояний (distance matrix)
Метод матрицы расстояний, по сути, является фенетическим. Его основа — расчет попарных различий между соответствующими генами всех видов, участвующих в таком анализе. Делается это следующим образом: гены каждого анализируемого вида сравниваются по каждой позиции нуклеотидов, и чем больше найдено отличий, тем больше будет «расстояние» между видами. Затем строится матрица, в которую заносится это значение для каждой возможной пары сравниваемых генов. Далее матрица расстояний является входной информацией для алгоритмов построения деревьев.
Самый популярный среди подобных алгоритмов — это метод ближайших соседей (neighbour joining). Среди анализируемых видов находят два с минимальными различиями в последовательности (т.е., максимально похожие). Исходя из составленной матрицы, данные об этих видах «объединяются», и далее они участвуют в анализе в объединенном состоянии. Виды один за другим проходят эту процедуру до тех пор, пока не будет найдено одно, полностью разрешенное дерево. Этот алгоритм хорош тем, что он относительно прост и подходит для обработки больших наборов данных (рис. 4) [3].
Рисунок 4. Метод ближайшего соседа
Разные авторы, однако, перечисляют некоторые минусы метода ближайших соседей. Например, есть мнение, что этот метод хуже работает с таксонами, которые филогенетически далеки друг от друга [4], [17]. Также недостатком можно считать и то, что метод всегда выдает дерево с одним-единственным возможным вариантом ветвления [3]. Это происходит потому, что алгоритм подразумевает построение одной филогении без сравнения с другими, тогда как в кладистических методах оцениваются деревья с различным порядком ветвления. Несмотря на то, что в серьезных филогенетических анализах методы матрицы расстояний сейчас почти не используются, они применяются, например, для быстрого построения филогений близкородственных бактерий и вирусов [18].
Метод наибольшей экономии (maximum parsimony)
Этот подход получил большую популярность при анализе морфологических данных, а также какое-то время применялся и для молекулярных исследований. Первый этап анализа — это создание матрицы признаков. Каждый признак должен иметь хотя бы два состояния. Состояний может быть больше, в морфологии они могут описывать разные формы и структуры. Если на кладограмме у какого-то таксона или группы таксонов состояние отличается от предкового, то это называется «переходом из одного состояния в другое». Суть этого алгоритма в том, чтобы найти такое дерево, где присутствует наименьшее суммарное число переходов из одного состояния в другое для всех признаков. В этом случае кладограмма и отображаемая на ней эволюция будут считаться наиболее экономными, а, значит, и более вероятными [3], [12], [16], [17].
Тут возникает вопрос: почему мы вообще считаем, что эволюция должна быть экономной? Дело в том, что это соответствует главному методологическому принципу науки, который заключается в том, что из нескольких равновероятных объяснений надо выбирать наиболее простое, с привлечением как можно меньшего количества сущностей. Этот метод еще называется «Бритвой Оккама». В одной из книг по филогении [3] есть шутливый пример. Представьте, что в одном и том же городе где-то в Северной Америке в соответствующую службу поступает два звонка о том, что по улицам гуляет тигр. Понято, что легче всего предположить, что это один и тот же тигр, который сбежал из зоопарка. Гипотеза, что в городе, где тигров в природе никогда не было, откуда-то появилось сразу же два таких хищника, гораздо менее вероятна.
Эволюция признака — тоже событие нечастое, и когда мы видим два похожих по строению органа, то мы предполагаем, что орган произошел один раз [3]. Это не означает, что признак действительно произошел только один раз, просто это наиболее вероятно. Кладограмма строится на основании многих признаков, и чем больше апоморфий характеризует ту или иную ветвь, тем больше доверия она вызывает.
Плюс метода наибольшей экономии в том, что он интуитивно понятен и довольно прост, но в молекулярных анализах он очень быстро потерял популярность. Один из его недостатков в том, что он не учитывает длину ветвей, которая отображает количество замен нуклеотидов во время эволюции той или иной клады [3]. Некоторые ветви на дереве будут длиннее, потому что скорость эволюции там была выше. При использовании метода наибольшей экономии длинные ветви будут «притягиваться» друг к другу. Этот феномен возникает потому, что чем больше замен нуклеотидов в двух ветвях, тем выше шанс на то, что некоторые из них случайно совпадут, и будут расцениваться как общие апоморфии, даже если это абсолютно не соответствует реальному положению дел.
Другой минус в том, что метод не учитывает разные модели замены нуклеотидов [17]. Например, в методе наибольшей экономии аденин имеет одинаковую вероятность уступить место как тимину, так и цитозину, хотя, как уже отмечалось выше, в организме аденин скорее заменится на цитозин, чем на тимин.
Методы, основанные на моделях эволюции
Наиболее часто используемые методы построения филогений на основе молекулярных данных основываются на моделях эволюции. Один из первых стал метод максимального правдоподобия (maximum likelihood). Для расчета кладограммы, помимо последовательности ДНК, надо выбрать модель замены нуклеотидов, на основании которой будут рассчитываться вероятности. Также в расчет берется длина ветви или эволюционная дистанция между двумя таксонами. Во время анализа рассчитывается, какая длина ветви наиболее вероятна с точки зрения выбранной модели, вероятности всех ветвей кладограммы умножаются, и кладограмма, имеющая наибольшую вероятность, считается правильной [3], [16], [17].
Последний и, наверное, самый популярный в наше время метод — это Байесовский вывод (Bayesian inference). Он, в общем, похож на метод максимального правдоподобия, поскольку также основывается на модели и длине ветвей. Но отличие Байесовского вывода в том, что тут берется в расчет еще один фактор — апостериорная вероятность (posterior probablity), которая рассчитывается на основании как исходных данных, так и полученных результатов анализа [3], [16], [17]. Это не очень понятно интуитивно, но суть в том, что в ходе анализа исследователь получает новые данные, которые тоже можно применить.
Приведу очень простой пример. Пусть у нас есть мешок с сотней шариков, половина их которых красные и половина — белые. Изначально вероятность вытащить шарик как белого, так и красного цвета равна 50%. Но, допустим, мы вытащили 20 красных и 40 белых шариков, и в мешке остались 30 красных и 10 белых шариков. Это означает, что к текущему моменту шанс вытащить красный шарик равен 75%, а белый — 25%, что кардинальным образом отличается от исходного состояния. В Байесовском выводе используются похожая логика, хотя, конечно же, расчеты там гораздо сложнее.
Несмотря на все видимые плюсы двух последних методов, тут тоже можно найти некоторые сложности. Главная их слабость в том, что каждый исследователь вынужден подбирать модели самостоятельно, и совсем не обязательно, что он сделает выбор правильно. Но у этой проблемы есть решение. Во-первых, есть программы, которые могут помочь подобрать модель; во-вторых, уже есть алгоритмы на основе Байесовского метода, которые могут «прыгать» с модели на модель, тем самым тестируя их. Еще одна проблема, скорее всего, решаемая с развитием техники, заключается в том, что обсчеты филогений с использованием последних двух методов довольно сложные и требуют много времени и хороших компьютеров.
Все же насколько достоверны филогении?
Думаю, что внимательный читатель заметил, что многие перечисленные методы основаны на вероятностях, и у него может возникнуть закономерный вопрос: как можно доверять филогении, если всегда есть шанс, что построенное дерево ошибочно и не соответствует действительному ходу эволюции? Действительно, методы несовершенны, но на этот вопрос ответ есть.
Во-первых, в филогенетических методах есть понятие «поддержка: чем больше уникальных признаков поддерживают дерево или какую-то его ветвь, тем больше доверия они вызывают [12]. Само дерево может иметь низкую поддержку, зато свидетельств в пользу отдельных его ветвей может быть так много, что корректность не вызовет сомнений. Для подтверждения результата исследователи могут использовать совокупности признаков: последовательности ДНК, РНК и белков, морфологические данные, особенности поведения организмов и многое другое [11]. Когда независимые признаки подтверждают друг друга, уверенность в результате гораздо выше.
Второй ответ на поставленный вопрос еще более обнадеживающий. Его дают эксперименты, проведенные на разных организмах, для которых известна генеалогия, то есть настоящая эволюционная история [1], [5], [7], [10]. Можно привести в пример опыт с мышами, когда филогенетический анализ провели на основе ДНК 24-х линий этих животных. Оказалось, что наблюдаемая последовательность поколений и полученная филогения почти полностью соответствуют друг другу [1]. Это значит, что используемые методы как минимум способны правильно отображать эволюцию.
Плюсы и минусы молекулярных методов построения филогений
В частности, анализ консервативных последовательностей рибосомальных РНК микроорганизмов позволил установить, что все живое на Земле делится не на два царства, как считали несколько десятилетий назад, — эукариот и бактерий, — а на три: эукариот, бактерий и архей. Морфологическое сходство бактерий и архей с лихвой окупается огромной разницей их молекулярного устройства. Честь этого открытия принадлежит Карлу Вёзе. См. также статьи: «Карл Вёзе (1928—2012)», «Эволюция между молотом и наковальней, или как микробиология спасла эволюцию от поглощения молекулярной биологией». — Ред.
Несмотря на то, что преимущество молекулярного анализа кажется вполне обоснованным, есть все же и несколько причин, по которым морфологию нельзя отправить «в отставку».
Первая причина заключается в том, что не каждый организм подходит для выделения ДНК. Он должен быть собран и сохранен специальным образом, иначе эта молекула просто разрушается. Множество редких и интересных видов было описано много десятков лет назад, когда еще даже про ДНК ничего не знали, и в наши дни не очень понятно, где их искать и как собирать. В первую очередь это касается мелких членистоногих, — особенно насекомых, которых чаще всего хранят сухими. То же самое можно сказать и о палеонтологических находках вымерших видов. Для оценки родства таких групп можно использовать только морфологические методы.
Вторая причина заключается в том, что далеко не всегда результаты молекулярных филогенетических методов вызывают доверие. Иногда бывает так, что они не совпадают с устоявшимися «классическими» взглядами. Это, конечно, не означает, что именно молекулярные данные неверны, просто такие несовпадения являются «звоночком», что где-то закралась ошибка. Несовпадения могут быть не только из-за ошибок в самом анализе, но и из-за того, что были неправильно выбраны гены. Гены, мутирующие с высокой скоростью, подходят для выяснения родства между видами, но не походят для анализа групп более высоких рангов. Но гомологичные гены в разных группах организмов могут меняться с разной скоростью, поэтому гены, подходящие для анализа одной группы, могут не подходить для другой группы того же ранга. В общем, подбор нужных участков ДНК может оказаться не очень легкой работой, особенно если учесть, что далеко не все гены у всех видов хорошо изучены.
Третья причина — это высокая стоимость секвенирования генов. Для построения филогении одного небольшого рода можно легко потратить пару тысяч долларов. А если учесть, что гены не всегда подбирают правильно с первого раза, или некоторые экземпляры оказываются непригодными для секвенирования, то анализ надо проводить повторно, и цена может быть больше, чем предполагалось изначально. Анализ же на основе морфологических признаков обходится гораздо дешевле.
Анализ ДНК, безусловно, стал довольно популярным и быстроразвивающимся подходом построения филогений в наши дни. Сейчас специалисты уже используют не просто отдельные гены: в последние годы появились филогенетические исследования на основе более десятка генов или целых митохондриальных геномов [14]. Запущены проекты секвенирования целых геномов разных видов [9], а также проекты для объединения всего живого мира в единое «древо жизни» (рис. 5) [2]. В качестве частного примера можно привести исследование, в результате которого была уточнена «родословная» членистоногих [25]. Наверное, наука сейчас переживает один из самых интересных периодов в развитии анализа ДНК, когда уже видно, что это направление масштабно и многообещающе, и что есть еще очень многое, что нам предстоит узнать о геномах разных организмов. Однако насколько молекулярные методы в филогениях можно развивать, и где граница их применения — покажет будущее.
Рисунок 5. Филогения всех живых существ, или «древо жизни»