Рыжков В. А. (cts3402) wrote,
Рыжков В. А.
cts3402

Сравнение Y-STR датировок с датировками по снипам Yfull. Субклады от А до IJ

Вопрос длительности поколения, принимаемого в Y-STR расчет для моей методики (с абсолютной калибровкой скоростей мутации маркеров) первостепенный, поэтому едва ли не единственный (для меня) способ выбрать 25 лет или 31.5 года на поколение – это сравнить свои старые (2012 года) расчеты с данными датировок узлов древа по снипам Yfull. По всему Y-древу. Возрасты конечных ветвей современных потомков рассчитаны по моей методике раздельных панелей формата 67FTDNA, изложенной в [В.А.Рыжков. Расчёт ВБОП по раздельным панелям Y-STR маркеров, отсортированных по мере возрастания констант скоростей мутаций. RJGG (2011), т.3, №2, методика - на с.60-102.].

Для датировки предков субкладов была использована моя методика датирования по мутационным сдвигам базовых гаплотипов относительно базовых гаплотипов предков. В этом случае измеряются временные расстояния от современности до предка, для чего сначала рассчитываются возрасты конечных ветвей современных потомков (КВСП), а затем по мутационным сдвигам базовых гаплотипов в раздельных панелях формата 67FTDNA находят временнЫе расстояния от предков этих ветвей до предков их родительских субкладов и усредняют эти несколько индивидуальных расстояний (по разным субкладам), определяя среднее (наиболее вероятное) расстояние. Таким образом, датировка каждого субклада определяется по нескольким конечным ветвям (современных потомков) или промежуточным субкладам, к усреднению принимается от 2-х до 15-20-ти ответвлений датируемого субклада. Дисперсия результата указывает не суммарную погрешность, а схождение этих отдельных датировок к среднему. В некоторых случаях эта дисперсия близка к нулю, а в некоторых велика, что обусловлено числом гаплотипов в отдельных ветвях и глубиной снипирования.

В целом методика датирования подробно описана на примерах тут - http://aklyosov.home.comcast.net/~aklyosov/5_12_2012.pdf, с той лишь разницей, что при расчете временных сдвигов между базовыми гаплотипами субкладов в 2013-м я добавил расчеты по суммарным панелям, т.к. иначе статистика мутаций оказывается недостаточной. Например, если к расчету допускаются первые четыре панели формата 67FTDNA, т.е. с ограничением по возрасту не более 5 тысяч лет, то в исходной методике расчета я использовал лишь результаты отдельных панелей с 1-ой по 4-ю - 67F1, 67F2, 67F3 и 67F4, тогда как сейчас добавляются также следующие промежуточные и суммирующие панели: 67F1+2, 67F2+3 и 67F3+4, а также 67F1+2+3 и 67F1+2+3+4 (то же и для формата 111 маркеров). Окончательный результат определяется усреднением результата по всем принимаемым вариантам расчета, если только нет сильных выбросов по индивидуальным панелям из-за малой статистики. Нужно иметь ввиду, что результаты по суммирующим панелям типа 1+2+3+4+... могут (а строго говоря ДОЛЖНЫ) заметно занижать результат, поэтому и нужны параллельные расчеты по индивидуальным и промежуточным панелям. Если занижение по суммарным панелям очевидно, то его не следует принимать к окончательному расчету.

Сравнение буду проводить в классификации и структуре Y-древа, существовавшего летом 2012 года. К своим колонкам датирования субкладов добавляю колонку датировок Yfull. Выкладывать буду по мере заполнения результатов Yfull. Дело это сильно муторное, т.к. Yfull - он такой Yfull: пока в куче новых снипов найдешь снип, определявший субклад в 2012-м, всякое желание продолжать сравнение пропадает, но ватники не сдаются. Тупо сравниваем.

Понятно, что иногда будут встречаться (и встречаются) сильные расхождения в обе стороны. Эти выбросы понятны (плохая представленность отдельных гаплогрупп и субкладов в 2012-м) и на них зацикливаться не стоит, т.к. для выбора длительности поколения важнее сравнить сравниваемое, т.е. отличающееся в пределах не более, чем ±26 отн.%, что задаётся соотношением тестируемых длительностей поколения - 31.5 года/25лет = 1.26 (+26 отн.%). Если расчеты с длительностью поколения в 25 лет не приводят к устойчивому занижению примерно в 1.26 раза, т.е. на минус 26 отн.%, то такая длительность выглядит вполне обоснованной и вопрос об альтернативе в 31-32 года на поколение следует закрыть.

Сравним датировки для ветвей от A0 до IJ, включительно:






Жёлтым фоном выделены близкие датировки, различающиеся друг от друга в ту или иную сторону не более, чем 25-27 отн.% (т.е. около 26 отн.%, что задаётся соотношением 31.5 года / 25 лет). В итоге, имеем около 111 пар близких датировок. Найдем соотношение всех этих близких датировок и выразим в процентах, т.е.

R = 100%*Т(Ystr) / Т(Yfull)

Посмотрим на статистику во всем интервале близких датировок, т.е. от 150 до 0.55 тлн и в отдельных временнЫх интервалах:
150-0.55 тлн, n=111 (пар близких датировок), 99±11, 73-100-125 (минимум-медианное-максимум)
150-20.4 тлн, n=20, 97±9, 84-96-118
19.7-10 тлн, n=29, 97±13, 74-98-125
9.9-4 тлн, n=46, 101±11, 77-102-124
3.9-0.55kya, n=16, 95±11, 73-97-110

Видим, что во всех временных интервалах соотношение Y-STR и Yfull датировок близко к единице (100%), а стало быть занижения при употреблении 25 лет на поколение не наблюдается. Дисперсия в целом по всему интервалу вполне приемлемая (около ±11 отн.%), т.к. сравнима с погрешностью датирования обоими методами.

Можно сделать предварительный вывод о том, что длительность поколения 25 лет выглядит подходящей для расчетов датировок ветвей и субкладов по Y STR гаплотипам, в частности, моим методом, т.е. с абсолютной калибровкой скоростей мутации Y STR маркеров и группированием ранжированием в отдельные расчетные панели в соответствие со скоростями мутации. Осталось сравнить Y-STR и Yfull датировки для остальной части Y-древа, т.е. от К до R1a.

Продолжение следует
Tags: Y-STR датирование мужских ветвей, ДНК-генеалогия
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 0 comments