Рыжков В. А. (cts3402) wrote,
Рыжков В. А.
cts3402

Category:

Из неопубликованного-1. Погрешность расчетов ВБОПов по коротким форматам Y-STR гаплотипов

Начну постить некоторые неопубликованные работы 2012 года, которые до сих пор выглядят актуальными. В Вестник ДНК-генеалогии не прошли.

Мутации (ошибки в копировании) в числе повторов аллелей происходят стохастически, т.е. распределены случайно во всем массиве Y-STR маркеров, которых известно около 400-500. Чем длиннее используемый для датирования формат гаплотипа, тем больше вероятность увидеть совершившиеся ошибки в копировании числа повторов аллелей. Ясно, что для очень коротких форматов гаплотипов велика вероятность вообще не увидеть никаких ошибок копирования или увидеть непропорционально малую или непропорционально большую часть всех ошибок (мутаций).

Если бы все маркеры характеризовались одинаковыми константами скоростей мутации (КСМ), то надежность Y-STR датирования была бы строго пропорциональна длине формата. Например, если бы было точно известно, что число Y-STR маркеров равно 500, то датирование по 67-ми маркерному формату с одинаковыми КСМ у всех маркеров означало бы 13,4% достоверность, а датирование по научному (и стандартному по NIST!) формату 17Υ-filer – 3,4%, т.е. в 4 раза меньше.

Понятно, что стремление к наибольшему охвату ИЗВЕСТНЫХ Y-STR маркеров происходит не только и-за стремления повысить разрешение при установлении ближайших родственников, но и из-за стремления повысить достоверность их установления (при отсутствии глубокого снипирования), поскольку введение новой панели маркеров может обнаружить большие различия между теми, кто на более коротком формате выглядел близким родственником или членом какой-либо династии.

Имея огромный багаж ВБОПов, рассчитанных по коротким, «научным», форматам, хотелось бы получить более точный ответ на вопрос «насколько (не)точны и (не)надежны датировки по коротким форматам».

Для ответа на этот вопрос, ряд хорошо отобранных (глубоко снипированных) ветвей в формате 67FTDNA был также просчитан автором в редуцированных форматах 12FTDNA, 17Y-filer и 37FTDNA согласно методике автора по раздельным панелям для всех этих форматов – табл.1.



В табл.1 сравниваемый возраст ветвей (67ft среднее) рассчитан как среднее ВБОПов по формату 67FTDNA, рассчитанных линейным методом с поправкой Адамова-Клёсова [8] и методом ASD. При этом, формат 67FTDNA разбит на 7 панелей, в пределах которых КСМ не отличаются более, чем примерно в 2 раза. Возрасты по более коротким форматам рассчитаны лишь линейным методом с поправкой Адамова-Клёсова, но также по раздельным панелям, КСМ в которых не отличаются более, чем в 2 раза. Значения Δi (от.%) характеризуют отклонение датировок по коротким форматам от средней датировки по формату 67FTDNA.

Рис.1 демонстрирует зависимости датировок по коротким форматам от средней датировки по формату 67FTDNA:




Из табл.1 и рис.1 видно, что научный формат 17Yfiler в среднем для этой серии ветвей воспроизвёл датировки без систематического занижения или завышения относительно средней датировки по формату 67FTDNA, но случайное отклонение для этих 17 ветвей в среднем составило около ±19 отн.%, с минимальным отклонением +1 отн.% и максимальным +38 отн.%, что в последнем случае транслировало возраст около 7025 лет в 9675 лет и отнесло бы неолитическую ветвь G2a3a-Armen11 (7025 лет) на мезолит. Формат 12FTDNA (входящий в 17Yfiler), будучи немного короче, в среднем занизил датировки этой серии на -4 отн.%, а средний случайный разброс датировок составил ±27 отн.% с максимальным отклонением в +65 отн.% для армянской ветви J1c3d-Armen13 (4100 лет), которая таким образом была бы удревнена до 6775 лет, т.е. из пост-аккадских времен эти потомки семитов были бы перенесены во времена Убэйда Шумера.

Таким образом, расчет возрастов ветвей по коротким, «научным», форматам (12FTDNA, 17Yfiler и короче) – это своеобразная игра в рулетку: может повезти с попаданием «в яблочко», а может и нет, хотя в среднем формат 17Y-filer, маркеры которого хорошо охарактеризованы по КСМ и используются для абсолютной калибровки КСМ остальных маркеров в методике автора [В.А.Рыжков. Расчёт ВБОП по раздельным панелям Y STR маркеров, отсортированных по мере возрастания констант скоростей мутаций. The Russian Journal of Genetic Genealogy (Русская версия): 2011, т.3, №2, с.66-100], абсолютно совпадает (среднее отклонение равно нулю) с усредненной датировкой по формату 67FTDNA. В этом смысле расширение до 37FTDNA – это уже приближение к «идеальному» датированию по формату 67FTDNA: более кучно (среднее SD=±12 отн.%), а занижение датировок этой серии в среднем оказалось всего около -2 отн.%.

Продолжение следует
Tags: Y-STR датирование мужских ветвей, ДНК-генеалогия
Subscribe

  • The Sun Also Rises

    Хэмингуэй один из моих любимых писателей с подросткового возраста, а «Фиеста» в разных вариантах перевода - самый любимый его роман. Лишь в…

  • Рыбалка в Техасе

    - это был самый гиподинамический для меня вариант рыбалки пока что, потому что подъезжаешь прямо до лодки у частного озерца (друзей) садишься,…

  • С Праздником!

    Мира. ЗЫ Мы сделали это.

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 0 comments