Genetic problems of DNA portraiting as part of DNA phenotyping. Review



Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription or Fee Access

Abstract

Forensic DNA databases are a huge help in the investigation of crimes, making it possible to identify the person who left them using biological traces, provided that information about him in the form of an STR profile is already available. The same is true for unidentified corpses. When such information is not in the database, DNA phenotyping can come to the rescue, allowing you to restore the appearance of a person from his DNA, which is already used in forensic practice. The greatest progress has been made in establishing hair color, eye color, skin pigmentation and some other characteristics. But the main interest is the person’s face, and the situation with this is not yet the best, although there has been some progress. The main problem is that multiple genes are responsible for facial features, including a pleitropic effect. The advent of such a method as GWAS (Genome-Wide Association Study) made it possible to analyze many gene loci at once for the presence of single-nucleotide substitutions associated with certain genes involved in the formation of the human face. However, sequencing the two genomes (or exomes) of each person inherited from the father and mother with a phased haplotyped assembly of their sequences can become much more informative. And with this approach, it is necessary to correctly select objects in the form of a large number of doubles and their closest relatives, since, without being relatives, doubles can potentially carry the same nucleotide substitutions, which largely determine their external similarity. Another cohort should be families in which children are very similar to their parents, and in this case it is necessary to conduct triosequencing with phased assembly of their diploid genomes (exomes). The genetic information obtained in this way, processed using machine learning and artificial intelligence, can make it possible to “find” the desired genes, increasing the reliability of such DNA portraits.

Full Text

Введение

                Осенью 2024 г. исполняется 40 лет с начала использования полиморфизма ДНК для идентификации личности, включая определение родства, пионером чего явился А. Джеффрис. За это время ДНК-криминалистика проделала большой путь, несколько раз сменив используемые маркерные признаки, и сформировав соответствующие базы данных, заметно улучшающие раскрываемость преступлений. Все это довольно подробно рассмотрено нами ранее в книге «ДНК-криминалистика» [1].

Нет сомнений, что рано или поздно будут созданы всеобъемлющие криминалистические базы данных, несущие информацию об уникальной для каждого человека некоторой части его ДНК, благодаря чему устанавливать, изобличать и задерживать преступников станет гораздо легче. Но пока таковых баз нет при поиске преступников, когда их ДНК-профили в виде определенных STR-локусов в существующих базах данных отсутствуют, приходится прибегать к семейному, либо генеалогическому анализам, а также к такому подходу как ДНК-фенотипирование.

Наиболее важным для поиска подозреваемых является лицо человека и этому направлению ДНК-фенотипирования в виде восстановлении облика (лица) человека по его ДНК в последнее десятилетие уделяется значительное внимание. Также для ведения следственных действий важно предсказание по ДНК таких черт человека, как цвет радужной оболочки глаз, цвет волос и их структуры, пигментация кожи, именно с которых в начале нынешнего столетия и началось ДНК-фенотипирование. Но поскольку все они с помощью специальных коммерческих наборов определяются уже довольно уверенно, и к тому же относительно недавно вышли детальные обзоры на эту тему [2, 3], то этих черт человека здесь касаться не будем. Также останутся без рассмотрения связанные с ДНК веснушки, облысение, поседение, установление возраста человека и его роста. Последние два показателя являются весьма важными для криминалистики. Причем возраст индивида на основе степени метилирования отдельных цитозиновых остатков в настоящее время устанавливается с уже довольно высокой точностью, хотя в значительной степени определяется условиями окружающей среды и образом жизни человека. Что касается роста человека, то, помимо оказывающих на него влияние особенностей ДНК, рост зависит и от массы других причин. При этом недавно сделана попытка найти ассоциации роста человека с метилированием ДНК [4].

С помощью фоторобота по показаниям свидетелей уже давно составляются композиционные портреты преступников в расчете на то, что в них можно опознать конкретного человека. Однако при современном повсеместном размещении видеокамер часто достаточно просто просмотреть соответствующую видеозапись. Но нередки случаи, когда преступления совершаются вдали от установленных видеокамер, никаких свидетелей нет, явных мотивов совершения преступных действий именно в отношении конкретной жертвы тоже, и тогда у правоохранителей какие-либо «зацепки» полностью отсутствуют. Однако случается и так, что на месте преступлений либо на одежде или теле пострадавшего могут оставаться различные биологические следы, содержащие ДНК преступника. Тогда, помимо упоминаемых выше цвета волос, радужки глаз, кожи, крайне важно по особенностям ДНК восстановить лицо человека, чьи биологические следы были найдены. Такой подход способен также помочь идентифицировать останки, в том числе скелетированные. Примеры подобных обнаружений преступников или их жертв уже есть и в частности в США фирма Parabon Nanolabs (https://parabon-nanolabs.com/), в том числе на этом строит свой бизнес. Ими создан основанный на машинном обучении подход Snapshot, принцип работы которого не раскрывается, но сообщается, что анализируются миллиарды комбинаций полиморфизмов ДНК. Несмотря на отчасти справедливую критику в их адрес специалистов в ДНК-фенотипировании [5, 6], с мая 2018 г. по май 2024 г. эта фирма таким образом смогла идентифицировать 315 персон и тем самым помогла раскрыть немало преступлений, в том числе с большим сроком давности.

В США и в ряде других стран ведутся интенсивные исследования, направленные на поиск генов, отвечающих за внешний облик человека в виде его лица, и при этом достигнуты определенные успехи. Хотя даже правильно установленные гены, ответственные за те или иные фенотипические признаки, могут не дать желаемого результата в силу ряда причин, среди которых образ жизни человека, влияющий на его внешность, условия среды обитания, старческий возраст, пластические операции. Тем не менее, во многих случаях для расследования преступлений и установления жертв может оказаться полезным предсказание лица человека по его ДНК, которое, бесспорно, нужно улучшать, чему и посвящена данная статья.

Но прежде следует коснуться используемых терминов и вопросов геномной организации ДНК конкретных людей.

 

Используемые термины при установлении внешнего облика человека на основе его ДНК

В одном из ранних обзоров [7], посвященных начинающемуся использованию особенностей ДНК людей для предсказания их внешне видимых черт, было уделено внимание пигментации кожи, росту человека и его лицу, однако общего обозначения для них предложено тогда не было. Что касается отдельного раздела той статьи, озаглавленного ‘Facial morphology’, то в нем отмечалось, что в то время в литературе не удалось обнаружить работ, где бы описывалась связь морфологических признаков лица человека с особенностями ДНК кроме веснушек.

В 2008 г. вышла книга ‘Molecular Photofitting: Predicting Ancestry and Phenotype Using DNA’ [8], в которой предсказание черт внешности человека по особенностям ДНК получило название ‘Molecular Photofitting’. Но особого распространения это обозначение не получило, если не считать нескольких довольно старых статей одной группы авторов и еще одной относительно недавней [9].

В 2011 г. в статье [10], описывающей разработанный набор для выявления цвета глаз ‘IrisPlex’, упоминаются сразу три термина и отмечается, что начинается новая эра ‘DNA intelligence’ (в том же предложении говорится, что ее называют еще как ‘forensic DNA phenotyping’) в виде обнаружения внешне видимых черт человека – ‘Externally Visible Characteristics’ (EVC). В следующей статье этих авторов [11], в которой они исследовали цвет глаз у населения Европы, ими впервые была употреблена аббревиатура FDP (Forensic DNA Phenotyping), ставшая носить с тех пор массовый характер, но и сокращение EVC по-прежнему довольно широко используется. При этом под EVC обычно понимаются такие черты как цвет глаз, кожи, волос, их структура и некоторые другие черты, не затрагивая морфологии лица человека. Что касается FDP, то кроме тех же самых черт, что подразумеваются для EVC, этот термин распространяется и на лицо человека.

Успешно применяющая на практике для задержания преступников и идентификации тел погибших через реконструкцию облика человека по полиморфизму ДНК уже упоминавшаяся фирма Parabon Nanolabs использует для этого термины ‘composite profile’ и ‘Snapshot’ (https://snapshot.parabon-nanolabs.com/#phenotyping). При этом нужно отметить, что впервые термин ‘snap-shot’ в связи с анализом (генотипированием) ДНК встречается в публикации 1992 г. [12], где он был использован для генетической характеристики культуры клеток человека, выявленной путем ДНК-фингерпринтирования с помощью мультилокусной ДНК-пробы Джеффриса, использовавшейся тогда в криминалистической практике. В 2003 г. задолго до начала широкого применения ДНК-фенотипирования и возникновения соответствующего подразделения фирмы Parabon Nanolabs был предложен термин ‘SNaPshot’ при исследовании полиморфизма Y-хромосом, в виде Single-Nucleotide Polymorphism или сокращенно SNP [13].

Для реконструкции лица человека по особенностям ДНК использовалось и такое обозначение – ‘composite facial sketch’ [6]. Другие авторы назвали такую реконструкцию лица как ‘face photo-sketch’ [14]. Можно встретить и такие обозначения: ‘portrait in DNA’, ‘police-style sketch’ [15], ‘forensic sketch’ [16]. В одной из публикаций [17] для композитного портрета на основе ДНК предложено использовать «геномный портрет», либо «ДНК-портрет», поскольку непосредственно к фотографии подобная реконструкция лица человека отношения не имеет.

Возможно, стоит для обозначения лица как самой важной части внешности человека по аналогии с ДНК-фенотипированием для ДНК-криминалистики использовать «ДНК-портретирование», тем более что слово ‘portraiting’ известно с середины XVI века (https://www.oed.com/dictionary/portraiting_n?tl=true). Однако в этом случае потребуется уточнение для аббревиатуры FDP в виде введения дополнительной буквы – FDPh. Но возможно на это стоит пойти, учитывая важность для ДНК-криминалистики как всего ДНК-фенотипирования, так и особенно ДНК-портретирования, которое пока еще недостаточно достоверно, но есть надежда на его совершенствование.

 

Ядерные геномы человека

                Термину «геном» уже больше 100 лет и когда Г.Винклер в 1920 г. предложил обозначать им гаплоидный набор хромосом, то о том, что материалом наследственности служит ДНК еще не догадывались. Однако связь термина «геном» с гаплоидным набором хромосом сохранялась и когда появилась возможность секвенировать полные геномы эукариотических организмов стала вестись сборка последовательностей ДНК из гаплоидного (или с учетом разных уровней плоидности - половинного) набора хромосом, считая, что парные хромосомы у любых видов организмов довольно одинаковы. Практически такой же фразой - «думалось, что в диплоидном геноме гомологичные хромосомы содержат эквивалентную генетическую информацию», начинается статья [18], в которой для фазированного генома жемчужной устрицы описана его сборка, демонстрирующая высокую гетерозиготность парных хромосом.

Сейчас под термином «геном» (если кратко и для высших организмов) понимается вся совокупность ДНК в гаплоидном наборе хромосом, но фенотип и в целом жизненный статус определяется диплоидным  набором хромосом, точнее полным набором хромосом с учетом существования полиплоидных организмов. При этом технологии секвенирования таковы, что происходит экспериментальное определение нуклеотидных последовательностей всей ДНК из полного (диплоидного) набора хромосом, а ведется (обычно) сборка половинного (гаплоидного) набора хромосом. В качестве подтверждения этих слов можно привести самое первое предложение в одной из статей [19], в котором говорится, что для большинства секвенированных геномов не принимается в расчет их диплоидный статус.

Применительно к человеку выходит, что секвенируются два его ядерных генома, достающиеся ему от матери и от отца по 3 млрд. п.н. каждый, а собирается по сути один квазигеном размером также 3 млрд.п.н., в котором в абсолютно случайном порядке перемежаются участки парных аутосом от матери и от отца. У женщин еще и парные X-хромосомы подвергаются такой же мозаичной сборке. То есть в данном случае 3 + 3 ≠ 6, а равно 3. Причем как такового «генома человека» у конкретного человека нет, хотя до сих пор этим понятием продолжают оперировать и во множестве статей и прочих материалах говорится, что размер генома человека равен 3 млрд.п.н. и согласно действующего термина формально это так, но делать какие-либо серьезные выводы на самом деле нужно только, исходя из знания 6 млрд.п.н. Причиной составления лишь квазигенома служит похожесть парных хромосом из-за которой для сборки фазированных последовательностей двух отдельных ядерных геномов одного человека нужно прилагать гораздо больше усилий, используя оптическое картирование, Hi-C секвенирование, Strand-seq, трио-секвенирование (когда таковое возможно) и/или прочие ухищрения, а также ведя фазированную сборку с помощью соответствующих компьютерных программ, которых, впрочем, уже имеется около полусотни [20].

                Помимо того, что при квазигаплоидном секвенировании теряется половина геномной информации, оно еще приводит подчас к ложному объединению экзонов из разных парных хромосом с учетом потенциально имеющихся в них в цис- и в трансположениях мутаций, в результате чего могут восстанавливаться недостоверные аминокислотные последовательности, способные исказить истинную картину связи генотипа с фенотипом, включая или точнее исключая (согласно теме данной статьи) их реальное влияние на внешность человека. На рис. 1 в качестве примера приведено неоднозначное по результатам секвенирования ДНК восстановление некоего белка.

 

Рис. 1. Упрощенная схема правильного и неправильного восстановления аминокислотных последовательностей, кодируемых разными экзонами родительских гомологичных хромосом, в результате квазигаплоидного секвенирования (в качестве примера приведены вариации отдельных нуклеотидов).              

 

Для исключения потери важной информации по двум ядерным геномам человека необходимо  секвенировать ДНК из всех 46 хромосом и собирать не один (квази)геном на что еще в 2010 г. указывал К.Вентер [21]. Завершил ту статью Вентер словами, что «геномная революция только начинается». Однако по прошествии с того момента около полутора десятков лет, можно сказать, что геномная революция по-прежнему только начинается, несмотря на значительное повышение производительности и точности секвенирования. До сих пор массово продолжают секвенироваться квазигеномы, ценность которых относительно невелика и принципиально новой информации для видов с уже известными референсными геномами (в том числе для человека) они практически не несут и более того могут вводить в заблуждение. Одной из причин этого (помимо серьезных технологических трудностей для секвенирования диплоидного генома) служит то, что до сих пор считается, что парные хромосомы почти одинаковы, но как показывают результаты секвенирования диплоидных наборов хромосом у разных видов организмов, включая человека, это далеко не так. Так, было показано, что при высококачественной сборке диплоидного генома одного индивида с использованием данных о геномах его родителей (триосеквенирования) выявленная гетерозиготность гаплотипов по нуклеотидной последовательности составила 3,3%, в том числе обнаружено больше одного миллиона разных структурных вариаций, среди которых короткие и протяженные инделы (инсерции/делеции) [22]. Также этими авторами было отмечено наличие 2,6 миллиона SNP, приведших к тому, что в 48% кодирующих белки генов в их аллельных вариантах имеются несинонимичные замены. Позже аналогичное число SNP (около 2,6 млн.) обнаружено между двумя гаплотипированными геномами мужчины китайской национальности [23].

Таким образом, у каждого человека имеется не один, а два ядерных генома, которые могут отличаться весьма значительно (на 1 - 3% и более), тогда как ранее считалось, что геном человека от генома шимпанзе отличается всего на 1%. Поэтому у живущих сейчас на Планете 8 млрд. человек имеется 16 млрд. геномов, различающихся и даже подчас довольно сильно «внутри» одного человека, что нельзя не принимать во внимание. В одной из недавних статей, подготовленной международным коллективом авторов [24], говорится, что они больше не считают мозаичные сборки генома размером 3 млрд.п.н. (т.е. квазигенома) в качестве современного уровня техники, а рассматривают два генома для каждого собранного диплоидного генома (т. е. 6 млрд.п.н. против 3 млрд.п.н.), где родительские гаплотипы полностью фазированы. И это постепенно становится новой парадигмой в секвенировании ядерных геномов высших организмов, о чем мы уже упоминали ранее в статье, посвященной столетнему юбилею термина «геном» [25]. Для человека это особенно актуально с учетом персонифицированной медицины будущего, а также того же ДНК-фенотипирования и его части в виде ДНК-портретирования.

 

Генетические аспекты ДНК-портретирования

Довольно длительное время изучение морфологии лица человека и влияния на него полиморфизма ДНК проводилось исключительно при различных генетических нарушениях [26]. И даже когда в ДНК-криминалистике начали использовать такие черты как цвет глаз, волос, кожи, то к морфологии лица человека долго не могли подступиться. Пришлось ждать появления высокопроизводительной технологии GWAS (Genome-Wide Associated Studies) после чего стали делаться попытки связать физиономию человека с полиморфизмом ДНК в первую очередь в виде SNP [27 – 29]. За прошедшее десятилетие с использованием ДНК-чипов, содержащих сотни тысяч и миллионы SNP, вышло немало подобных публикаций [30 – 35], в которых описывается выявление в целом довольно большого числа полиморфных участков, проявляющих некоторую ассоциацию с чертами лиц исследуемых людей, отображаемых как в 2d, так и в 3d форматах. Стоит отметить, что отдельные гены, показывающие определенную связь с формированием особенностей лица, обнаружены различными группами авторов, что повышает уверенность в их причастности к этому процессу. Также с помощью GWAS анализа установлена связь SNP с формами ушной раковины и для некоторых SNP обнаружена некая корреляция [36]. Недавно подобное исследование было выполнено с использованием SNaPshot технологии [37]. Стоит отметить, что была сделана попытка связать физические особенности человека с вариацией числа копий (CNV) отдельных участков его генома [38], при этом авторы сделали вывод, что их подход может найти применение в криминалистике.

К настоящему времени опубликован ряд обзоров, посвященных связи полиморфизма ДНК с морфологией лица человека [1, 39 – 41], но на них останавливаться не будем, а более подробно коснемся ряда экспериментальных работ. В одной из них группой испытуемых стали 273 пары родных братьев и сестер (78 пар братьев, 79 пар сестер и 116 братьев и сестер), у которых было обнаружено 218 GWAS-значимых локусов [42]. В этих 218 локусах было выявлено 8944 SNP, достигших порога значимости и могущих иметь отношение к 6,6% общей вариации всего лица человека. Среди 218 локусов 109 перекрывались с результатами предыдущих исследований или находились от них в геноме в пределах ±500 т.п.н. Возможно в этом исследовании следовало бы проанализировать и родителей этих братьев и сестер, что могло бы дать важную информацию о наследовании SNP и возможно связать некоторые с чертами лица.

Был проведен также анализ более полумиллиона SNP у монозиготных и дизиготных близнецов, что позволило найти несколько SNP, показавшихся авторам имеющими отношение к формированию черт лица и конкретно с заметным эффектом на нос в профиль и расположение глаз [43]. Выборка была в основном из сельской местности Соединенного Королевства и от лиц, все бабушки и дедушки которых были примерно из одной и той же области, что авторы посчитали идеальной популяцией для исследований генетических ассоциаций. Однако в этом случае можно было прогнозировать большее число совпадающих SNP по всему геному, что скорее нужно расценивать как ненужный «шум».

                Отдельного внимания заслуживает работа, в которой с помощью GWAS анализа исследовали 16 пар неродственных двойников, обнаружив, что внутри пары они имеют общие геномные черты [44]. Также было показано, что выявленные SNP влияют на физические и поведенческие фенотипы помимо морфологии лица. Близкого родства у исследованных пар не имелось и лишь две пары могли иметь родство в третьем поколении и в последние несколько сотен лет. Такая удаленность для подобного исследования весьма важна, поскольку исключает ненужные совпадения SNP. В частности было обнаружено, что среди 9 пар наиболее похожих двойников 19277 SNP в 3730 генах имеют для каждой пары одинаковые генотипы, вплоть до того, что если один индивид из пары гетерозиготен по конкретному SNP, то гетерозиготен и его двойник. Изучение функциональной природы общих для наиболее похожих двойников локусов SNP показало, что 171 вызывал замены аминокислот в 158 генах. В этой работе также было отмечено, что единого обозначения подобных сильно похожих людей в разных языках нет, и их называют как ‘look-alike humans’, ‘unknown twins’, ‘twin strangers’, ‘doubles’ и ‘doppelgänger’ по-немецки.

 

Перспективы ДНК-портретирования

                Серьезным недостатком GWAS является то, что большинство выявляемых сигналов принадлежат некодирующим областям и лишь ассоциированы с некими генами-кандидатами, ответственными за преимущественно простые фенотипические признаки, сцеплено с ними наследуемыми. Рекомендуется вести анализ фланкирующих найденный SNP участков генома на протяжении 500 т.п.н. в обе стороны для обнаружения в них генов, потенциально могущих влиять на какие-либо признаки и в данном случае на морфологию лица человека, что само по себе не очень просто и главное малоэффективно. Исследование довольно большого числа SNP в рамках GWAS безусловно способствует широкому охвату генома, однако как уже известно (и о чем говорилось выше) два генома одного человека могут нести около 2,6 млн. различающихся SNP [22, 23]. При этом считается, что (квази)геном человека отличается от некоего референсного генома (которых уже несколько, но не суть) приблизительно 5 млн. SNP. Всего в человеческой популяции выявлено уже более 600 млн. SNP. Поэтому любое GWAS исследование затрагивает лишь совсем малую толику существующего геномного разнообразия. Это с одной стороны. С другой же стороны и что не менее важно - GWAS исследование не способно выявлять цис- и трансположения отдельных SNP и следовательно не позволяет для найденной ассоциации прогнозировать истинную последовательность имеющихся у человека двух аллелей конкретных генов и соответственно кодируемых ими белков, а в случае их расположения в некодирующих участках - оказывать то или иное влияние на экспрессию соседних генов. Причем как было показано в работе Jarvis и соавт. [22] в 48% кодирующих белки генов в их аллельных вариантах имеются несинонимичные замены с вытекающими из этого определенными последствиями, непредсказуемыми по своему влиянию на фенотип. Таким образом, GWAS исследование в этом плане сродни квазигеномному секвенированию, хотя и гораздо менее информативнее последнего. К тому же сообщается о случаях, когда найденные GWAS сигналы, якобы отвечающие за морфологию лица, потом отзываются как не соответствующие этому [41].

                Реальным приближением к настоящему ДНК-портретированию, а заодно и к улучшенному EVC может быть полногеномное диплоидное секвенирование двух геномов у каждого человека либо что несколько дешевле и проще – полноэкзомное секвенирование кодирующих областей, но также с фазированной гаплотипированной сборкой, восстанавливающей истинные белковые последовательности с учетом цис- и трансположений имеющихся в них замен аминокислот. Конечно можно допустить, что SNP в некодирующих областях оказываются сцеплены с некими конкретными генами или могут влиять на их регуляцию, приводя к изменению облика человека, но гораздо больший эффект вносят гены, кодирующие конкретные белки, влияющие на морфологию лица человека. Однако при таком диплоидном экзомном секвенировании на первый план выходят объекты исследований в виде конкретных людей и их групп, чему нужно уделить отдельное внимание.

                Так, выше уже упоминались GWAS исследования, в которые были вовлечены родные братья и сестры, ди- и монозиготные близнецы, а также просто двойники. При этом именно последние могут оказаться весьма полезными для понимания генов, ответственных за морфологию лица, только для этого нужно брать не пары двойников, а максимально возможное их число, включая родителей, а также родных братьев и сестер. За счет того, что двойники неродственны у них будет гораздо меньше «случайно» совпадающих SNP, а те что будут совпадать тем более с учетом их цис-, трансположений, то для них увеличивается вероятность вовлечения в схожие черты физиономий обладателей последних. Чтобы представлять с каким объемом данных нужно будет иметь дело стоит обратиться к относительно недавней статье, в которой сообщается о секвенировании полного экзома человека и выявлении четырех локусов, связанных с черепно-лицевой морфологией [45]. Также в этой работе было выявлено, что экзом конкретного человека китайской национальности отличается от референсного композитного генома GRCh37/hg19 на 23011 SNP. Если учесть, что кодирующая часть генома составляет около 1%, а замен в ней все же меньше, чем в остальной части генома, то можно допустить, что обнаруженные различия 2,6 млн. SNP между геномами одного человека [22, 23] приблизительно соответствуют тем же 23 тысячам экзомных SNP, что и в работе W.Wu [45]. Сколько будет совпадающих замен у двойников априори сказать невозможно, но с учетом огромного людского геномного разнообразия можно допустить, что большая часть SNP у двойников будет разной, в том числе с учетом их цис- и трансположений. Таким образом, в результате такого исследования полных экзомов увеличенного числа двойников вместе с ближайшими родственниками с использованием машинного обучения и искусственного интеллекта можно «выйти» на некие гены, формирующие облик человека. Безусловно, потребуется очень детальный анализ всевозможных сочетаний аминокислотных последовательностей, принимая во внимание возможный плейотропный эффект, но здесь стоит заметить, что фирма Parabon Nanolabs на своем сайте упоминает о неделях вычислительного времени для создания своих и как показывает практика вполне достоверных Snapshot изображений. И чем больше будет исходных данных по двойникам, тем точнее может быть конечный результат.

                Что касается чисто семейного исследования, то для него также необходимо провести экзомное триосеквенирование членов ряда семей, имеющих сильно похожих и не очень похожих на родителей детей, что так или иначе будет указывать на наследственный компонент. Так, например, нужно взять в анализ семью, где мать имеет двух или трех дочерей, из которых одна или две являются почти копией матери, а вторая или третья не очень похожа. С учетом, что половина SNP придет к ним от отца (которые можно будет вычесть после секвенирования его экзома) останется около 10 тысяч условно мажорных SNP у матери и ее двух или трех дочерей, по которым они будут отличаться от референсного экзома, но при этом можно допустить, что у похожих на мать дочерей одинаковых SNP будет больше. Если вычесть SNP, которые будут другими у отличающейся дочери, то можно выявить группу генов, в которую войдут те, что отвечают за физиономию. В таких экспериментах могут быть и разные отцы, но их ДНК также должна быть доступна для секвенирования. Аналогичное исследование нужно провести с семьями, где есть сильно похожие на отца сыновья. И тех и других семей тоже нужно набрать как можно больше для секвенирования и последующего компьютерного анализа.

 

Заключение

                ДНК-фенотипирование и его только развивающуюся часть в виде ДНК-портретирования можно считать предтечами всеобщей геномной регистрации населения, которая обязательно произойдет, поскольку с преступностью нужно бороться, а одной из наиболее действенных мер является неотвратимость наказания, чего будет гораздо проще достичь, имея подобную криминалистическую базу ДНК-данных. И тогда роль ДНК-фенотипирования в установлении личности лица, совершившего правонарушение, неизбежно будет снижаться, но она еще долго будет востребована так как необходимо восстанавливать облик людей, еще не включенных во всеобщую геномную базу данных. К тому же, даже начавшись, подобная ДНК-регистрация населения потребует довольно значительного времени для полного его охвата. В этой связи необходимо улучшать существующее ДНК-фенотиирование и в особенности подходы к ДНК-портретированию из-за с одной стороны крайней важности последнего, а с другой – пока плохой достоверности восстановления физиономии человека по выявляемому полиморфизму ДНК. И для этого требуются принципиально иные подходы к поиску необходимых ДНК-маркеров. Такими взамен GWAS могут стать полногеномное (полноэкзомное) секвенирование диплоидных геномов человека с фазированной сборкой, а также правильный выбор объектов в виде увеличенного числа неродственных двойников и подбор семей с четко наследуемыми признаками лицевой морфологии, как по мужской, так и по женской линиям, сопровождаемые анализом с применением машинного обучения и искусственного интеллекта.

 

Источник финансирования / Funding source

Научное исследование выполнено за счет гранта Российского научного фонда № 24-28-00834, https://rscf.ru/project/24-28-00834.

The scientific research was supported by the Russian Science Foundation grant No. 24-28-00834, https://rscf.ru/project/24-28-00834.

 

Конфликт интересов / Conflict of Interest

                Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

                The authors declare that they have no competing interest.

 

×

About the authors

Alexei V. Chemeris

Federal State Budgetary Educational Institution of Higher Education "Ufa University of Science and Technology"

Email: chemeris@anrb.ru
ORCID iD: 0000-0002-8917-0449
SPIN-code: 1248-2582

rofessor, Doctor of Biological Sciences, Professor of the Department of Criminalistics, Institute of Law

Russian Federation, 450005, Russian Federation, Ufa, st. Dostoevsky, 131

Airat A. Khalikov

Federal State Budgetary Educational Institution of Higher Education "Bashkir State Medical University", Ufa, Russian Federation

Email: airat.expert@mail.ru
ORCID iD: 0000-0003-1045-5677
SPIN-code: 1895-7300
Scopus Author ID: 55836052600
ResearcherId: КОС-8165-2024

Professor, Doctor of Medical Sciences, Head of the Department of Forensic Medicine

Russian Federation, Russian Federation, 450008, Ufa, st. Zaki Validi, 47

Ravil R. Garafutdinov

Federal State Budgetary Educational Institution of Higher Education "Ufa University of Science and Technology"

Email: garafutdinovr@mail.ru
ORCID iD: 0000-0001-9087-7364
SPIN-code: 3434-2630

Candidate of Biological Sciences, Associate Professor of the Department of Organic and Bioorganic Chemistry, Institute of Chemistry and Protection in Emergency Situations

Russian Federation, 450092, Russian Federation, Ufa, st. Zaki Validi, 32

Dmitriy A. Chemeris

GENVED LLC, Moscow, Russian Federation

Email: dch@dch.ru.net
ORCID iD: 0009-0003-6407-5001
SPIN-code: 5190-9790

General Director of LLC "GENVED", Moscow, Russian Federation

Russian Federation, 25/1 Parshina, Moscow, 123103, Russia

Assol R. Sakhabutdinova

Institute of Biochemistry and Genetics - a separate structural unit of the Ufa Federal Research Center of the Russian Academy of Sciences, Ufa, Russian Federation

Email: sakhabutdinova@rambler.ru
ORCID iD: 0000-0001-8797-4702
SPIN-code: 7172-7141

Researcher, Laboratory of Structure and Function of Biopolymers, Institute of Biochemistry and Genetics - a separate structural unit of the Ufa Federal Research Center of the Russian Academy of Sciences, Ufa, Russian Federation

Russian Federation, 450054, Russian Federation, Ufa, Oktyabrya Ave., 71

Aigul F. Khaliullina

Federal State Budgetary Educational Institution of Higher Education "Ufa University of Science and Technology"

Email: aigul229@mail.ru
ORCID iD: 0009-0003-4193-2832
SPIN-code: 7448-6130

Associate Professor, Candidate of Legal Sciences, Associate Professor of the Department of Criminalistics, Institute of Law

Russian Federation, 450005, Russian Federation, Ufa, st. Dostoevsky, 131

Rushan Galyautdinov

Federal State Budgetary Educational Institution of Higher Education "Ufa University of Science and Technology"

Email: rushan-94@mail.ru
ORCID iD: 0000-0002-1205-7608
SPIN-code: 8322-7325

Candidate of Legal Sciences, Associate Professor of the Department of Criminalistics, Institute of Law

Russian Federation, 450005, Russian Federation, Ufa, st. Dostoevsky, 131

Rafael H. Sagidullin

Federal State Budgetary Educational Institution of Higher Education "Ufa University of Science and Technology"

Email: sagidullin12@mail.ru
ORCID iD: 0000-0002-5721-8831
SPIN-code: 7970-8831

Candidate of Medical Sciences, Associate Professor of the Department of Criminalistics, Institute of Law

Russian Federation, 450005, Russian Federation, Ufa, st. Dostoevsky, 131

Farit G. Aminev

Federal State Budgetary Educational Institution of Higher Education "Ufa University of Science and Technology"

Author for correspondence.
Email: faminev@mail.ru
ORCID iD: 0000-0003-4031-4103
SPIN-code: 5527-5110

Professor, Doctor of Law, Professor of the Department of Criminalistics, Institute of Law

Russian Federation, 450005, Russian Federation, Ufa, st. Dostoevsky, 131

References

  1. Chemeris AV, Aminev FG, Garafutdinov RR, Anisimov VA, SagitovAM, Khusnutdinova EK, et al. DNK-kriminalistika. Moscow: Nauka. 2022. 466 S. [DNA criminalistics] (In Russ)
  2. Dabas P, Jain S, Khajuria H, Nayak BP. Forensic DNA phenotyping: Inferring phenotypic traits from crime scene DNA. J Forensic Leg Med. 2022;88:102351. doi: 10.1016/j.jflm.2022.102351
  3. Kayser M, Branicki W, Parson W, Phillips C. Recent advances in Forensic DNA Phenotyping of appearance, ancestry and age. Forensic Sci Int Genet. 2023;65:102870. doi: 10.1016/j.fsigen.2023.102870
  4. Wang Z, Fu G, Ma G, Wang C, Wang Q, Lu C, et al. The association between DNA methylation and human height and a prospective model of DNA methylation-based height prediction. Hum Genet. 2024;143(3):401-421. doi: 10.1007/s00439-024-02659-0
  5. Wolinsky H. CSI on steroids: DNA-based phenotyping is helping police derive visual information from crime scene samples to aid in the hunt for suspects. EMBO Rep. 2015;16(7):782-786. doi: 10.15252/embr.201540714
  6. Arnold C. The controversial company using DNA to sketch the faces of criminals. Nature. 2020;585(7824):178-181. doi: 10.1038/d41586-020-02545-5
  7. Pulker H, Lareu MV, Phillips C, Carracedo A. Finding genes that underlie physical traits of forensic interest using genetic tools. Forensic Sci Int Genet. 2007;1(2):100-104. doi: 10.1016/j.fsigen.2007.02.009
  8. Frudakis T. Forensic DNA Analysis: From Modest Beginnings to Molecular Photofitting, Genetics, Genomics, and the Pertinent Population Genetics Principles. In Molecular Photofitting. Predicting ancestry and phenotype using DNA. 2008, P. 1-34.
  9. Stephan CN, Caple JM, Guyomarc’h P, Claes P. An Overview of the Latest Developments in Facial Imaging. Forensic Sciences Research. 2019;4(1):10–28. doi: 10.1080/20961790.2018.1519892
  10. Walsh S, Liu F, Ballantyne KN, van Oven M, Lao O, Kayser M. IrisPlex: a sensitive DNA tool for accurate prediction of blue and brown eye colour in the absence of ancestry information. Forensic Sci Int Genet. 2011;5(3):170-180. doi: 10.1016/j.fsigen.2010.02.004
  11. Walsh S, Wollstein A, Liu F, Chakravarthy U, Rahu M, Seland JH, et al. DNA-based eye colour prediction across Europe with the IrisPlex system. Forensic Sci Int Genet. 2012;6(3):330-340. doi: 10.1016/j.fsigen.2011.07.009
  12. Stacey G, Bolton B, Doyle A, Griffiths B. DNA fingerprinting--a valuable new technique for the characterisation of cell lines. Cytotechnology. 1992;9(1-3):211-216. doi: 10.1007/BF02521748
  13. Butler JM. Recent Developments in Y-Short Tandem Repeat and Y-Single Nucleotide Polymorphism Analysis. Forensic Sci Rev. 2003;15(2):91-111.
  14. Yu W, Zhu M, Wang N, Wang X, Gao X. An Efficient Transformer Based on Global and Local Self-attention for Face Photo-Sketch Synthesis. IEEE Trans Image Process. 2023;22:483-495. doi: 10.1109/TIP.2022.3229614
  15. Soares C. Portrait in DNA. Sci Am. 2010;302(5):14, 17. doi: 10.1038/scientificamerican0510-14
  16. Pośpiech E, Teisseyre P, Mielniczuk J, Branicki W. Predicting Physical Appearance from DNA Data-Towards Genomic Solutions. Genes (Basel). 2022;13(1):121. doi: 10.3390/genes13010121
  17. Butorina IV, Kosarev SYu. K voprosu o «genomnom portrete» kak metode izoblicheniya prestupnikov // Konferentsiya: Nedelya Nauki SPBPU. Sankt-Peterburg, 13–19 noyabrya 2017 g. S.403-405.
  18. Takeuchi T, Suzuki Y, Watabe S, Nagai K, Masaoka T, Fujie M, et al. A high-quality, haplotype-phased genome reconstruction reveals unexpected haplotype diversity in a pearl oyster. DNA Res. 2022;29(6):dsac035. doi: 10.1093/dnares/dsac035
  19. Christiansen L, Amini S, Zhang F, Ronaghi M, Gunderson KL, Steemers FJ. Contiguity-Preserving Transposition Sequencing (CPT-Seq) for Genome-Wide Haplotyping, Assembly, and Single-Cell ATAC-Seq. Methods Mol Biol. 2017;1551:207-221. doi: 10.1007/978-1-4939-6750-6_12
  20. Chemeris DA, Kuluev BR, Patrushev MV, Garafutdinov RR, Chemeris AV. Sequencing of the complete diploid genomes (dinomes) of plants and other higher organisms should become a new paradigm in the study of their nuclear genetic material. Biomics. 2023;15(4):272-290. doi: 10.31301/2221-6197.bmcs.2023-24 Режим доступа: https://biomicsj.ru/archive/2023/tom-15-4/850/ Дата обращения: 17.06.2024.
  21. Venter JC. Multiple personal genomes await. Nature. 2010;464(7289):676-677. doi: 10.1038/464676a
  22. Jarvis ED, Formenti G, Rhie A, Guarracino A, Yang C, Wood J, et al.; Human Pangenome Reference Consortium. Semi-automated assembly of high-quality diploid human reference genomes. Nature. 2022;611(7936):519-531. doi: 10.1038/s41586-022-05325-5
  23. Yang C, Zhou Y, Song Y, Wu D, Zeng Y, Nie L, et al. The complete and fully-phased diploid genome of a male Han Chinese. Cell Res. 2023;33(10):745-761. doi: 10.1038/s41422-023-00849-5
  24. Porubsky D, Vollger MR, Harvey WT, Rozanski AN, Ebert P, Hickey G, et al.; Human Pangenome Reference Consortium. Gaps and complex structurally variant loci in phased genome assemblies. Genome Res. 2023;33(4):496-510. doi: 10.1101/gr.277334.122
  25. Kuluev BR, Baymiev AnKh, Gerashchenkov GA, Yunusbaev UB, Garafutdinov RR, Alekseev YaI, et al. One hundred years of haploid genomes. Now time comes for diploid genomes. Biomics. 2020;12(4):411-434. doi: 10.31301/2221-6197.bmcs.2020-33 Available from: https://biomicsj.ru/upload/iblock/9fd/bmcs2020124411.pdf (In Russ)
  26. Richmond S, Howe LJ, Lewis S, Stergiakouli E, Zhurov A. Facial Genetics: A Brief Overview. Front Genet. 2018;9:462. doi: 10.3389/fgene.2018.00462
  27. Liu F, van der Lijn F, Schurmann C, Zhu G, Chakravarty MM, Hysi PG, et al. A genome-wide association study identifies five loci influencing facial morphology in Europeans. PLoS Genet. 2012;8(9):e1002932. doi: 10.1371/journal.pgen.1002932
  28. Paternoster L, Zhurov AI, Toma AM, Kemp JP, St Pourcain B, Timpson NJ, et al. Genome-wide association study of three-dimensional facial morphology identifies a variant in PAX3 associated with nasion position. Am J Hum Genet. 2012;90(3):478-85. doi: 10.1016/j.ajhg.2011.12.021
  29. Claes P, Shriver MD. Establishing a multidisciplinary context for modeling 3D facial shape from DNA. PLoS Genet. 2014;10(11):e1004725. doi: 10.1371/journal.pgen.1004725.
  30. Fagertun J, Wolffhechel K, Pers TH, Nielsen HB, Gudbjartsson D, Stefansson H, et al. Predicting facial characteristics from complex polygenic variations. Forensic Sci Int Genet. 2015;19:263-268. doi: 10.1016/j.fsigen.2015.08.004
  31. Claes P, Shriver MD. New Entries in the Lottery of Facial GWAS Discovery. PLoS Genet. 2016;12(8):e1006250. doi: 10.1371/journal.pgen.1006250
  32. Qiao L, Yang Y, Fu P, Hu S, Zhou H, Peng S, et al. Genome-wide variants of Eurasian facial shape differentiation and a prospective model of DNA based face prediction. J Genet Genomics. 2018;45(8):419-432. doi: 10.1016/j.jgg.2018.07.009
  33. Xiong Z, Dankova G, Howe LJ, Lee MK, Hysi PG, de Jong MA, et al.; International Visible Trait Genetics (VisiGen) Consortium. Novel genetic loci affecting facial shape variation in humans. Elife. 2019;8:e49898. doi: 10.7554/eLife.49898
  34. White JD, Indencleef K, Naqvi S, Eller RJ, Hoskens H, Roosenboom J, et al. Insights into the genetic architecture of the human face. Nat Genet. 2021;53(1):45-53. doi: 10.1038/s41588-020-00741-7
  35. Zhang M, Wu S, Du S, Qian W, Chen J, Qiao L, et al. Genetic variants underlying differences in facial morphology in East Asian and European populations. Nat Genet. 2022;54(4):403-411. doi: 10.1038/s41588-022-01038-7
  36. Adhikari K, Reales G, Smith AJ, Konka E, Palmen J, Quinto-Sanchez M, et al. A genome-wide association study identifies multiple loci for variation in human ear morphology. Nat Commun. 2015;6:7500. doi: 10.1038/ncomms8500
  37. Noreen S, Ballard D, Mehmood T, Khan A, Khalid T, Rakha A. Evaluation of loci to predict ear morphology using two SNaPshot assays. Forensic Sci Med Pathol. 2023;19(3):335-356. doi: 10.1007/s12024-022-00545-7
  38. Ueki M, Takeshita H, Fujihara J, Kimura-Kataoka K, Iida R, Yasuda T. Simple screening method for copy number variations associated with physical features. Leg Med (Tokyo). 2017;25:71-74. doi: 10.1016/j.legalmed.2017.01.006
  39. Weinberg SM, Roosenboom J, Shaffer JR, Shriver MD, Wysocka J, Claes P. Hunting for genes that shape human faces: Initial successes and challenges for the future. Orthod Craniofac Res. 2019;22 Suppl 1:207-212. doi: 10.1111/ocr.12268
  40. Naqvi S, Hoskens H, Wilke F, Weinberg SM, Shaffer JR, Walsh S, et al. Decoding the Human Face: Progress and Challenges in Understanding the Genetics of Craniofacial Morphology. Annu Rev Genomics Hum Genet. 2022;23:383-412. doi: 10.1146/annurev-genom-120121-102607
  41. Alshehhi A, Almarzooqi A, Alhammadi K, Werghi N, Tay GK, Alsafar H. Advancement in Human Face Prediction Using DNA. Genes (Basel). 2023;14(1):136. doi: 10.3390/genes14010136
  42. Hoskens H, Liu D, Naqvi S, Lee MK, Eller RJ, Indencleef K, et al. 3D facial phenotyping by biometric sibling matching used in contemporary genomic methodologies. PLoS Genet. 2021;17(5):e1009528. doi: 10.1371/journal.pgen.1009528
  43. Crouch DJM, Winney B, Koppen WP, Christmas WJ, Hutnik K, Day T, et al. Genetics of the human face: Identification of large-effect single gene variants. Proc Natl Acad Sci USA. 2018;115(4):E676-E685. doi: 10.1073/pnas.1708207114
  44. Joshi RS, Rigau M, García-Prieto CA, Castro de Moura M, Piñeyro D, Moran S, et al. Look-alike humans identified by facial recognition algorithms show genetic similarities. Cell Rep. 2022;40(8):111257. doi: 10.1016/j.celrep.2022.111257
  45. Wu W, Zhai G, Xu Z, Hou B, Liu D, Liu T, et al. Whole-exome sequencing identified four loci influencing craniofacial morphology in northern Han Chinese. Hum Genet. 2019;138(6):601-611. doi: 10.1007/s00439-019-02008-6

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) Eco-Vector



СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 60835 выдано 09.09.2021 г. 
СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ЭЛ № ФС 77 – 59181 выдано 03.09.2014
г.



This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies