Специалист по дата-майнингу Янив Эрлих (Yaniv Erlich) уже несколько лет занимается обработкой информации из генеалогических баз данных. В процессе работы он сделал несколько замечательных открытий. Например, полгода назад он показал, как по анонимным образцам ДНК можно вычислить личность человека. С тех пор Эрлих получил почетное звание «генетического хакера» — и продолжил исследования.

Несколько дней назад он опубликовал новые результаты своей работы по анализу информации из генеалогических архивов. Он скачал всю информацию с сайта Geni.com, почистил базу, привел ее в нормальный машиночитаемый формат — и выложил в открытый доступ. База содержит информацию о 43,6 млн людях, живших в последние 500 лет, и их родственных связях.

Эрлих говорит, что самая крупная группа родственников в базе состоит из 13 млн человек. Все они — потомки нескольких семейств, живших 500 лет назад. К сожалению, автор не сделал визуализацию этого гигантского генетического дерева. Вероятно, картина получается слишком запутанной. Для примера, вот как выглядит дерево для 6000 человек, представляющих семь поколений.

На видео показаны маршруты миграции населения из Великобритании в 15-20 веках, на основании анализа 43 млн генетических профилей из базы FamiLinx.



Оставить мнение