perjantai 24. maaliskuuta 2017

Esi-isän DNA:ta etsimässä - osa IV

Edeltävissä DNA-avusteista sukututkimusta käsittelevissä artikkeleissani perehdyin n.k. autosomaaliperimään FTDNA:n FamilyFinder -testin avittamana. Tuossa serkkutestiksi kutsutussa aineistossa haravoidaan sekä isän että äidin puoleisesta perimäaineksesta osumia muiden testin tehneiden henkilöiden tuloksiin. Tämän serkkutestin lisäksi tilasin samasta solunäytteestä Y-DNA testin. Tämä testi pureutuu Y-kromosomin perimään ja periytymiseen.
Y-kromosomi löytyy vain miespuolisilta henkilöiltä ja se perityy ainoastaan isältä pojalle. Tämän ominaisuutensa vuoksi Y-DNA testiä kutsutaan isälinjan testiksi, koska se kertoo suorassa isälinjassa periytyneestä DNA:sta. Ainakin teoriassa siis voidaan selvittää jokaisen miehen isälinja aina hamaan esihistorialliseen alkuisään asti. Omassa isälinjassani etäisin tunnettu esi-isä on yhdeksän sukupolven takainen Olof Månsson Finholm (Styrman) s.n. 1684, kuollut v. 1756 Larsmossa (Luoto).

En malta olla siteeraamatta enoni Reijo Pinomäen aiheeseen sopivaa tarinaa ikurilaisesta Mäkelän äijästä, joka meni Tampereella lääkärin vastaanotolle. Sattui sitten esitellessä käymään ilmi, että herra tohtori oli myös Mäkelä nimeltään. Potilas kysyikin tohtorilta että mahdetaankos olla sukua. Johon tohtori totesi että "eiköhän me kaikki, Aatamista lähtien". Kotiinsa palattuaan kahveepöydässä ihmetteli eukolle että oli se vallan tietäväinen mies se tohtori Mäkelä. Jaa kuinka niin, kysyi vaimo. "No kun mistähän se tiesi Aataminkin olleen Mäkelöitä."

Aivan Mäkelä-tarkkuudella ei esivanhempia tietenkään kyetä DNA-näytteestä osoittamaan. Tutkimalla Y-kromosomin DNA:ssa mutaation kautta tapahtuneita muutoksia ja eroavaisuuksia kyetään määrittelemään eri väestöryhmien alkuperää ja populaatioiden historiaa. Geneettisessä tutkimuksessa ihmiskunta rakentuu perimänsä mukaan pääryhmistä, jotka esitetään kirjainsymboleina. Nämä n.k. haploryhmät puolestaan jakaantuvat edelleen mutaatioiden myötä hierarkisesti alaryhmiin omine haploryhmätunnuksineen, jolloin muodostuu evolutiivinen puu - vähän niinkuin sukupuu perinteisin keinoin.

Mitä useampia merkkigeenejä, eli markkereita DNA-rihmasta tutkitaan, sitä täsmällisemmin on mahdollista havaita mutaatioiden määrä ja sijainti muuhun vertailuaineistoon nähden ja näin määrittää henkilön sijainti tuossa phylogeneettisessä- eli evoluutiopuussa. Oma testini on n.k. Y-67, joka tarkoittaa että näytteestäni on tutkittu 67 geenimarkkeria. Tämän tarkkuuden on todettu käytännössä olevan hyvä lähtötaso sukututkimuksellisiin tarkoituksiin. Kevyemmät ja halvemmat testit antavat tietoa hyvin karkeasti päähaploryhmän tasolla. Tarkkuuden kasvaessa myös kustannukset nousevat, joten kannattaa ennen testin tilaamista harkita mitä tavoittelee ja paljonko on valmis uhraamaan varoja. Aivan ilmaista tämä homma ei ole. Neuvoja oikean tason harkinnassa saa esim. Suomi DNA ryhmässä.


https://www.familytreedna.com

Ylläolevassa kartassa on kuvattu päähaploryhmien vaellusreittejä alkukodin afrikkalaisesta "Aatami Mäkelästä" n. 60 000 vuotta sitten.
Haploryhmäkseni määrittyi tämän Y-67 testin perusteella N-M231 (N1c1).

Haploryhmän N esiintymisalue
wikimedia.commons

Haploryhmä N-M231:n määrittävän mutaation Y-kromosomissa on arvioitu tapahtuneen Kaakkois- Aasiassa n. 20 000 vuotta sitten. Jääkauden lopulla n. 10 000 vuotta sitten jäämassan vetäytyessä tämä ihmisryhmä on vaeltanut Siperian pohjoisreunaa seuraten. Osa tämän vaelluksen jälkipolvista päätyi m.m. nykyisen Suomen alueelle. Teoksessa "Muinaisuutemme jäljet" arvioidaan asutuksen levittäytyneen tänne n. 8850-8000 e.a.a.


Haploryhmän N vaellusreittejä
wikimedia commons

Haploryhmämääritykseni N-M231 perusteella liityin FTDNA-projektiin "N-North Eurasia", Projektissa on mukana vapaaehtoisia aktiiveja ja asiantuntijoita, joiden avulla tulosten tulkinnassa ja jalostamisessa saa arvokasta apua. Administraattorien toimesta tietoni asemoitiin ryhmän taulukkoon verratavaksi muihin samaan haploryhmään kuuluvien henkilöiden tulosten kanssa.
Tämän vertailun tuloksena haploryhmäni sai alustavan tarkennuksen alaryhmään N-Y7300.
FTDNA-tunnuksella - n.k. kittinumerolla 580064 tietoni löytyvät tällä hetkellä ryhmässä N1c1-0825 Y5400+ Y7300+ neljäntoista muun kittinumeron kanssa.
Taulukosta käy ilmi kaikkien näytteestäni tutkittujen 67:n jakson numeeriset arvot, joiden yhtäläisyyksiä ja eroja vertaamalla voidaan määrittää henkilöiden välinen geneettinen etäisyys. Omissa tuloksissani osoittautui kaksi poikkeavaa STR-arvoa: markkerissa DYS449=30 sekä DYF395=17-17. Näistä jälkimmäistä mutaatiota ei esiinny muualla tässä alaryhmässä (klaanissa) ja on nähtävästi harvinainen. Tästä johtuen haplon tarkempi määrittäminen ja varmistaminen vaatisi laajemman testipaketin BigY:n tai tarkentavia n.k. snippitestejä.

Georg Dunkel on laatinut hyödyksemme N-M231 haplon alaklaaneista "sukupuun", jonka oksalta voidaan paikantaa ryhmä N-Y7300. Kyseisen mutaatio on ajoitettu tapahtuneeksi 2000 vuotta sitten, (suurenna kuvaa klikkaamalla)

(c) Georg Dunkel http://www.kolumbus.fi/geodun/YDNA/SNP-N-TREE-FIN.jpg


Tuloksien antaman geneettisen etäisyyden ja sukulaisuuden asteen vertailemiseksi muihin Y-DNA testin suorittaneisiin on apuna FTDNA:n  Y-DNA Matches -taulukko. Omassa taulukossani lähimmän sukulaisuuden/geneettisen etäisyyden arvolla 4 saa henkilö (kit nro 105899), jonka haploryhmäksi on määritetty N-Y7297.  Hänen etäisin tunnettu isälinjainen esivanhempansa on Birkarl Oluf Anundsson Tulkkila, k. 1562 Armassaari. Taulukossa mainittujen yhteystietojen avulla otin yhteyttä kyseiseen henkilöön tiedustellakseni, onko hänellä tarkempaa tietoa Tulkkilasta ja hänen esivanhempansa jälkipolvista. Tarkoituksenani siis tietenkin selvittää, olisinko jopa hänen jäkeläisensä. Tällaista yhteyttä ei kuitenkaan voitu tässä vaiheessa osoittaa.
Anundsson Olofsson Tulkkilan alkuperä tämän lähteen mukaan olisi Kokemäenjoen rantamailla. Hän esittelee Kokemäen Krootilan myyneen Olluf Andrisson Tolk'in 7.3.1437.  Valitettavasti lähdetietoja tai muuta tarkennusta tästä kytkennästä ei ole saatavilla. Oluf Anundsson Tulkkilan esipolvet eivät ole tunnettuja niissä sukuselvityksissä joita olen internetissä tarkastellut.

Koska perinteisen sukututkimuksen keinoin ei ollut osoitettavissa yhteyttä viimeisten yhdeksän sukupolven aikana, antaa FTDNA n.k. TiP -raportti laskennallisen arvion yhteisestä esi-isästä 14 sukupolven päässä 90% todennäköisyydellä, 99% todennäköisyyteen päästään 19 sukupolven takana.
Tällöin puhutaan aikakaudesta n. v. 1300-1500.

Kun tarkastelin muita lähimpiä Y-67 osumia, havaitsin että Y-7300 haploja oli myös toinen Tornionjokilaaksoa asuttanut Nils Thomasson v. 1500, geneettisellä etäisyydellä 7. Samoilta seuduilta Henrik Staffansson, k. 1562 haplolla N-M232 sai geneettisen etäisyyden arvolla 6.
Aiemmin mainitun Oluf Anundsson Tulkin oletetuilla esivanhempien synnyinseuduilla Kokemäenjoen varressa sekä sieltä kohti eteläistä Pohjanmaata on näitä kohtuullisen lähellä olevia haploja useampiakin.
Allaoleva kartta osoittaa Y-37 markkerin tarkkudella tarkasteltuna läheisimpien osumieni ilmoittaman etäisimmän tunnetun esi-isän asuinpaikan.


Ottaen huomioon e.m. paikannukset ja ajoitukset, olen tässä vaiheessa päätynyt jäljittämään kahta hypoteesia, jotka molemmat kytkeytyvät Kokemäenjokilaaksoon.

Oluf Anundson Tulkkila oli Esko Kannalalta saamani selvityksen mukaan pirkkalainen mahtimies, jonka esipolvet oletetaan Kokemäen Tulkkilaan. Hänestä tuli Keminmaan vouti v.1555 ja asui Tornionjokilaaksossa Armassaaressa. Hänen toistaiseksi tunnetut jälkipolvensa eivät osoita mahdollista sukulaisuutta omaan esi-isääni. Olufista kuitenkin tiedetään, että hänellä oli useampiakin jalkavaimoja, jonka vuoksi hänet määrättiin sakkoihin v. 1546 "Tesse hade giortt hoor medtt Lappekoner i Lappemarckenn." Jospa olenkin näiden Lapinvaimojen kanssa siitetyn pojan jälkeläinen? Ajallisesti se ainakin olisi mahdollista. Eräs kenties huomionarvoinen yksityskohta on Olufin tyttären, Annan avioituminen Hans Knutsson Fordellin kanssa. He vaikuttivat n. 100 vuotta ennen Olofimme syntymää Pedersöressä, vain parikymmentä kilometria Larsmosta.
Varmempana pidän kuitenkin sitä hypoteesia, että Olof Månsson Finholmin suoria esi-isiä löytyisi 1300- luvulla tai varhemmin Kokemäen suurpitäjän tienoilta. Tuohon aikaan se oli valtakunnan tärkeimpiä asutus- ja kauppakeskuksia.

Tämänhetkiset haploryhmämääritykset sekä analyysit eivät ole suinkaan mikään lopullinen totuus. Päinvastoin - paremminkin ollaan polun alkupäässä esihistoriallisten juurien selvityksessä. Sitä mukaa kuin testattavien määrä laajenee ja suoritetaan tarkentavia testejä, myös kuva tarkentuu ja käsityksemme muuttuvat. Mahdollisesti mullistuvatkin aivan toiseksi kuin nyt on asiain laita ajateltu.

Se seikka on kuitenkin varmistunut yhä vahvemmin, että olen idästä kotoisin. Tämä tuli ilmi myös kahdessa aiemmassa aihetta käsitelleessä blogiartikkelissani. Siis päinvastoin kuin oma tuntumani oli aiemmin perinteisen sukututkimuksen perusteella. Tästäkin lähtökohdasta edellä arvelemani tutkimussuunnat kahden merkittävän jokilaakson, Tornion ja Kokemäen alueelle tuntuvat ilmeisimmiltä.

OmaY-DNA mutaationi (Y-7300) on tapahtunut tämän hetkisen arvion mukaan 2000-3000 vuotta sitten. Ajanjakso lasketaan kuuluvaksi nuorempaan pronssikauteen (1100-500 e.a.a). Nykyinen valistunut arvioni on että esi-isäni ovat asuttaneet tätä maailmankolkkaa jo tuolla ajanjaksolla.
Aikakauden asutukseen ja oloihin nykyisen Suomen alueella voi tutustua Kansallismuseon sivustolla.

Parahiksi tätä artikkelia kirjoittaessani saapui postissa tilaamani teokset, joita suosittelen esihistoriastamme kiinnostuneille:
Muinaisuutemme jäljet (Haggren, Halinen, Lavento, Raininen, Wessman 2015)
Homo Europaeus - Eurooppalaisn ihmisen pitkä historia (Karin Bojs 2015)

Siinä määrin kiinostus aiheeseen sai tuulta alleen että äitilinjainen mtDNA testi on jo tilauksessa. Tuloksia odottelen saapuvaksi toukokuulla. Siitä aiheesta sitten tarkemmin tulevassa artikkelissa.

Linkkejä:

maanantai 13. maaliskuuta 2017

Esi-isän DNA:ta etsimässä - osa III

Edeltävässä DNA-avusteista sukututkimusta pohtivassa blogiartikkelissani perehdytin itseäni autosomaaliperimään Family Finderin n.k. serkkutestin tulosten kautta. Osana testiä tutkitaan myös X-kromosomissa havaittavia yhteneväisyyksiä. Tässä artikkelissa koetan aloittelijana ottaa askeleet aiheesta "X-kromosomi ja DNA aloittelijoille". Muistutan näin myös artikkelisarjan alussa maininneeni, että artikkeliani ei tule suinkaan lukea tieteellisenä oppikirjana DNA avusteisesta sukututkimuksesta. Paremminkin päivä- ja muistikirjana omasta taivalluksestani ja havainnoistani tämän aiheen viidakoissa.

http://smithplanet.com/stuff/x-chromosome.htm
(klikkaa kuva suuremmaksi)
X-kromosomi käyttäytyy perimässä siinä suhteessa merkittävällä tavalla, että se mahdollistaa tiettyjen sukulinjojen poissulkemisen etsittäessä kahden yksilön välistä yhteistä esivanhempaa. Yksinkertaistettuna tämä johtuu siitä, että X-kromosomi ei koskaan periydy isältä pojalle. Miehellä on vain yksi X-kromosomi jonka hän perii aina äidiltään ja periyttää sen kopiona edelleen ainoastaan tyttärelle. Naispuolinen jälkeläinen perii aina kaksi X-kromosomia. Sekä miehen että naisen äidiltään perimä X-kromosomi on yhdistelmä tämän vanhempien X-kromosomista - mutta ei välttämättä 50/50 suhteessa. Tämän seurauksena X-kromosomi muuttuu vähemmän isä-tytär linjaisessa peritymislinjassa. Äiti-tytär linjaisessa periytymisessä muuntumista tapahtuu enemmän.
Oheinen kaavio selventää periytymislinjaa ja perimän suhdetta tilanteessa jossa naisen perimä vanhemmiltaan tapahtuu 50/50 suhteessa.

Asia siis mutkistuu kuitenkin käytännössä, koska useimmiten naisen perimä on kombinaatio vanhempiensa X-kromosomista joka seuraavassa äiti-tytär perimässä saa uuden kombinaation.
Syventymättä tällä kertaa näihin kombinaatiomahdollisuuksiin (kenties myöhemmin ymmärrykseni toivottavasti lisääntyessä) voidaan kuitenkin tätä tietämystä soveltaa arvioitaessa sukulaisuussuhteen vahvuutta sekä ajallista etäisyyttä.

Näin esimerkiksi omat X-osumani eivät voi olla isäni puoleisesta sukulinjasta, rajaten näin merkittävän joukon esipolvia pois. Jos olisin naispuolinen, niin tilanne olisi toinen.
Tästä asetelmasta lähdettäessä on mahdollista laatia perinteisen sukututkimuksen avulla laaditusta sukupuusta X-linjainen esitys, josta käy ilmi ne esivanhemmat jotka ovat teoreettisesti mahdollisia X-osumia kartoitettaessa; sukulinjassa ei voi esiintyä kahta miestä peräkkäin.

Tällainen luettelo esivanhemmistani on tarkasteltavissa linkistä:
https://drive.google.com/file/d/0B1i56KOXVkyHU254MlBDMDEyQ0k/view?usp=sharing

FTDNA tuottaa FamilyFinder testin raportissa tietoa X-osumista sekä lisätietoja siinä laajuudessa kuin henkilöt ovat tutkimustietojaan ja yhteystietojaan avanneet. Myös Gedmatchiin ladattu FTDNAn tuottama data antaa raportissaan X-osumatietoja.
Käytännön esimerkkinä löysin Gedmatch raportista henkilön, joka oli autosomaalin osalta yhteisten jaksojen kokonaismitaltaan arvolla Shared 21.5cM, pisin yhtäjaksoinen arvolla Largest 10.4cM. Vastaavat lukemat X-DNA:n osalta 5.7cM ja 5.7cM. Onneksi kyseinen henkilö oli jakanut Gedcom -muotoisen sukupuutiedostonsa, jolloin kykenin tarkastelemaan hänen esipolviaan tuttujen ja mahdollisten X-osumien havaitsemiseksi. Tällaisen puusta löysinkin, henkilön joka löytyy myös aiemmin mainitusta luettelostani mahdollisista X-esivanhemmistani. Gedmatchista löytyneen sähköpostiosoitteen avulla selvitimme ja vahvistimme että tuosta arvelemastani esi-isästä johtaa molemmilla jälkeläisten polku joka täyttää kriteerin - ei kahta miestä peräkkäin. Näin sain vahvan varmistuksen sille, että kyseinen perinteisin menetelmin kirjattu sukujohto on paikkansa pitävä. Etenkin kun eräässä periytymiskohdassa oli hivenen tulkinnan varaisuutta.

E.m. raporttien arviot sukulaisuuden etäisyydestä osoittautuivat tässäkin tapauksessa kovin optimistiseksi arvion ollessa 5 sukupolvea. Tosiasiassa näin vahvistunut X-osuma oli 11 sukupolven etäisyydellä. On tosin vähintäänkin teoreettisesti mahdollista että sukupuistamme löytyy toinenkin linja. Kumpikaan sukulinja ei osoittautunut erityisesti isä-tytär tai äiti-tytär painotteiseksi, joka olisi vaikuttanut muuntumiseen määrään. Yleisesti ottaenhan on ollut havaittavissa, että nämä sukulaisuusarviot on arvioitu reippaasti todennettuja lähemmäksi..

Mielenkiintoista on ollut myös havaita X-osumia joiden julkistetuissa sukulinjoissa ei ole tuttuja nimiä ja asutusseudutkin ovat etäällä tunnetuista juuristani. X-perimä voi kantautua ajallisesti hyvinkin kaukaa ja nämä osumat voivat olla haikuja ajalta, joka ei ole kirjatun historian tavoitettavissa. Siten yhteisten esivanhempien yksilöiminen ei tietenkään ole mahdollista. Onko näillä viitteillä kaukaiseen historiaamme kuitenkin jotain kerrottavaa? Jään kuulolle ja jatkan aiheen opiskelua. Seuraavaksi Y67 isälinjan tuloksia tulkiten.

Linkkejä:keskiviikko 1. maaliskuuta 2017

Esi-isän DNA:ta etsimässä - osa II

Muutaman päivän vanhempana ja kenties viisaampana DNA-opin polulla edellisen, aihepiirin avanneen blogiartikkelini jälkeen, jatkan pohdintojen ja havaintojen kirjaamista.

Esittelemääni Family Finderin MyOrigin karttaan liittyen avasin keskustelua Suomi DNA-projektin FB-ryhmässä. Kiitettävän vilkasta keskustelua herättäneestä mielipiteenvaihdosta voitaneen tehdä päätelmä, että kyseisen kartan osoittama alue on varsin karkea, jota grafiikkaa pitää lukea globaalimmalla tasolla. Kuten Esko Ranta kommentoi: "perimäkomponentin "Finland and Northern Siberia" suurimman prosentuaalisen esiintyvyyden alue.
Sen informaatiotarkkuus riittänee paremmin jenkkisiirtolaisen sukujuurien kartoittamiseen, kuin hämäläisten erottamiseen savolaisista juurista.

Toinen kysymyksiä itselläni herättänyt seikka, josta myös avasin e.m. ryhmässä, liittyi FF n.k. serkkutestin datan tuottamaan raporttiin Gedmatch sivustolla. Are your parents related? 
Minimum threshold size to be included in total = 700 SNPs
Minimum segment cM to be included in total = 7.0 cM
No shared DNA segments found
No indication that your parents are related.


Perinteinen sukututkimus kuitenkin osoittaa vanhempieni olevan sekä 4. että 6. serkut, jotka johtavat heidän eri vanhempiensa linjoista.
Mistä sitten tulokset johtuivat? Onko esivanhemmissa jollakin eri isä kuin mitä kirjoihin on merkitty (äiti lienee varmempi tapaus)?
Keskustelun johdattamana asiaan löytyy selitys, jota myös viestiketjussa päädyin kommentoimaan seuraavasti:
Lueskeltuani Ftdnan Learning Centerin FAQ:ta olen mahdollisesti päässyt samaan ymmärryksen alkuun, johon Heikki Qvist ja Annika Smeds viittasivat:
"The more generations there are between you and your cousin’s common ancestor, the more possible it is that you and your cousin did not inherit the same segment of DNA from your common ancestor. Inheritance is a random process and you may find that you do not share a detectable amount of DNA with a known 4th cousin, yet that you do share some DNA with your 5th to 8th cousins." 
4.serkut siis jakavat keskimäärin 0,195% DNA:sta, joka on kuitenkin sattumanvaraista määrän ja kombinaatioiden suhteen. Siten on mahdollista että heidän yhteiset juurensa eivät paljastu FF-testissä.
Lapsen tuloksissa voi olla mätsejä joita ei hänen vanhemmiltaan löydetä.
Jos nyt vielä oikein tulkitsen Gedmatchin tuloksia vanhempieni välisestä sukulaisuussuhteesta, niin voidaan sanoa että ko tulokset voivat vahvistaa mutta eivät sulje pois tällaisen sukulaisuuden olemassaoloa
.
Edellä olevassa on siten huomionarvoinen seikka tulkittaessa FamilyFinderin tuottamaa tietoa.
Alla on esitetty taulukko, joka osoittaa keskimääräisesti yhteisen DNA:n periytymisen jälkipolvien ketjussa. (kuvaa klikkaamalla suuremmaksi)

(https://www.familytreedna.com/learn/autosomal-ancestry/universal-dna-matching/percentage-common-ancestors-dna-share-cousin/)
Yksinkertaistettuna FTDNA:n Family Finder testi eli n.s. serkkutesti tutkii autosomaalista DNA:ta, joka periytyy molemmilta vanhemmilta. Sukulaisuutta ja sukulaisuuden astetta kahden yksilön välillä ilmaistaan yhteisten geenisegmenttien yhteispituudella sekä pisimmällä yhtenäisellä segmentillä. Segmenttien pituutta ilmaistaan centimorgan -yksiköllä (cM). Saadusta arvosta voidaan karkeasti arvioida sukulaisuuden aste.
Henkilön näytteestä luettu geenidata ajetaan vertailua varten FTDNA:n (tai esim. Gedmatch'in) tietokantaan. Analyysin tuloksena saadaan taulukko jossa voidaan tarkastella näin saatuja yksilöiden välisiä yhteneväisyyksiä, eli "mätsejä".
Esim. omassa FTDNA:n Family Finder Matches taulukossani on yli 2000 testin tehnyttä henkilöä eri asteisina mätseinä. Suurimmat arvot ovat 143 cM yhteisten jaettujen segmenttien pituus sekä pisin yhtäjaksoinen segmentti 15 cM. Näillä arvoilla FTDNA arvioi olevamme 2-3 serkukset.
Sikäli kuin (ja ehdottoman toivottavasti) kyseinen mätsi on jakanut perinteisen sukupuunsa, paikka- ja nimiesiintymät sekä yhteystietonsa, voimme mahdolisesti selvittää yhteiset esivanhempamme.

http://blog.kittycooper.com/2015/05/new-dna-relationship-statistics-from-blaine-bettinger/
Taulukossa suuntaa antavia cM-lukemia eri sukulaisuuksien tasoilla.

Tämä selvä tältä erää ja toistaiseksi... siirryn tutkailemaan X-DNA:n maailmaa (ellei jokin muu kiinnostava vie huomion sitä ennen). Huhtikuussa Sukututkimusseuran Genomitiedon iltakouluun tietoa kartuttamaan...

Joitakin FTDNA:n linkkejä aiheeseen: