Question

dxy (Nei 1987) calculation

0

Entering edit mode

8.3 years ago

modernsynthesis ▴ 30

Is there any scripts out there that can calculate absolute divergence (dxy) between populations/species using many alignments of sequence data?

snp next-gen sequence alignment • 10k views

ADD COMMENT • link updated 20 months ago by Ram 43k • written 8.3 years ago by modernsynthesis ▴ 30

2

Entering edit mode

Could you give the right reference to the paper and possibly explain the terms in the equation?

ADD REPLY • link 8.3 years ago by dariober 14k

1

Entering edit mode

The equation is described in Box 1 in a recent Molecular Ecology paper by Cruickshank and Hahn (2014). Link to the open access paper: http://onlinelibrary.wiley.com/doi/10.1111/mec.12796/pdf.

ADD REPLY • link 8.2 years ago by modernsynthesis ▴ 30

0

Entering edit mode

Thanks, and I should have put this in my first comment: Do you have some example dataset to play with? (In general it's good to make life easier to those willing to answer questions...)

ADD REPLY • link 8.2 years ago by dariober 14k

0

Entering edit mode

Below are 3 example alignments

Locus1:

#NEXUS
begin data;
    dimensions ntax=2 nchar=460;
    format datatype=dna missing=? gap=-;
matrix
species1 ?????????????????????TAGTCCTTACACTGTAAAAAACTTTGGAATTGTTTGACCCTGTAAACACAAAATTCATGTCTCTCACCCTGGGACAAATACATTCTTTTTAAAAGCAGCATATGGGCAGCCTTGGACTGATGTTAGTTTATTGTCACTGCTTGATAACATTTAATGGAAAAGATACAAGAGTGCCAAAGAATTTTAATTATTTTTGTGATAAAGTTATATGTTCGGCCTTGAAAAAGTGGAGATAATGCTGGGATTCATTATTATTCCCAGTGTGTTTAAACAGACGACACAGAATGCAAACAAAAGCAGATGAAATTTGAAAAGTATTATCAATATT???????????????????????????????????????????????????????????????????????????????????????????????????????????????
species2 TGTGTGCATGCACAGATTTTTTAGTCCTTACACTGTAAAAAACTTTGGAATTGTTTGACCCTGTAAACACAAAATTCATGTCTCTCACCCTGGGACAAATACATTCTTTTTAAAAGCAGCATATGGGCAGCCTTGGACTGATGTTAGTTTATTGTCACTGCTTGATAACATTTAATGGAAAAGATACAAGAGTGCCAAAGAATTTTAATTATTTTTGTGATAAAGTTATATGTTCGGCCTTGAAAAAGTGGAGATAATGCTGGGATTCATTATTATTCCCAGTGTGTTTAAACAGACGACACAGAATGCAAACAAAAGCAGATGAAATTTGAAAAGTATTATCAATATTGCAGATAGCAGATGCCCTTTCCAATCAGAACAAGCATATCTTCTATAGCAACTTTATGGTTGAGTAGTTTATTCATTTCTATTAGAAGGTTGTACGTTTCTAAAATATGTA
;
end;

Locus2:

#NEXUS
begin data;
    dimensions ntax=2 nchar=582;
    format datatype=dna missing=? gap=-;
matrix
species1 ????????????????????????????????????????AACCACAATTGGTTGTCTGTTTTCTACTTTATGACATTTCCACTGAAAATTGTAATTCTTTTTTGCTGTGTTCTATTCCCCTTGTACGGAGTGTCCCCTTGGGAAGTGGGGCCCAAGAGCCCTTTCTAGGATGGGACAGGATATTACAGCTTGGTTTGTGCACCAGCATCCTTAATATTTCCTTCCTTTCAGAAGCAAATAGAGCGTACCCTTATCTGAATGCTAATTTCCTAGTTAAAACCCTCCCTTGCTGACAAGGGACTGAAAGAGTTTTAAATCACAGATGTAGAGTATCAAATGCAATAATGCTCTTGCAATAGTGCATTGAAGCCTCAATTAATTAACCCTTGGGCTAAGTAGGCAGGTACATGGTGGTGGCCACAGGCGGTGGATGGATGAGATTTAAATGGGCATCTCATTTCCTCA????????????????????????????????????????????????????????????????????????????????????????????????????????????????????
species2 ????????????????????????????TTCTGAAAAATAAACCACAATTGGTTGTCTGTTTTCTACTTTATGACATTTCCACTGAAAATTGTAATTCTTTTTTGCTGTGTTCTATTCCCCTTGTACGGAGTGTCCCCTTGGGAAGTGGGGCCCAAGAGCCCTTTCTAGGATGGGACAGGATATTACAGCTTGGTTTGTGCACCAGCATCCTTAATATTTCCTTCCTTTCAGAAGCAAATAGAGCGTACCCTTATCTGAATGCTAATTTCCTAGTTAAAACCCTCCCTTGCTGACAAGGGACTGAAAGAGTTTTAAATCACAGATGTAGAGTATCAAATGCAATAATGCTCTTGCAATAGTGCATTGAAGCCTCAATTAATTAACCCTTGGGCTAAGTAGGCAGGTACATGGTGGTGGCCACAGGCGGTGGATGGATGAGATTTAAATGGGCATCTCATTTCCTCAGCACGGAACATGCCGTTTGATTCAGAAAGGAGTCATTTTACACACTCGCCTCATTTACGCTCAGCTTTAATCCCTTTAATTCCACCTGAGATCCAAGCAAGAATGGGAAAAGAGAG
;
end;

Locus3:

#NEXUS
begin data;
    dimensions ntax=2 nchar=610;
    format datatype=dna missing=? gap=-;
matrix
species1 ?????TATGTCTTGGTCTAGACTGAAGCAGAAACTCCAGGTCAGACATATGGTGACTGAAAAAGTGCATGTTATTTATTCATATCTCTTAATGTGAAATGTGTATTTGAAGAGACTTAAAATCTCTGAAAGAGCCAATTACTCTCAGCTTTTTAATTCTAGCAATACATTTGGAACATTTTCATTGTTCTAAGGGTTAAAAACCTCACCGTGACAATGATGAGCCTTATTACTCAGTCAAAGTAAATGGATCACCATATAACCTTTCAGAAATGTTCTTCCTTAAGCTATTAAAACATTCCATGCCCTTAGATGACAACAATTTCTCTGCCTTTTGAAATTTCTTTTCTATCCTGCAGAGTTCATAGAGATATGCTTGGTTAAAATCAACTTATATAAAACTATGCACTGTAAATTCTGACACTTCTGTTTGAATCTCTTTTCAAACACTTGTCTTTGCTCACCATAATAGATGTCAGTTCTTCTGATGTAGTTCAAGCATGAGCTTCATATGAAGACTCAGCTATGTCTATTGCATTTCTGAAGCTACTACTCACTGAAGTTTTGTGCTGTTTGACATCAAAGATAGGCAAGAATCACCTGCTGAGTTC
species2 TAAGGTATGTCTTGGTCTAGACTGAAGCAGAAACTCCAGGTCAGACATATGGTGACTGAAAAAGTGCATGTTATTTATTCATATCTCTTAATGTGAAATGTGTATTTGAAGAGACTTAAAATCTCTGAAAGAGCCAATTACTCTCAGCTTTTTAATTCTAGCAATACATTTGGAACATTTTCATTGTTCTAAGGGTTAAAAACCTCACCGTGACAATGATGAGCCTTATTACTCAGTCAAAGTAAATGGATCACCATATAACCTTTCAGAAATGTTCTTCCTTAAGCTATTAAAACATTCCATGCCCTTAGATGACAACAATTTCTCTGCCTTTTGAAATTTCTTTTCTATCCTGCAGAGTTCATAGAGATATGCTTGGTTAAAATCAACTTATATAAAACTATGCACTGTAAATTCTGACACTTCTGTTTGAATCTCTTTTCAAACACTTGTCTTTGCTCACCATAATAGATGTCAGTTCTTCTGATGTAGTTCAAGCATGAGCTTCATATGAAGACTCAGCTATGTCTATTGCATTTCTGAAGCTACTACTCACTGAAGTTTTGTGCTGTTTGACATCAAAGATAGGCAAGAATCACCTGCTGAGTTC
;
end;

ADD REPLY • link updated 4.3 years ago by Ram 43k • written 8.2 years ago by modernsynthesis ▴ 30

2

Entering edit mode

I've implemented PI, which is very similar to dxy. https://github.com/zeeev/popFastaaa

If more people express interest I will implement dxy.

ADD REPLY • link updated 4.3 years ago by Ram 43k • written 8.2 years ago by Zev.Kronenberg 12k

score 0 · Answer 1 · 2016-03-27

0

Entering edit mode

8.1 years ago

polcarel • 0

Hi... Back to the question above, how to calculate window-based Dxy between two populations given a set of genomewide SNP dataset using R? I am still at the early stage in R or perl.

Many thanks in advance.

ADD COMMENT • link 8.1 years ago by polcarel • 0

0

Entering edit mode

Homework? Why use R?

ADD REPLY • link 8.1 years ago by Adrian Pelin ★ 2.6k

0

Entering edit mode

I guess R would be the fastest way to do this...By the way, I eventually managed to calculate windows of 10kb nucleotide diversities (pi, π) for each population πx and πy. This may be another silly question, can I use these π values to estimate the Dxy between the two populations?

ADD REPLY • link 8.1 years ago by polcarel • 0

score 0 · Answer 2 · 2020-02-20

0

Entering edit mode

4.2 years ago

beausoleilmo ▴ 580

In this paper, there is a link to their supplementary material. Within, these is a genomescan_dxy.pl.

I'm not understanding Perl enough to be able to read and interpret what is happening, but that could be one way of doing it.

ADD COMMENT • link 4.2 years ago by beausoleilmo ▴ 580