DP and DP at site do not match using only 1 sample in VCF
1
0
Entering edit mode
5.5 years ago
ajuiwl ▴ 30

I only used 1 sample with BWA and GATK4 germinal variants. The final VCF has variants like this:

1       230451938       .       G       A       18.25   PASS    AC=1;AF=0.500;AN=2;BaseQRankSum=0.967;ClippingRankSum=0.00;DP=20;ExcessHet=3.0103;FS=4.771;MLEAC=1;MLEAF=0.500;MQ=60.00;MQRankSum=0.00;QD=6.08;SOR=2.225 GT:AD:DP:GQ:PGT:PID:PL  0/1:1,2:3:10:0|1:230451938_G_A:46,0,10

How is it possible that both DP are not the same if I am using one sample?

This is the BAM by samtools tview. The position #230451938 is the first one.

  230451941 230451951 230451961 230451971
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
A      CATACATATGTACACATGTGTATATGTGTATACATACATATGTG
ATGTGT     catatgtacacatgtgtatatgtgtatacatacatatgtg
GTGTATACATA   ATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTAC     TGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACA    TGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGT        ATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATG       atacatatgtg
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
gtgtatacatacatatgtacacatgtgtatatgtgtatacatacatatgtg
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
gtgtatacatacatatgtacacatgtgtatatgtgtatacatacatatgtg
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
VCF variant calling GATK • 1.1k views
ADD COMMENT
1
Entering edit mode
5.5 years ago

Hello ajuiwl ,

AFAIK the DP in the INFO column represents the total number if reads covering the site excluding those that are below a given quality treshold (like mapping quality). The DP in the Sample column is the total number of reads that support the genotypes that were called. GATK's HaplotypeCaller discards the mapping/alignment informations for the reads around the variant and do a denovo assembly for this region. After that it looks which haplotype is the most likely and will report the number of reads that build that haplotype. So there can be a discrepance between these two DP values.

fin swimmer

ADD COMMENT

Login before adding your answer.

Traffic: 2670 users visited in the last hour
Help About
FAQ
Access RSS
API
Stats

Use of this site constitutes acceptance of our User Agreement and Privacy Policy.

Powered by the version 2.3.6