Subtopic Deep Dive

Hospital Discharge Data Quality Assessment
Research Guide

What is Hospital Discharge Data Quality Assessment?

Hospital Discharge Data Quality Assessment evaluates the completeness, validity, validity, accuracy, and timeliness of administrative discharge abstracts using ICD coding to support epidemiological and health services research.

Researchers assess data quality through linkage with clinical registries and gold-standard chart reviews to compute metrics like positive predictive value (PPV) and sensitivity. Key methods include validating comorbidity indices such as Charlson and Deyo adaptations across ICD-9 and ICD-10. Over 10 major papers from 1991-2014, with Deyo (1992) cited 10,415 times and Quan et al. (2011) 5,553 times, establish benchmarks for international comparisons.

Curated Papers

Key Challenges

Why It Matters

High-quality discharge data enables reliable prevalence estimates, as in Hux et al. (2002) linking claims and abstracts for diabetes in Ontario (1,258 citations). Validated comorbidity scores from Quan et al. (2011) support risk adjustment in 6 countries for policy and outcomes research. Weiskopf and Weng (2012) highlight standardized dimensions—completeness, correctness, concordance, plausibility—for EHR reuse in clinical trials (1,120 citations), preventing biased epidemiology and resource allocation.

Key Research Challenges

ICD Coding Validity Variability

PPV for Charlson conditions varies by jurisdiction and coding incentives, reaching 98% in Danish registry (Thygesen et al., 2011; 1,170 citations) but lower elsewhere. Financial pressures distort secondary diagnoses (O'Malley et al., 2005; 1,081 citations). Multi-country validation reveals inconsistencies (Quan et al., 2008; 875 citations).

Comorbidity Index Adaptation

Original Charlson index requires updates for ICD-10 and modern treatments, as shown in Quan et al. (2011; 5,553 citations) across 6 countries. Pediatric adaptations face technology dependence coding gaps (Feudtner et al., 2014; 1,641 citations). Claims data confounder control demands score recalibration (Schneeweiss, 2001; 712 citations).

Linkage and Gold Standard Access

Linking abstracts to registries provides ground truth but faces privacy barriers and incomplete capture. Hux et al. (2002) demonstrate diabetes prevalence gains from physician-hospital linkage. Weiskopf and Weng (2012) note absent systematic methods hinder generalizability.

Essential Papers

Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases

Richard A. Deyo · 1992 · Journal of Clinical Epidemiology · 10.4K citations

Updating and Validating the Charlson Comorbidity Index and Score for Risk Adjustment in Hospital Discharge Abstracts Using Data From 6 Countries

Hude Quan, Bing Li, Chantal Marie Couris et al. · 2011 · American Journal of Epidemiology · 5.6K citations

With advances in the effectiveness of treatment and disease management, the contribution of chronic comorbid diseases (comorbidities) found within the Charlson comorbidity index to mortality is lik...

Pediatric complex chronic conditions classification system version 2: updated for ICD-10 and complex medical technology dependence and transplantation

Chris Feudtner, James A. Feinstein, Wenjun Zhong et al. · 2014 · BMC Pediatrics · 1.6K citations

Diabetes in Ontario

Janet E. Hux, Frank Ivis, Virginia Flintoft et al. · 2002 · Diabetes Care · 1.3K citations

OBJECTIVE—Accurate information about the magnitude and distribution of diabetes can inform policy and support health care evaluation. We linked physician service claims (PSCs) and hospital discharg...

The predictive value of ICD-10 diagnostic coding used to assess Charlson comorbidity index conditions in the population-based Danish National Registry of Patients

Sandra Kruchov Thygesen, Christian Fynbo Christiansen, Steffen Christensen et al. · 2011 · BMC Medical Research Methodology · 1.2K citations

The PPV of NRP coding of the Charlson conditions was consistently high.

Methods and dimensions of electronic health record data quality assessment: enabling reuse for clinical research

Nicole G. Weiskopf, Chunhua Weng · 2012 · Journal of the American Medical Informatics Association · 1.1K citations

There is currently little consistency or potential generalizability in the methods used to assess EHR data quality. If the reuse of EHR data for clinical research is to become accepted, researchers...

Measuring Diagnoses: ICD Code Accuracy

Kimberly J. OʼMalley, Karon F. Cook, Matt D. Price et al. · 2005 · Health Services Research · 1.1K citations

Objective. To examine potential sources of errors at each step of the described inpatient International Classification of Diseases (ICD) coding process. Data Sources/Study Setting. The use of disea...

Reading Guide

Foundational Papers

Start with Deyo (1992) for ICD-9 comorbidity adaptation (10,415 cites), then Quan et al. (2011) for multi-country ICD-10 validation (5,553 cites), followed by O'Malley et al. (2005) for coding error sources (1,081 cites).

Recent Advances

Feudtner et al. (2014) updates pediatric ICD-10 conditions (1,641 cites); Weiskopf and Weng (2012) defines quality dimensions (1,120 cites); Quan et al. (2008) compares ICD-9/10 validity (875 cites).

Core Methods

Positive predictive value via chart review (Thygesen 2011); sensitivity from claims linkage (Hux 2002); risk score recalibration (Schneeweiss 2001); four dimensions—completeness, correctness, concordance, plausibility (Weiskopf 2012).

How PapersFlow Helps You Research Hospital Discharge Data Quality Assessment

Discover & Search

Research Agent uses citationGraph on Deyo (1992) to map 10,000+ citing works on ICD-9 adaptations, then findSimilarPapers for Quan et al. (2011) multi-country validations. exaSearch queries 'hospital discharge abstract PPV Charlson ICD-10' to uncover jurisdiction-specific studies like Thygesen et al. (2011). searchPapers with filters for Health Services Research journal yields O'Malley et al. (2005) coding process analysis.

Analyze & Verify

Analysis Agent runs readPaperContent on Quan et al. (2011) to extract PPV tables by country, then verifyResponse with CoVe against Thygesen et al. (2011) Danish benchmarks. runPythonAnalysis loads citation counts into pandas for correlation plots between publication year and PPV trends. GRADE grading scores Weiskopf and Weng (2012) methods as high-evidence for data quality dimensions.

Synthesize & Write

Synthesis Agent detects gaps in pediatric discharge coding via Feudtner et al. (2014), flagging ICD-10 transplant omissions. Writing Agent applies latexEditText to revise comorbidity validation sections, latexSyncCitations for 20+ papers, and latexCompile for camera-ready manuscript. exportMermaid generates flowcharts of validation workflows from O'Malley et al. (2005).

Use Cases

"Compute sensitivity of ICD-10 diabetes codes in hospital discharges vs. registry data"

Research Agent → searchPapers 'diabetes validation hospital discharge' → Analysis Agent → runPythonAnalysis (pandas contingency tables on Hux 2002 extracted data) → CSV export of PPV/sensitivity metrics.

"What are current gaps in Charlson index for US hospital abstracts?"

Synthesis Agent → gap detection across Quan 2011 + Deyo 1992 → Writing Agent → latexEditText manuscript draft → latexSyncCitations (10 papers) → latexCompile PDF with methods critique.

"Find R code for discharge data PPV calculation from recent papers"

Research Agent → paperExtractUrls 'PPV calculation hospital discharge' → Code Discovery → paperFindGithubRepo → githubRepoInspect → runPythonAnalysis to test extracted scripts on sample ICD data.

Automated Workflows

Deep Research conducts systematic review: searchPapers (50+ ICD validation papers) → citationGraph clustering → GRADE synthesis report on PPV trends. DeepScan applies 7-step analysis to Weiskopf (2012): readPaperContent → CoVe verification → Python contingency stats. Theorizer generates hypotheses on incentive-driven coding biases from O'Malley (2005) + Quan (2008).

Try Doxa for Hospital Discharge Data Quality Assessment Research

Frequently Asked Questions

What defines hospital discharge data quality assessment?

Evaluation of completeness, validity (PPV/sensitivity), concordance, plausibility, and timeliness in ICD-coded abstracts versus clinical truth, per Weiskopf and Weng (2012).

What are core methods for assessment?

Chart abstraction for gold standards, registry linkage, and comorbidity index validation like Deyo (1992) ICD-9 adaptation and Quan et al. (2011) ICD-10 updates.

What are key papers?

Deyo (1992; 10,415 cites) for ICD-9 comorbidity; Quan et al. (2011; 5,553 cites) for international Charlson validation; Thygesen et al. (2011; 1,170 cites) for Danish PPV.

What open problems remain?

Standardizing metrics across jurisdictions, handling coder incentives (O'Malley 2005), and adapting indices for pediatric/tech-dependent cases (Feudtner 2014).