intestazione

Indietro Processo di controllo della qualità dei dati

Il database EUROCARE-6 
Per lo studio EUROCARE-6 117 registri tumori in 31 Paesi europei hanno inviato dati relativi ai pazienti diagnosticati dal 1978 al 2013 e seguiti fino al 31 dicembre 2014. I dati riguardavano tutti i tumori invasivi primari maligni (esclusi i tumori della pelle non  melanomatosi), i tumori benigni del sistema nervoso centrale e i tumori non invasivi della vescica urinaria. 

I registri hanno trasmesso i dati tramite il portale ENCR-JRC. I file di incidenza (e stato in vita),  life-tables e popolazione residente sono stati controllati e caricati nel database dello studio EUROCARE-6.   

Standardizzazione dei dati 
Prima di essere importati nel database, i file sono stati standardizzati in modo da avere la stessa struttura per tutti i registri.  

Le procedure di conversione e standardizzazione hanno riguardato: 

  • l'imputazione delle date mancanti: giorni, mesi (nascita, incidenza, follow-up) utilizzando algoritmi specifici (si veda l'Appendice 1 per i dettagli) 
  • l’imputazione della terza cifra (ICDO-3) della topografia nei casi in cui il codice della sottosede non è previsto (es. prostata C61 C61.9, rene C64 C64.9)  
  • la standardizzazione dello stadio alla diagnosi: le informazioni relative al TNM sono state standardizzate con tabelle di transcodifica specifiche basate sulle diverse edizioni delle classificazioni TNM. Lo stadio aggregato e lo stadio secondo la classificazione Ann Arbor sono stati resi uniformi  

Controlli sui dati 
I controlli di qualità applicati ai record individuali di incidenza originali sono stati finalizzati a verificare la conformità con i requisiti del protocollo dello studio e identificare errori sistematici o occasionali.  

I controlli di qualità sono stati armonizzati con i controlli di qualità dei dati ENCR-JRC (Martos C, 2018 A proposal on cancer data quality checks-one common procedure for European cancer registries 1.1) e sono stati integrati con i criteri specifici per l'analisi dei dati di sopravvivenza sviluppati da EUROCARE. Sono state applicate procedure di controllo automatizzate e la qualità dei dati è stata valutata in tre diverse fasi: 

  • La fase I che comprende i controlli per valutare l'aderenza formale al protocollo di raccolta dei dati e la validità globale dei dati di incidenza. I controlli consistono nel verificare l'intervallo valido dei valori e il formato di ciascuna variabile (controlli verticali)  
  • La fase II comprende controlli che valutano la coerenza tra variabili diverse dello stesso paziente, al fine di valutare la validità del singolo record. Questi controlli permettono di individuare errori e anomalie riguardanti variabili obbligatorie o facoltative (controlli orizzontali) 

Questi controlli verificano la coerenza delle combinazioni di due o più campi: 

  • Coerenza tra date di nascita, diagnosi e follow-up 
  • Coerenza delle combinazioni sede-morfologia. Sono stati applicati i criteri standard IARC, descritti nel IARC Technical report n. 42 , e gli additional EUROCARE criteria
  • Coerenza delle combinazioni età-sede, età-morfologia, sesso-sede e sesso-morfologia. Le combinazioni improbabili sono state controllate rispetto ai criteri IARC 
  • Coerenza delle combinazioni morfologia-comportamento. Le combinazioni non elencate nella classificazione ICD-O-3 sono state segnalate come improbabili 
  • Coerenza delle informazioni sullo stadio (EOD e TNM, EOD e TNM condensato, TNM e TNM condensato, sito e EOD, comportamento e stadio, numero di nodi metastatici e stadio) 

La maggior parte delle incongruenze tra le combinazioni dei campi sono state classificate come “warnings”, il che significa errore possibile ma non certo. La Table 1 mostra l'elenco completo degli errori e delle segnalazioni di possibile errore generati dalle procedure di controllo di EUROCARE-6. 

  • La fase III comprende analisi statistiche preliminari di incidenza e  sopravvivenza specifiche per registro, al fine di ricavare indicatori standard sull'accuratezza e completezza delle informazioni fornite, con particolare attenzione alla qualità dei dati di follow-up, cruciali per la stima della sopravvivenza e della prevalenza

Revisione degli errori e delle incongruenze da parte dei registri 
Errori sistematici in una o più variabili hanno richiesto la revisione dei registri e la risottomissione dell'intero insieme dei dati. Talvolta i problemi relativi alla Fase I (adesione formale al protocollo di studio) sono stati risolti con una semplice ricodifica delle variabili su indicazione dei registri. Errori gravi in alcuni record di pazienti specifici (valori incoerenti o non validi nelle variabili fondamentali obbligatorie) sono stati segnalati ai registri per la loro revisione e l'eventuale correzione (che implica la risottomissione dei record corretti).  

Al termine del processo di controllo della qualità e di standardizzazione dei dati, a ciascun record del paziente è stato associato un codice di validità per poter creare un set di dati privo di errori. 


Progetto Eurocare

EUROCARE-6