Il database EUROCARE-5
Tutti i file con i dati di incidenza e di follow-up pervenuti entro giugno 2011 sono stati controllati e caricati nel database di EUROCARE-5. I file sono stati trasmessi attraverso il gateway IARC o tramite upload direttamente sul portale web di EUROCARE o con entrambi i mezzi. Il database include informazioni su oltre 20 milioni di casi di cancro diagnosticati dal 1978 al 2007 in 30 Paesi europei.
Standardizzazione dei dati
Prima di essere importati nel sistema di gestione, i dati sono stati standardizzati per avere la stessa struttura dei record per tutti i registri. Ad esempio, il campo stato in vita doveva essere derivato da tre campi inclusi nel protocollo IARC (base della diagnosi, stato in vita e autopsia). L'informazione sul giorno della data è stata imputata per i registri che non la fornivano ed è stata calcolata tramite la durata del follow-up in giorni (si veda Appendice 1 per i dettagli). La topografia e la morfologia sono state convertite nel sistema di codifica ICDO-3 per i pochissimi registri che hanno fornito i dati secondo i sistemi ICD-9, ICD-10 o ICDO-2.
Controlli dei dati
Tramite procedure automatizzate sono stati controllati i campi in ogni record, compresi i casi benigni e in situ e quelli diagnosticati prima dell'attuale periodo di studio (2000-2007).
La Tabella 1 mostra l'elenco completo degli errori e dei warnings generati dalle procedure di controllo di EUROCARE-5. A ogni tipo di errore/warning è associato un codice di errore specifico.
La coerenza di ciascuna variabile è stata verificata confrontandola con l'intervallo di validità indicato nel protocollo EUROCARE-5. I codici di topografia e morfologia sono stati controllati rispetto alle liste della classificazione ICD-O-3. I valori fuori range sono stati considerati errori.
È stata inoltre verificata la coerenza delle combinazioni di due o più campi:
- Coerenza tra le date di nascita, di diagnosi e di follow-up
- Coerenza delle combinazioni sito-morfologia. Sono stati applicati i criteri standard IARC, descritti in IARC Technical report n. 42, integrati da additional EUROCARE criteria
- Coerenza delle combinazioni età-sito, età-morfologia, sesso-sito e sesso-morfologia. Le combinazioni improbabili sono state controllate rispetto ai criteri IARC
- Coerenza delle combinazioni morfologia-comportamento. Le combinazioni non elencate nella classificazione ICD-O-3 sono state segnalate come improbabili
- Coerenza delle informazioni sullo stadio (EOD e TNM, EOD e TNM condensato, TNM e TNM condensato, sito e EOD, comportamento e stadio, numero di nodi metastatici e stadio)
La maggior parte delle incongruenze tra le combinazioni dei campi sono state classificate come warning, il che significa errore possibile ma non certo. Le incongruenze sulle informazioni relative allo stadio sono state in generale classificate come errori (vedi Tabella 1).
Revisione degli errori e delle incongruenze da parte dei registri
I record segnalati dal processo di controllo dei dati vengono inviati ai registri per un'ulteriore revisione e correzione. La revisione dei singoli record non è stata richiesta per tutti i record o per gli avvisi, a seconda di diversi criteri come la presenza di una verifica microscopica (i non Verificati Microscopicamente sono inviati più frequentemente), il comportamento (i non maligni non sono in genere inviati), l'età (alcuni tumori infantili sono accettati anche per gli adolescenti e i giovani adulti) e la frequenza con cui un dato problema viene riscontrato in un file di registro. Inoltre, quando possibile, le correzioni sono state recuperate dalle revisioni già fornite in EUROCARE-4.