Email updates

Keep up to date with the latest news and content from IJHG and BioMed Central.

Open Access Methodology

Spatial heterogeneity of type I error for local cluster detection tests

Aline Guttmann12*, Xinran Li2, Jean Gaudart34, Yan Gérard2, Jacques Demongeot5, Jean-Yves Boire12 and Lemlih Ouchchane12

Author Affiliations

1 Department of Biostatistics, Medical Informatics and Communication Technologies, Clermont University Hospital, Clermont-Ferrand F-63000, France

2 UMR CNRS UDA 6284 ISIT, Auvergne University, Clermont-Ferrand F-63001, France

3 UMR 912 SESSTIM (INSERM IRD AMU), Aix-Marseille University, Marseille F-13005, France

4 Assistance Publique Hôpitaux de Marseille, Biostatistic and Modelisation, Marseille F-13005, France

5 La Tronche University School of Medicine, FRE CNRS 3405 AGIM, J. Fourier University, Saint-Martin-d’Hères F-38700, France

For all author emails, please log on.

International Journal of Health Geographics 2014, 13:15  doi:10.1186/1476-072X-13-15

Published: 27 May 2014

Abstract

Background

Just as power, type I error of cluster detection tests (CDTs) should be spatially assessed. Indeed, CDTs’ type I error and power have both a spatial component as CDTs both detect and locate clusters. In the case of type I error, the spatial distribution of wrongly detected clusters (WDCs) can be particularly affected by edge effect. This simulation study aims to describe the spatial distribution of WDCs and to confirm and quantify the presence of edge effect.

Methods

A simulation of 40 000 datasets has been performed under the null hypothesis of risk homogeneity. The simulation design used realistic parameters from survey data on birth defects, and in particular, two baseline risks. The simulated datasets were analyzed using the Kulldorff’s spatial scan as a commonly used test whose behavior is otherwise well known. To describe the spatial distribution of type I error, we defined the participation rate for each spatial unit of the region. We used this indicator in a new statistical test proposed to confirm, as well as quantify, the edge effect.

Results

The predefined type I error of 5% was respected for both baseline risks. Results showed strong edge effect in participation rates, with a descending gradient from center to edge, and WDCs more often centrally situated.

Conclusions

In routine analysis of real data, clusters on the edge of the region should be carefully considered as they rarely occur when there is no cluster. Further work is needed to combine results from power studies with this work in order to optimize CDTs performance.

Keywords:
Cluster detection test; Type I error; Simulation study; Edge effect; Spatial scan

Résumé

Contexte

Les tests de détection de clusters (CDT) permettent à la fois de détecter et de localiser les clusters. Au même titre que pour la puissance, il est donc nécessaire d’étudier la répartition spatiale de l’erreur de type I de ces CDT. Dans le cas de l’erreur de type I, la répartition spatiale des clusters détectés à tort (WDC) peut être particulièrement concernée par un effet de bord. Cette étude de simulation a pour objectif de décrire la distribution spatiale des WDCs et de confirmer et quantifier la présence de cet effet de bord.

Méthodes

Ce travail s’appuie sur la synthèse de 40 000 jeux de données simulant l’hypothèse nulle d’homogénéité spatiale des risques. Les simulations étaient fondées sur les paramètres réels de données d’un registre de malformations congénitales, et notamment sur deux risques de base réels. La description de la distribution spatiale de l’erreur de type I nous a conduits à définir le concept de taux de participation de chaque unité spatiale de la région. Cet indicateur a ensuite été intégré pour la construction d’un nouveau test statistique destiné à confirmer et quantifier l’effet de bord.

Résultats

La valeur globale de l’erreur de type I à 5% a bien été retrouvée. Les résultats montraient un très net effet de bord avec un gradient décroissant du taux de participation depuis le centre vers le bord, les WDC étant plus souvent situés en zone centrale.

Conclusions

Lors de la mise en œuvre des CDT sur données réelles, les détections de clusters près du bord d’une région d’étude doivent être examinées avec la plus grande attention, ces dernières étant très rares en l’absence de cluster réel. Il est maintenant nécessaire d’orienter de futurs développements vers la combinaison de ces résultats à ceux des études de puissance, et ce dans le but d’optimiser les performances des CDT.