Texto originariamente publicado en Mad In America (15 de abril de 2017)
La revista médica con sede en el Reino Unido, Lancet Psychiatry, ha publicado recientemente un estudio titulado “Diferencias en el volumen cerebral subcortical en sujetos con Trastorno por Déficit de Atención con Hiperactividad (TDAH) en niños y adultos: Un mega-análisis transversal” (Subcortical brain volume differences in participants with attention deficit hyperactivity disorder in children and adults: A cross-sectional mega-analysis). Según el informe, que cuenta con 82 autores, el estudio facilita pruebas definitivas de que las personas con TDAH tienen sus cerebros alterados, son más pequeños. Pero como se deduce de la siguiente revisión detallada, el estudio está muy lejos de probar esas afirmaciones.
Diferencias en el volumen cerebral subcortical en los participantes con trastorno por déficit de atención con hiperactividad (TDAH) en niños y adultos: Un mega-análisis transversal (Subcortical brain volume differences in participants with attention deficit hyperactivity disorder in children and adults: A cross-sectional mega-analysis)
Hoogman M, Bralten J, Hibar DP, Mennes M, Zwiers MP, Schweren LSJ, et al. The Lancet Psychiatry, 15 de febrero de 2017 Traducción del abstract recogido de Fundación FEMEBA Resumen Antecedentes: los estudios de neuroimagen han mostrado alteraciones estructurales en varias regiones cerebrales en niños y adultos con trastorno por déficit de atención con hiperactividad (TDAH). A través de la formación del grupo de trabajo internacional ENIGMA ADHD, tuvimos como objetivo abordar las debilidades de los estudios y metanálisis anteriores de estudios de imágenes, a saber, el tamaño inadecuado de la muestra y la heterogeneidad metodológica. Nuestro objetivo fue investigar si existen diferencias estructurales en niños y adultos con TDAH en comparación con aquellos sin este diagnóstico. Métodos: en este mega-análisis transversal, se utilizaron los datos de la colaboración internacional del Grupo de Trabajo ENIGMA, que en el presente análisis se congeló el 8 de febrero de 2015. Cada sitio individual analizó las secuencias T1 de las resonancias magnéticas de cerebro utilizando un protocolo armonizado, comparando individuos con TDAH con aquellos que no tienen este diagnóstico. Nuestro resultado primario fue evaluar las diferencias entre casos y controles de las estructuras subcorticales y el volumen intracraneal a través de la agrupación de todos los datos individuales de todas las cohortes en esta colaboración. Para este análisis, los valores de p fueron significativos con el umbral corregido por la tasa de falsos descubrimientos de p = 0,0156. Resultados: nuestra muestra comprendía 1713 participantes con TDAH y 1529 controles de 23 sitios con una edad media de 14 años (rango 4-63 años). Los volúmenes de los núcleos accumbens (d = -0,15 de Cohen), amígdala (d = -0,19), caudado (d = -0,11), hipocampo (d = -0,11), putamen (d = 0,14), y el volumen intracraneal (d = -0,10) fueron menores en los individuos con TDAH en comparación con los controles. No hubo diferencias en el tamaño del volumen en pallidum (p = 0,95) ni tálamo (p = 0,39) entre las personas con TDAH y los controles. El modelado exploratorio de los cambios a lo largo de la vida sugirió un retraso en la maduración y un retraso de la degeneración, ya que los tamaños de efecto fueron más altos en la mayoría de los subgrupos de niños (<15 años) que en los adultos (> 21 años): en los accumbens (Cohen d = -0,19 vs -0,10), amígdala (d = -0,18 vs -0,14), caudado (d = -0,13 vs -0,07), hipocampo (d = -0,12 vs -0,06), putamen (d = -0,18 vs -0,08), y volumen intracraneal (d = -0,14 vs 0, 01). No hubo diferencia entre niños y adultos para el pallidum (p = 0,79) o el tálamo (p = 0,89). Las diferencias entre los casos y los controles en los adultos fueron no significativas (todos p> 0,03). El uso de fármacos psicoestimulantes (todos p> 0,15) o las puntuaciones de los síntomas (p> 0,02) no influyeron en los resultados, ni la presencia de trastornos psiquiátricos comórbidos (p> 0, 5). Interpretación: con el mayor conjunto de datos reunidos hasta la fecha, añadimos nuevos conocimientos sobre reducciones bilaterales en el volumen de la amígdala, núcleo accumbens, e hipocampo en el TDAH. Se extiende la teoría del retardo de maduración cerebral para TDAH para incluir las estructuras subcorticales y refutar los efectos de la medicación sobre el volumen cerebral sugerido por meta-análisis anteriores. Los análisis a lo largo de la vida sugieren que, en ausencia de estudios longitudinales con suficiente poder, la muestra transversal ENIGMA que incluye seis décadas de edades proporciona un medio para generar hipótesis sobre las trayectorias de vida en los fenotipos cerebrales. Financiación: Institutos Nacionales de Salud. |
El estudio está afectado de graves deficiencias metodológicas, ausencia de datos, y contiene errores y omisiones estadísticas. La conclusión de que los individuos con TDAH tienen los cerebros más pequeños es desmentida mediante el cálculo del «tamaño del efecto» que pone de relieve que los volúmenes cerebrales individuales en el TDAH y en las cohortes de control se solapan ampliamente. Los autores tampoco discuten el hecho de que la cohorte con TDAH tuvo puntuaciones de CI más altas. (Consultar la actualización del editor al final del artículo sobre los datos de CI).
A pesar de estos errores científicos, el estudio dio pie a titulares en muchos países de todo el mundo. Yahoo News sugirió que el estudio «probaba la realidad» del TDAH. Lancet Psychiatry debe retirar inmediatamente la publicación del estudio y los medios han de redactar nuevos titulares que informen a los clínicos y a los padres de los verdaderos resultados de este estudio, incluyendo los datos del CI.
Lo qué defiende el estudio y sus titulares
En el estudio, Martine Hoogman y sus 81 co-autores realizaron un análisis secundario mediante datos de escáneres MRI usados para medir los volúmenes cerebrales en 1713 pacientes diagnosticados de TDAH y 1.529 individuos sin este diagnóstico. Estos datos se recogieron en 23 centros de todo el mundo. Los autores escribieron que su estudio «utilizando el conjunto de datos más grande hasta la fecha» documentaba que «los volúmenes del núcleo accumbens, la amígdala, el caudado, el hipocampo, el putamen, y el volumen intracraneal eran más pequeños en los individuos con TDAH al ser comparados con los controles» (p.1).
Hay muchas declaraciones similares en el artículo que afirman que este estudio proporciona pruebas de que los volúmenes cerebrales más pequeños son característicos de los individuos con un diagnóstico de TDAH. En su análisis, los autores también declararon que investigaron la exposición de la cohorte con TDAH a la medicación estimulante y comprobaron que los fármacos no desempeñaban ningún papel como posible causa de los volúmenes más pequeños. «Nosotros… desmentimos los efectos de la medicación sobre el volumen cerebral como se ha sugerido en meta-análisis previos», escribieron (p.1).
Se trata de un estudio internacional extenso, financiado por los Institutos Nacionales de Salud. Sus resultados, concluyen los autores, contienen mensajes importantes para los clínicos: «Los datos de nuestro análisis de gran potencia confirman que los pacientes con TDAH tienen alteraciones cerebrales y por lo tanto que el TDAH es un trastorno cerebral. Es un mensaje claro que los médicos han de transmitir a los padres y a los pacientes, lo que puede ayudar a reducir el estigma de que el TDAH es sólo una etiqueta para niños difíciles, y causado por la incompetencia de los padres. Esperamos que este trabajo contribuya a que el público en general entienda mejor el TDAH» (p.7).
Los comunicados de prensa enviados a los medios de comunicación reflejaban las conclusiones del artículo y los titulares de los medios de comunicación, a su vez, resumieron con precisión los comunicados de prensa. He aquí una muestra de los titulares [Ver nota 2, al final del texto]:
The Telegraph
“El TDAH es un trastorno cerebral, no una etiqueta para padres incompetentes, dicen los científicos” Henry Bodkin, el 16 de Febrero de 2017 |
Newsweek
“El estudio halla que el cerebro de quienes padecen TDAH es más pequeño”
Conor Gaffey, el 16 de Febrero de 2017 |
WebMD
“El estudio con imágenes confirma diferencias en el cerebro de las personas con TDAH” Robert Preidt, el 15 de Febrero de 2017 |
CNN
“El cerebro de quienes tienen TDAH muestra estructuras mas pequeñas asociadas a la emoción” Susan Scutti, el 15 de Febrero de 2017 |
Al unísono, las declaraciones de los autores y los titulares de los medios de comunicación crean un mensaje público poderoso. Ahora los padres de los niños con este diagnóstico creerán que sus niños tienen algo estropeado en el cerebro. Los propios niños pensarán que esto es cierto, y este «conocimiento» definirá aún más su auto-percepción. Aunque Hoogman y sus colegas afirmaban que este conocimiento «hará disminuir el estigma del TDAH», resulta más probable que sea cierto lo contrario: que aumente el estigma, ya que lo que se dice al público es que el niño diagnosticado con TDAH no es un niño normal. El estudio implica que los niños con TDAH sufren de un «cerebro deficitario» imperfecto, y que esto es cierto en todos y cada uno de los niños cada niño que tiene este diagnóstico.
Dadas las implicaciones de las afirmaciones de este estudio, merece que se analice en detalle. ¿Apoya el estudio la conclusión de que los niños y adultos con TDAH tienen un «cerebro alterado», como lo demuestra el menor volumen de diferentes regiones cerebrales? ¿Han presentado los autores datos que de forma convincente «refuten» los estudios previos que sugieren que la exposición a los medicamentos podría ser una causa de los volúmenes cerebrales más pequeños?
Para iniciar esta revisión, comenzaremos con un hallazgo sorprendente, escondido en un lugar inusual, en el apéndice del estudio. Y entonces podremos imaginar cómo podrían haber sido los titulares de los medios de comunicación si los autores se hubieran centrado en estos datos.
Titular alternativo: ¡Un amplio estudio desvela que los niños con TDAH tienen coeficientes de inteligencia más altos!
Para descubrir este hallazgo, hay que gastar 31,50 $ en comprar el artículo y después realizar una solicitud especial a Lancet Psychiatry para que se le envíe el apéndice. Seguidamente, descubrirá, en las páginas 7 a 9 del apéndice, una «Tabla 2» que proporciona las puntuaciones del CI (Coeficiente de inteligencia) para la cohorte de TDAH y los controles.
Aunque el estudio se realizó en clínicas de 23 lugares, sólo 20 aportaron los datos comparativos del coeficiente intelectual. En 16 de las 20, la cohorte TDAH tenía un CI superior en promedio al grupo control. En las otras cuatro clínicas, el TDAH y los grupos de control tuvieron el mismo CI promedio (con las puntuaciones medias de CI para ambos grupos en un intervalo de dos puntos). Así, en 20 lugares el grupo TDAH tenía una puntuación media en el CI igual o superior a la puntuación media de CI del grupo de control.
Puntuaciones CI
Colores:
Azul: Puntuación Coeficiente Intelectual (CI) más alta en TDAH
Amarillo: Misma puntuación en ambos grupos, o una diferencia menor de dos puntos.
En la actualidad, se da por hecho que los niños con TDAH, al sufrir de un «trastorno cerebral», son menos capaces de prestar atención y concentrarse en la escuela, y por lo tanto están de algún modo cognitivamente afectados. Los autores de este estudio comunicaron los hallazgos que revelan que el TDAH es un trastorno del cerebro. Pero si la puntuación media del CI de la cohorte con TDAH es mayor que la puntuación media de los controles, ¿no resulta necesario reevaluar esta hipótesis básica? Si los participantes con TDAH tienen cerebros más pequeños, plagados de «estructuras alteradas», entonces ¿por qué son tan inteligentes como, o incluso más inteligentes que, los participantes del grupo de control?
Los autores, sin embargo, eligieron esconder los datos del CI en un apéndice que no es fácil de conseguir. Incluso después de comprar el artículo, hay que hacer una solicitud especial para obtener el apéndice. ¿Por qué? ¿Y por qué los autores no discutieron los datos del CI en su artículo, ni lo usaron en sus análisis? Cuando una investigación científica conduce a un resultado sorprendente que contradice radicalmente la afirmación principal del estudio, los autores tienen el deber –por fidelidad a los valores éticos que supuestamente rigen la ciencia— de presentar esos resultados. Pero los autores de este estudio no lo hicieron, y esta es una razón importante por la que el estudio ha de ser retirado de la revista.
De hecho, si los datos del CI se hubieran resaltado en el abstract del estudio y en los medios de comunicación, el público estaría inmerso en otro debate: ¿Es posible que los niños diagnosticados con TDAH sean más inteligentes que la media? ¿Tal vez estamos medicando a millones de niños brillantes porque son más propensos al aburrimiento y las escuelas no les proporcionan entornos de aprendizaje estimulantes?
Los autores afirman que su estudio reducirá el estigma del TDAH. Si estuvieran realmente interesados en reducir el estigma asociado al TDAH informar que las puntuaciones del CI en los niños con ese diagnóstico son iguales o más altas que las puntuaciones CI en los controles en los 20 lugares, habría hecho exactamente eso.
No hallaron que los niños diagnosticados de TDAH tuvieran volúmenes cerebrales más pequeños
Mientras que las afirmaciones en el resumen del estudio y el comunicado de prensa consiguiente hablaba de conclusiones sólidas y definitivas, y dio lugar a los titulares de los medios de comunicación indicando que «el estudio encontró que los cerebros de los pacientes con TDAH son más pequeños», una revisión de los «tamaños del efecto” desvela que no se encontró algo así.
Cuando el público lee que un estudio demuestra que los niños diagnosticados con TDAH tienen volúmenes cerebrales más pequeños, la mayoría de la gente naturalmente asume que esta es una característica que se encuentra en todos los niños con este diagnóstico. Se supone que los investigadores determinaron lo que es un volumen «normal» (la media del volumen cerebral de un grupo control), y luego comprobaron que la mayoría, si no todos, de los diagnosticados con TDAH tienen volúmenes cerebrales más pequeños que la media.
Pero aquí este no fue el caso.
En este estudio, los autores agruparon los datos de los escáner cerebrales con MRI de los 3.242 participantes del estudio (que se recogieron y archivaron en los 23 centros) y luego calcularon, para cada cohorte, la media de los volúmenes intracraneales y la media para los volúmenes de cada región cerebral específica. Muestran las diferencias para cada una de estas comparaciones y el «tamaño del efecto» de las diferencias. Este es el aspecto crucial de los resultados que se debe considerar y entender: el tamaño del efecto revela la verdadera fuerza de los hallazgos y en qué medida se da un solapamiento entre los volúmenes individuales en ambos grupos, estableciendo así la probabilidad de que un individuo del grupo con TDAH tenga un volumen cerebral más pequeño que un individuo del grupo de control.
Por ejemplo, los autores informan de un tamaño de efecto Cohen d de 0,19 de las diferencias entre el volumen medio del núcleo accumbens en niños menores de 15 años. Según los autores, «el núcleo accumbens, con su papel prominente en el procesamiento de la recompensa, es central en la disfunción motivacional y emocional de los pacientes con TDAH” (p.7). El tamaño de efecto Cohen d varía de cero a tres y, por lo tanto, se entiende que 0,19 refleja un efecto pequeño. Sin embargo, en este estudio, y en los jóvenes menores de 15 años, fue el tamaño de efecto más grande encontrado entre todas las comparaciones del volumen cerebral realizadas. (Para tener más información sobre el tamaño del efecto, acceda a este artículo de Robert Coe: It’s the effect size, stupid – Es el tamaño del efecto, idiota). En concreto, esto es lo que significa el tamaño de efecto 0,19:
- Aproximadamente el 58% de los jóvenes con TDAH en esta muestra reunida tenían un volumen del núcleo accumbens por debajo de la media del grupo de control, mientras que el 42% de los jóvenes con TDAH tenían un volumen del núcleo accumbens por encima del promedio del grupo de control.
- Por lo tanto, si Vd. supiera el volumen de un niño elegido al azar, tendría un 54% de probabilidad para adivinar correctamente a cuál de las dos cohortes –TDAH o control sano– pertenece el niño.
En pocas palabras, si Vd. lanza una moneda al aire para adivinar a cuál de las dos cohortes pertenece el niño, las probabilidades de estar en lo cierto serían casi las mismas. El valor diagnóstico de una exploración cerebral mediante resonancia magnética, de acuerdo con los hallazgos de este estudio, tendría solo algo más de valor predictivo que lanzar una moneda al aire.
Hay formas de visualizar el solapamiento de estos datos. Si se marcan las medidas del núcleo accumbens individuales para cada uno de los 1,637 niños menores de 15 años de este estudio, con un punto rojo para los participantes del TDAH y un punto negro para los controles, se vería un revoltijo de puntos rojos y negros. Habría un porcentaje ligeramente mayor de puntos rojos situados en la mitad inferior de la escala y un porcentaje ligeramente mayor de puntos negros en la mitad superior, pero se podía ver inmediatamente –por la mezcla de puntos– que el «pequeño volumen cerebral» no es una característica que distingue a los individuos dentro de la cohorte de TDAH. Los volúmenes individuales del cerebro varían enormemente, algo que es cierto para ambas cohortes, y todo lo que muestra la agrupación de estos datos es que hay una posibilidad ligeramente mayor de que un niño concreto diagnosticado de TDAH, al compararlo con un niño de la cohorte de los controles, tenga un volumen medio del accumbens representado en la mitad con menor volumen medio de la gráfica.
De hecho, si se dibuja la curva de distribución que traza las puntuaciones del accumbens de los individuos de ambos grupos, las dos curvas sólo estarían ligeramente descompensadas. Redondeando el tamaño de efecto 0,19 hasta 0,2, a efectos ilustrativos, se puede ver que hay un 92% de solapamiento entre las dos curvas.
Gráfico de Kristoffer Magnusson, http://rpsychologist.com/d3/cohend/
El tamaño de efecto para las otras siete comparaciones del volumen cerebral realizadas en los niños menores de 15 años osciló entre 0,01 y 0,18. Todos los tamaños del efecto fueron muy pequeños. Tras entender lo que revelan estos tamaños del efecto, es fácil ver que los hallazgos, tal como se presentaron en el estudio y en los medios de comunicación, son completamente engañosos. Los autores tratan de dar la impresión de que lo habitual es que un niño diagnosticado de TDAH tenga un volumen cerebral más pequeño y que es esta la característica que define el trastorno, cuando, de hecho, lo que dicen sus hallazgos es que los volúmenes cerebrales de los individuos de ambos grupos se solapan en su mayor parte.
Con un tamaño de efecto Cohen d de 0,1, dato que se obtuvo en las comparaciones de volumen cerebral del núcleo pálido en niños de 15 años o menos, el solapamiento entre los dos grupos es del 96%.
Gráfico de Kristoffer Magnusson, http://rpsychologist.com/d3/cohend/
Volvamos ahora a las afirmaciones de Hoogman y sus colegas de que su estudio mostró que los volúmenes cerebrales son «más pequeños en los individuos con TDAH comparados con los controles». El tamaño de efecto de Cohen d de un hallazgo así sería de 3, porque esta afirmación implica que todos aquellos con TDAH tienen volúmenes más pequeños que el volumen medio de los controles. En este caso, sólo se daría una superposición del 13% entre las curvas de distribución de los dos grupos.
Gráfico de Kristoffer Magnusson, http://rpsychologist.com/d3/cohend/
La falacia científica del estudio es la siguiente: no se puede utilizar datos que hablan de una diferencia media en volúmenes cerebrales agrupados de un tamaño de efecto pequeño y generalizar esa diferencia a los individuos de la cohorte TDAH presentándola –como lo hicieron Hoogman y sus colaboradores— como una característica que define al TDAH.
El efecto de la medicación
Como se señaló antes, los autores publican que hubo pequeñas diferencias en las medias del volumen cerebral entre los niños con TDAH y el grupo de control. Los estudios previos sugerían que los medicamentos para el TDAH podían reducir el volumen cerebral, por ello Hoogman y colaboradores evaluaron si las pequeñas diferencias en las medias de los volúmenes cerebrales podrían deberse a la exposición a estos psicoestimulantes.
Para ello, compararon las medias de los volúmenes cerebrales entre dos grupos de la cohorte del TDAH: 82 que dijeron que nunca habían usado medicación estimulante (medicación-naïve), y 637 que dijeron que «usaron la medicación estimulante en algún momento de su vida por un período de cuatro semanas o más» (expuestos a la medicación). Los autores informan que «no hubo diferencias en ninguno de los volúmenes» entre el grupos sin tratamiento con medicación y los expuestos a la medicación, llegando a la conclusión de que su estudio «refutaba» los estudios previos (página 5).
Sin embargo, hubo deficiencias notables en la realización e informe de este análisis. En concreto:
- No han publicado los datos del volumen medio de ambos grupos. Se limitan a afirmar los volúmenes eran iguales.
- No facilitan información sobre cuántos de los pacientes que no tomaron medicación y de los expuestos a la misma eran niños y cuántos eran adultos. Dado que fue principalmente en los niños menores de 15 años donde hubo diferencias «estadísticamente significativas» en las medias de los volúmenes cerebrales entre los TDAH y los controles, para ver si la exposición a medicamentos era un factor para esas diferencias debería de haberse identificado el uso de medicamentos en ese grupo de edad.
- No facilitan información respecto a la dosis en el grupo expuesto a los medicamentos ni durante cuánto tiempo la tomaron. Si alguien con 30 años estuvo tomado un estimulante durante cuatro semanas siendo niño, ¿es realmente esperable que tenga un efecto a largo plazo en el volumen cerebral? Y algo más al respecto: ¿hubo diferencias en el volumen entre los niños con TDAH que tomaron los medicamentos durante varios años y los niños de la cohorte de TDAH que nunca los usó? Este es el tipo de comparación que es necesario realizar.
- Hay un grupo de pacientes que se perdieron al realizarse esta comparación. En un apartado de su artículo, los autores afirman que disponen de información acerca del uso de medicamentos en 1254 de los 1713 participantes del grupo con TDAH. Sin embargo, su comparación sólo incluyó a 719 pacientes (82 más 637). ¿Por qué se excluyó a 545 pacientes (1254 menos 719) en esta comparación? [Véase la nota 1 al final para una posible explicación.]
Al no presentar unos datos más exhaustivos y con estas cuestiones relacionadas con la pérdida de datos recogidos entre las secciones de métodos y resultados, no hay forma de evaluar si este estudio «refuta» las preocupaciones de que los medicamentos para el TDAH puedan reducir los volúmenes cerebrales a lo largo del tiempo. Tan solo se nos pide que aceptemos la palabra de los autores, y eso no es un ejemplo de cómo validar un hallazgo científico en un tema controvertido.
Los datos por centros participantes en el estudio también contradicen la conclusión
Los autores informan que los «volúmenes del núcleo accumbens, la amígdala, el núcleo caudado, el hipocampo, el putamen y el volumen intracraneal eran más pequeños en los individuos con TDAH al comparase con los controles en el mega-análisis» (p.1). Si esto fuera cierto, los volúmenes cerebrales más pequeños tendrían que haber aparecido en los datos de la mayoría, si no de la totalidad, de los 21 centros que tuvieron un grupo control. Pero este no es el caso.
Estos son los resúmenes de los resultados concretos por centros:
- La media de los volúmenes del núcleo accumbens: En 4 lugares el volumen para la cohorte TDAH fue mayor que para el control y en otros 6 lugares las medias de los volúmenes fueron básicamente del mismo tamaño.
- La media de los volúmenes de la amígdala: En 5 centros el volumen medio de la cohorte TDAH fue mayor que para los controles, y de igual tamaño en otros 4.
- La media de los volúmenes del caudado: En 5 lugares el volumen medio de la cohorte TDAH fue mayor que en los controles y de igual tamaño en otros 2.
- La media de los volúmenes del hipocampo: En 7 lugares el volumen de la cohorte TDAH fue mayor que para los controles, y de igual tamaño en otros 4.
- Las medias de los volúmenes del putamen: En 5 lugares el volumen para la cohorte TDAH fue mayor que para los controles, y de igual tamaño en 1.
- La media de los volúmenes intracraneales: En 5 lugares el volumen para la cohorte TDAH fue mayor que para los controles.
Aquí el problema resulta obvio. Si los autores afirman que las regiones cerebrales más pequeñas son una «anomalía» que caracteriza el TDAH, entonces esas diferencias deberían hallarse sistemáticamente en las medias de los volúmenes de las cohortes TDAH en todos los centros participantes en el estudio. El hecho de que exista tal variación en los datos sobre el volumen medio es una razón más para ver que la conclusión de los autores –que los volúmenes cerebrales más pequeños son una característica definitoria del TDAH— no está basada en datos.
Media del volumen del núcleo accumbens (mm3)
Colores:
Amarillo: Mayor volumen del núcleo accumbens en TDAH
Verde: Menor volumen del núcleo accumbens en TDAH
Rojo: Menor volumen del núcleo accumbens en ambos grupos o una diferencia menor de 5 mm3
De hecho, imagine que cada uno de los 21 lugares (aquellos que tenían un grupo control) hubiera publicado sus datos de forma independiente. La literatura científica se habría llenado de resultados realmente heterogéneos. En algunos centros se encontró que los volúmenes medios de una región cerebral concreta eran mayores en las cohortes TDAH, en otros no se encontraron diferencias, y en otros que las mismas regiones eran más pequeñas en las cohortes TDAH. Ante resultados tan divergentes nadie concluiría que esta literatura confirma que los niños diagnosticados de TDAH tienen los «cerebros alterados» caracterizados por volúmenes más pequeños en varias regiones cerebrales.
Y una vez más, esto desvela la mala ciencia –se podría decir ciencia absurda– presente en este «mega-análisis». Los autores agruparon los datos pasando por alto los hallazgos contradictorios de unos centros y otros y, sin embargo, asumen que esos resultados agrupados son representativos de todos los pacientes con TDAH. Por ejemplo, los autores indican que la región accumbens es menor en los pacientes con TDAH, cuando en 10 de 21 sitios, los volúmenes medios de los pacientes con TDAH eran los mismos que los controles o mayores. Las cohortes del TDAH de esos 10 lugares no encajan en absoluto dentro del hallazgo «agrupado», y sin embargo los autores siguen escribiendo que «los individuos con TDAH comparados con los controles» tienen el núcleo accumbens más pequeño.
El estudio está plagado de defectos científicos
El problema del diagnóstico y la asignación a la cohorte
En este estudio, se explica y se entiende que hay un grupo que tiene TDAH y un grupo de control que no. Pero dado que no existe un marcador biológico que se pueda utilizar para realizar este diagnóstico, ¿cómo se hizo esta distinción?
El apartado de métodos en el documento publicado no proporciona ninguna información sobre esta cuestión crucial. En su lugar, los autores simplemente escriben que «los procedimientos de diagnóstico en cada lugar se enumeran en el apéndice» (p.3). Si volvemos a la Tabla 2 del apéndice encontraremos que no hubo un método de diagnóstico estandarizado aplicado en todos los centros. Esta distinción crucial –TDAH versus no TDAH- se hizo de manera caótica.
En primer lugar, en dos de los 23 lugares ni siquiera hubo un grupo de control. Por lo tanto, es difícil entender por qué las mediciones del TDAH de estos dos centros se incluyeron en los datos agrupados.
En segundo lugar, parece que ninguno de los participantes en los grupos de control en los 21 lugares restantes tuvo una evaluación diagnóstica para el TDAH. No hay ningún informe de las puntuaciones de los síntomas TDAH en los controles. Al parecer, los participantes etiquetados como «controles sanos» –y por lo tanto considerados como no TDAH– nunca fueron evaluados para ver si mostraban las conductas asociadas a este diagnóstico.
En tercer lugar, los autores no evaluaron a casi un millar de los participantes en la cohorte de control para determinar si eran «sanos». En 867 admitidos dentro de la cohorte de control figura como desconocida la comorbilidad, en aspectos como depresión, ansiedad y abuso de sustancias. Sin realizar esta evaluación no parece que este grupo «no TDAH» pueda describirse como «controles sanos».
De hecho, hay muy poca información sobre los sujetos del grupo control. ¿Por qué estas personas aceptaron participar en este estudio? ¿Fueron reclutados mediante anuncios a cambio de una remuneración? ¿O eran pacientes de las clínicas a los que se les hizo una resonancia magnética por otras razones médicas? En el apéndice, los autores afirman que 30 controles fueron diagnosticados con depresión, 11 con ansiedad y 39 con trastornos por uso de sustancias. Pero con tan escasa información es imposible saber cuál es el nivel de representatividad de los «controles sanos» de este grupo.
En cuarto lugar, en siete de los 23 lugares, no hay puntuación alguna de los síntomas de TDAH para la cohorte TDAH. Hay que intentar adivinar cómo se hizo el diagnóstico en esos lugares. ¿Disponían los autores de la historia clínica de los participantes? ¿O se basaron en el autodiagnóstico o la autoevaluación de los propios participantes de que tenían TDAH? No hay forma de saberlo.
En quinto lugar, incluso cuando se aportan las puntuaciones de severidad de los síntomas, no se estandarizó el «instrumento» usado para evaluar los síntomas, o el sistema de clasificación utilizado para realizar el diagnóstico (DSM IV o CIE 10). En otras palabras, los autores de una clínica en Brasil podrían haber tenido un estándar para diagnosticar el TDAH, los autores en China otro, los del Reino Unido un tercero, y así sucesivamente.
Sin embargo, a pesar de esta falta de rigor diagnóstico y metodológico, los autores mantienen que «las diferencias cerebrales que presentamos no son causadas por trastornos comórbidos, efectos de medicación o gravedad de los síntomas del TDAH, sino que están exclusivamente relacionadas con el diagnóstico de TDAH» (p. 7). Esta es una conclusión desconcertante, ya que un gran porcentaje de los participantes no fueron sometidos a pruebas de trastornos comórbidos, ni de gravedad de los síntomas del TDAH, ni –en el caso de los controles– ni siquiera del TDAH.
El hecho de que la severidad de los síntomas no mostrara relación alguna con las diferencias en el volumen cerebral plantea a los autores un problema evidente. En 16 lugares, usaron teóricamente la severidad de los síntomas para asignar a los participantes a la cohorte TDAH, y si la cohorte TDAH tenía los volúmenes cerebrales más pequeños que los controles, entonces la gravedad de los síntomas debería relacionarse también con los volúmenes cerebrales más pequeños. Pero este no fue el caso. La explicación de los autores de este resultado desconcertante es suficientemente reveladora: «No encontrar efectos de las puntuaciones de los síntomas también se podría deber a la heterogeneidad de los instrumentos [diferentes] usados en las diferentes cohortes de nuestro estudio o a diferencias en los evaluadores (es decir, clínicos, profesores y padres)» (página 8).
En otras palabras, justifican este resultado sugiriendo que las pruebas usadas para evaluar los síntomas de TDAH en los diferentes lugares eran demasiado distintas como para proporcionar resultados significativos. También sugirieron que los diagnósticos de TDAH a menudo se realizaron por adultos no cualificados, p.ej. padres y maestros, que no tienen experiencia en usar el DSM o en hacer un diagnóstico de TDAH (y también carecen de la autoridad legal para hacerlo).
Sin embargo, como bien saben los estadísticos, existe un modo fácil de estandarizar los datos cuando las pruebas o la medición de los datos son diferentes (como sucedió en este caso con la falta de estandarización del diagnóstico del TDAH,). En el análisis de regresión, se le llama «cálculo de promedio de las variables» y se realiza fácilmente convirtiendo los diferentes datos en puntuaciones z. Pero los autores de este estudio no normalizaron los datos a pesar de que esta falta de estandarización puede alterar completamente los resultados.
El problema de fiabilidad del escáner MRI
Se tiene un sentimiento reverencial ante los escáneres de resonancia magnética (MRI) que lleva a pensar que las mediciones del volumen cerebral realizadas con esta tecnología deben ser muy precisas. Se supone que esta tecnología moderna permite a los autores ver el cerebro y distinguir con gran claridad una región del cerebro de otra. Pero no fue así en este estudio.
El primer problema en un estudio de resonancia magnética (MRI) multicéntrico es que los aparatos utilizados pueden ser diferentes, con diferentes potencias de resolución de imagen, como fue probablemente el caso en este estudio. El segundo problemas es que el umbral, el color, el contraste y las ordenadas que un técnico decide usar en una exploración con resonancia magnética pueden variar mucho de un lugar a otro. Las máquinas utilizadas para la imagen del cerebro y la medida de los volúmenes cerebrales pueden no estar estandarizadas para medir lo mismo de forma consistente en un lugar y en otro.
Típicamente, para poder dar cuenta de tales variaciones centro a centro, en las mediciones de MRI los autores deben hacer ajustes para «normalizar» los resultados. En este estudio, los autores informaron que «los datos de todos los lugares fueron recientemente analizados con métodos armonizados». Sin embargo, su «armonización» de los datos consistía simplemente en comprobar qué versión del software se estaba usando en los aparatos, algo que no tiene en cuenta las diferencias en las configuraciones de umbral, color, contraste y ordenadas en cada lugar.
Una comparación rápida de los hallazgos en los volúmenes en diferentes lugares revela lo imprecisos que eran los métodos de medición, incluso con ese esfuerzo de armonización. Por ejemplo, en la clínica ADHD-WUE en Wurzburg, Alemania, la media del volumen cerebral para el núcleo accumbens, para las dos cohortes juntas, fue de 455,6 mm3. Mientras tanto, para la misma región cerebral en la clínica MGH-ADHD en la ciudad de Nueva York, la media fue de 814,8 mm3 para las dos cohortes juntas. Esto ocurrió así a pesar de que los autores ajustaron estos resultados por «edad y sexo». O bien debemos asumir que la región del núcleo accumbens en niños y adultos en Nueva York es 55% más grande que la misma región para niños y adultos en Alemania o hay que concluir que las mediciones de los volúmenes cerebrales en este estudio fueron notablemente imprecisas.
Media del volumen del núcleo accumbens en los 21 centros
La diferencia en la media del volumen entre los 21 lugares fue muchas veces mayor que la diferencia entre el volumen de las dos cohortes de cualquier centro, lo que revela la imprecisión en las mediciones del área cerebral. |
No se trata de un problema limitado a las medidas del núcleo accumbens. La Tabla 4 en el apéndice proporciona una descripción detallada de las muchas y grandes variaciones en las mediciones del volumen cerebral en los 23 centros. En una clínica de TDAH en Londres, el volumen cerebral medio para la amígdala fue de 1284,1 mm3. En una clínica en Dubai fue de 1824,1 mm3. Las mediciones parecen ser muy exactas, con volúmenes detallados hasta en décimas de mm3, pero la burda diferencia en la media de los volúmenes entre las clínicas de TDAH en Londres y Dubai es de 540 mm3.
Pero si los escáneres de resonancia magnética no produjeron mediciones coherentes en los 23 centros, ¿cómo se puede considerar que tales mediciones son fiables y, lo más importante, válidas? Y con diferencias tan grandes en las mediciones del volumen entre los distintos lugares, ¿cómo pueden los autores pretender haber encontrado diferencias significativas en los promedios de los volúmenes agrupados de las dos cohortes, cuando esas diferencias entre las medias eran tan pequeñas?
De hecho, así como los autores reconocieron la falta de estandarización en el diagnóstico, también reconocieron que «la obtención de los datos de imagen… difieren entre los centros, una limitación que aporta heterogeneidad a las muestras» (p.8). Una vez más, se trata de deficiencias metodológicas que deberían llevar a los investigadores a abstenerse de hacer afirmaciones categóricas.
Y todavía hay más problemas
Hay muchos más problemas científicos identificables en este estudio. Pero para mantener esta crítica dentro de una extensión razonable, aquí van sólo unas cuantas más.
(1) Errores: En varios casos, las estadísticas no parecen presentarse correctamente. Por ejemplo, en la Tabla 3, que detalla los pequeños pero de algún modo robustos tamaños del efecto Cohen d para los jóvenes menores de 15 años, se afirma que la diferencia en las medias de los volúmenes cerebrales del núcleo accumbens entre la cohorte de TDAH y los controles es significativa para el diagnóstico con p=0,001 y con un tamaño de efecto de Cohen d de -0,19. Sin embargo, el intervalo de confianza (CI) para el tamaño del efecto va de -0,29 a 0,10. Si un hallazgo es significativo, su intervalo de confianza usualmente no cruza el cero pasando de un número negativo a un número positivo. Esto indica una incertidumbre sobre si el volumen medio de la región accumbens es menor (número negativo para el tamaño del efecto), o mayor en la cohorte TDAH (número positivo para el tamaño del efecto). Además, hay numerosos errores dentro del apéndice. ¿Estos errores se deben a erratas tipográficas, malentendidos en los resultados, o, peor aún, resultados inexactos?
(2) Falta de datos: Como hemos comentado antes, hay muchos apartados en los que faltan datos –faltan las puntuaciones de severidad de los síntomas de TDAH en algunos lugares, no hay grupos de control en dos centros, no hay información sobre la comorbilidad de casi 1000 participantes en la cohorte de control, etc. Los libros de texto advierten regularmente acerca de cómo los datos perdidos pueden llevar a una interpretación equivocada de los resultados y a conclusiones erróneas. Sin embargo, parece que el conjunto de datos no se depuró adecuadamente para cualquiera de los análisis realizados.
(3) Omisiones: Los autores afirman que realizaron más de 10 análisis para llegar a las conclusiones alcanzadas. Pero en el estudio publicado, presentan resultados que se limitan a menos de un tercio de los análisis. Sin los resultados de cada análisis no se puede comprobar completamente la exactitud de los resultados. Por lo general, en el proceso de revisión entre pares este tipo de omisiones se identifican y los autores tienen que facilitar los datos que permitan a los lectores verificar y comprender mejor los hallazgos declarados. Esto no ha ocurrido en este estudio.
(4) Incumplimientos de supuestos: Hay varios supuestos necesarios que se deben cumplir para que un investigador efectúe un análisis concreto por inferencia, como el análisis de regresión que los autores de este estudio afirman haber realizado. Para un análisis de regresión, se necesita efectuar procedimientos de muestreo aleatorio, distribución normal de la muestra y verificación de la fiabilidad y validez de las mediciones para asegurar que los resultados no se adulteren. Parece que los autores no cumplieron con ninguno de los supuestos necesarios para realizar cualquiera de estos más de 10 análisis. Este es una cuestión crucial a considerar.
Por ejemplo, la fiabilidad representa una medición de la coherencia por la que una evaluación mide lo mismo una y otra vez. La investigación prueba que cuanto menos fiables sean las mediciones, más probable es que los resultados estadísticos del estudio se inflen Esto puede llevar a lo que se llama error de tipo I, cuando los resultados parecen significativos, pero en realidad no lo son. Dada la falta de fiabilidad en la evaluación del volumen cerebral y del TDAH de este estudio resulta más probable que los resultados se inflaran y se reporten de forma incorrecta. Y dado que una evaluación no puede ser válida si no es a su vez fiable, entonces los autores no pueden afirmar con seguridad que midieron realmente lo que dijeron medir.
(5) Muestra de conveniencia no aleatoria: Como se dijo antes, En un análisis que pretende hacer afirmaciones generalizables de «hechos» como en este estudio, los participantes deben proceder de una «muestra aleatoria» recogida de una población más amplia. Por ejemplo, si se ponen los nombres de 250 pacientes con el mismo diagnóstico en un sombrero y se extraen 25 nombres para el estudio, entonces se puede decir que se tiene una muestra representativa de la población más grande estudiada. Este «muestreo» permite a los investigadores sentirse más cómodos al generalizar sus hallazgos a la población más grande.
Pero no hubo muestreo aleatorizado en este estudio. En realidad, los conjuntos de datos que se agruparon juntos podrían describirse mejor como una recopilación de muestras de “conveniencia”. Una muestra de conveniencia representa básicamente un grupo de personas que son fáciles de encontrar, en vez de ser representativas de un grupo mayor. Este conjunto de datos consiste en los escáneres de resonancias magnéticas de personas que se usaron por razones de oportunidad, porque ya eran clientes que habían firmado el permiso para que sus evaluaciones se usaran en la investigación o por alguna otra razón desconocida, estuvieron de acuerdo en participar en el estudio.
Existen otros errores y omisiones en los informes estadísticos que se podrían resaltar. Pero baste decir que las deficiencias científicas de este estudio son muchas: una ocultación de los datos del CI; tamaños de efectos pequeños que contradicen cualquier hallazgo de que el volumen cerebral menor sea una característica que define el TDAH; ausencia de datos referidos a las variables de confusión en la exposición a los medicamentos; inconsistencia en los hallazgos de volumen medio en los centros; no hay un método estandarizado de evaluación diagnóstica; instrumentos de evaluación sin fiabilidad; falta de muestreo representativo de los pacientes; y una notable ausencia de información acerca de los casos y controles.
Lancet Psychiatry: Hagan lo correcto
Los medios de comunicación han prestado mucha atención a este estudio. Han presentado este estudio –redactado por un grupo de autores que incluía a muchos con estrechos vínculos con compañías farmacéuticas que venden medicamentos para el TDAH– como prueba de que el TDAH es un trastorno cerebral y que los niños con este diagnóstico tienen cerebros más pequeños. Pero esto no fue responsabilidad de los medios de comunicación. Los periodistas básicamente repitieron lo que Lancet Psychiatry trasmitió a los medios y lo que los autores escribieron en los apartados del abstract y del resumen del artículo publicado. Los autores escribieron que sus datos confirmaban que los pacientes «con TDAH tiene cerebros con alteraciones; por lo tanto el TDAH es un trastorno cerebral».
Pero, como revelan los resultados referidos al tamaño del efecto, esto no es cierto. Las curvas de distribución de los volúmenes cerebrales individuales de las dos cohortes se solapan mayoritariamente (y eso sin tener ni siquiera en cuenta los muchos problemas científicos que suministran argumentos para cuestionar la validez incluso de las pequeñas diferencias encontradas en las medias de los volúmenes). Como tal, resulta sumamente engañoso que los autores presenten sus resultados como una prueba definitiva de que los niños con TDAH tienen cerebros más pequeños, o sufren de «cerebros alterados».
También se plantea una pregunta inquietante: ¿Por qué los autores escondieron el hallazgo de que los jóvenes con TDAH tenían puntuaciones de CI superiores en 16 de los 20 centros? El ocultamiento de este hallazgo es, a su modo, tan flagrante como pretender que los datos de volumen medio agrupados, con sus pequeños tamaños de efecto, mostraban que los individuos diagnosticados con TDAH tienen cerebros más pequeños.
La publicación de este estudio, con su mensaje fundamental de que los niños con TDAH tienen cerebros más pequeños, ocasiona un enorme perjuicio a esos niños y a sus padres, y en última instancia a toda la sociedad. Esencialmente expresa una falsedad, envuelta en ropaje científico acerca de esos niños. Lancet Psychiatry debe retirar este estudio e informar a los medios de comunicación que lo ha hecho.
Si está de acuerdo, firme nuestra petición en change.org.
*******
[Nota 1] Una posible razón de la exclusión de los 545 pacientes, en la indagación de los investigadores acerca de si la pequeña diferencia en las medias de los volúmenes cerebrales se debió a la medicación, puede ser que el software que utilizaron eliminó todos los datos de los participantes de los que no se tenía información respecto al uso de estimulantes. Si fuera así, estos datos que faltan son señal de que los autores no depuraron adecuadamente su base de de datos antes de considerar este problema. Si no se tienen en cuenta los datos que faltan se aumenta considerablemente la probabilidad de lo que se denomina un error de Tipo II al realizar un informe de los resultados. En otras palabras, debido a la falta de datos que debilita el análisis, se ha podido asumir que los estimulantes no tienen un efecto significativo en el tamaño del volumen cerebral aunque en realidad los fármacos sí lo tengan.
[Nota 2] También el entorno hispanohablante se ha hecho eco de este artículo con apreciaciones similares (N de los T):
“Los niños hiperactivos sufren trastorno cerebral y no son unos maleducados”
”Síndrome por déficit de atención es un trastorno cerebral”
“Sale a la luz nuevo estudio que podría dar un giro a la intervención en niños con TDAH”
*******
Una actualización del 24/4/2017: El autor principal Martine Hoogman dijo que las puntuaciones del CI en el artículo publicado estaban equivocadas, y que este error se corregirá en un Erratum que se publicará en mayo. La corrección revelará que las puntuaciones de CI para el TDAH y los controles fueron cambiadas por error en el apéndice, y que los controles de hecho tenían mayores puntuaciones del CI.
Una actualización el 29/04/2017: el editor de Lancet Psychiatry, Niall Boyce dijo a MIA que la revista no retirará este artículo.
Una actualización el 08/05/2017 Lancet Psychiatry ha publicado cartas criticando el artículo, la respuesta del autor y una corrección.