La evaluación de los tratamientos médicos Understand article

Author(s): Sarah Garner, Rachel Thomas

Traducido por Alberto Peña. Sarah Garner y Rachel Thomas reflexionan sobre por qué los experimentos adecuadamente diseñados y analizados son tan importantes a la hora de evaluar la efectividad de un tratamiento médico.

Antes de iniciar un ensayo de
control aleatorio, el
tratamiento debe ser
probado en el laboratorio o
en un pequeño grupo de
voluntarios
Imagen cortesía de
iStockphoto/ hipokrat

Supongamos que se ha desarrollado un nuevo tratamiento médico para reducir la hipertensión. El tratamiento ha sido probado ámpliamente en el laboratorio y con algunos voluntarios y los inventigadores creen que podrá funcionar en la población. Ha llegado el momento de averiguar si se está en lo cierto.

Históricamente los médicos han averiguado si un tratamiento funciona en la práctica usándolo con sus pacientes. Así podían comparar las respuestas al nuevo tratamiento frente a la de los tratamientos anteriores para la misma enfermedad y comparar igualmente cómo variaba la respuesta al nuevo tratamiento entre diferentes pacientes. Aunque si los pacientes experimentaban mejoría en sus síntomas no había manera de decir si la mejoría se debía al nuevo tratamiento o a otros factores.

¿Cómo podemos comprobar
si un nuevo fármaco es eficaz
para reducir la hipertensión?
Imagen cortesía de iStockphoto
/ thelinke

Hay muchos factores que pueden producir la mejoría de los pacientes: por ejemplo, pueden sentirse mejor sólo porque han sido tratados por determinado doctor (una reacción conocida como efecto placebo); pueden mejorar porque sí, independientemente del tratamiento; o tal vez su recuperación se deba a cambios en las circunstancias de su estilo personal de vida. Sin tomar en cuenta estos y otros factores se podría fácilmente concluir, de una manera incorrecta, que el tratamiento funciona. Los médicos lo incorporarían a su práctica cotidiana creyendo erróneamente en su efectividad.

El desarrollo de los ensayos de control aleatorio

En el siglo XIX los científicos propusieron un método para controlar exactamente lo que sucedía registrando cualquier cambio en las condiciones de sus pacientes. En aquellos experimentos controlados había dos grupos de pacientes; el grupo de estudio, que recibía el nuevo tratamiento, y el grupo de control, que recibía un placebo (una medicación sin efectos) o un tratamiento ya conocido. Los pacientes eran, luego, observados y los resultados de los dos grupos (tales como si un paciente seguía con vida o moría) eran registrados y comparados.

En un ensayo médico, un
grupo de personas recibe un
nuevo tratamiento mientras
otro grupo recibe un placebo
o un tratamiento ya conocido
Imagen cortesía de iStockphoto
/ gemphotography

Algún tiempo después, en 1917, el proceso “ciego” mejoró el método científico aún más. Si ni el paciente ni el investigador saben qué tratamiento está recibiendo el paciente, los resultados no pueden sufrir interferencias de manera involuntaria o intencionada. A esto se le conoce como el método de doble ciego (en una prueba de ciego único bien el paciente o el investigador conoce qué tratamiento está siendo recibido).

Aún así, para demostrar que el tratamiento funciona, los resultados podrían ser deliberadamente manipulados incluyendo pacientes más enfermos en el grupo de estudio que en el de control. La solución a esto, usada por primera vez por el Consejo de Investigación Médica del Reino Unido, en la decada de 1940, para su estudio sobre las vacunas para la tosferina, fue elegir aleatoriamente qué pacientes recibirían el nuevo tratamiento y cuáles el tratamiento de control.

Los ensayos controlados mediante la ubicación aleatoria en uno de los dos grupos pasaron a ser conocidas como ensayos de control aleatorio (ECA) (randomised-controlled trials, RTCs, en inglés). Introduciendo la aleatoriedad no sólo se consigue una distribución aleatoria de pacientes enfermos y sanos en los dos grupos, sino que se obtiene una distribución aleatoria de cosas desconocidas (pero que también pueden afectar a la salud del paciente y por tanto al resultado del tratamiento). Así pues, debido a que, en teoría, la única diferencia entre los dos grupos es si han recibido el tratamiento puesto a prueba, puede asumirse que cualquier diferencia entre los dos grupos es, presumiblemente, debida al tratamiento y nada más.

Los ensayos de control aleatorio (ECA) son ahora universalmente empleados en la investigación clínica para evaluar nuevos tratamientos.

La evidencia modifica la práctica medica

Antes de 1994, los medicos recomendaban que los pacientes con dolores lumbares descansaran en cama. Sin embargo, después de revisar todas las evidencias disponibles, el Clinical Standards Advisory Group (Grupo Asesor de Patrones Clínicos) concluyó que el reposo en la cama no sólo no era beneficioso, sino que tal vez fuese incluso prejudicial. Esto motivó un cambio radical en el tratamiento, aconsejando a los pacientes que permanecieran activos^w1.

Diseño y análisis de ensayos de control aleatorio

Más gente, más poder

Si estás planeando comprobar tu tratamiento para la presión de la sangre mediante un ensayo de control aleatorio, necesitas diseñarlo cuidadosamente. Una pregunta importante es: ¿Cuántos pacientes deberías incluir en el ensayo? Esto depende de la eficacia del nuevo tratamiento: cuanto mayor sea el efecto, menor el número de pacientes que necesitas para distinguirlo en las fluctuaciones aleatorias que puedan aparecer casualmente.

El efecto del tratamiento es, por supuesto, exactamente lo que se espera averiguar en un ensayo. Antes de empezarlo, en cualquier caso, se deberá tener alguna evidencia de que el tratamiento funciona, tal vez por pruebas a pequeña escala o de laboratorio. Esto permite estimar el nivel del efecto.

La presión normal está entre
los 90 y los 120 mmHg
Imagen cortesía de iStockphoto
/ wwing

En un paciente sano, la presión sanguínea debe estar entre 90 y 120 mmHg. Pero los pacientes con hipertensión tiene valores por encima de los 140 mmHg de una manera constante, poniéndoles en riesgo de sufrir un ataque cardiáco. Se puede estimar que el nuevo tratamiento reducirá la presión máxima en sangre en 5 mmHg: después del tratamiento se espera que el promedio de la medida de la presión de la sangre sea al menos 5 mmHg más bajo que la presión media en el grupo de control.

Hay formulas estadísticas para determinar el tamaño de la muestra que se necesita para tener buenas opciones para detectar el efecto esperado^w2. Para el tratamiento de la presión de la sangre estas fórmulas sugieren que serán necesarios unos 64 pacientes en cada grupo para detectar una diferencia de 5 mmHg debida al tratamiento^w3.

¿Cómo de diferente es la diferencia?

El ensayo ha seguido su curso, los pacientes han sido monitoreados y se ha registrado una diferencia en la presión sanguínea entre los pacientes del grupo de estudio y el de control. Gracias a la randomización se sabe que los dos grupos son comparables antes del ensayo. Por lo que o bien el nuevo tratamiento ha dado efecto o algo muy sorprendente ha sucedido: el tratamiento no ha producido ningún tipo de efecto y las diferencias registradas en el ECA se debieron exclusivamente a la casualidad.

Imaginemos que el promedio de presión sanguínea del grupo de estudio era 5,2 mmHg más baja que la del gupo de control. ¿Cómo decidimos si esa diferencia se debe a la casualidad o a un efecto real del tratamiento?. Depués de todo la presión sanguínea puede variar por muchas razones y no todas pueden ser controladas en nuestro ECA.

Para que un ensayo médico
funcione, la población
incluida en él debe ser
respresentativa de la
población que, en el mundo
real, debe ser tratada
Imagen cortesía de iStockphoto
/ sculpies

Lo que los estadísticos hacen es seguir a alguna de las variaciones; más que confiar en un promedio para cada grupo calculan un rango de valores para cada grupo en el que están seguros que el valor real estrará incluido. A este rango de valores se le llama intervalo de confianza. Si los intervalos de confianza en nuestro estudio sobre la presión sanguínea están entre 141,2 y 148,9 mmHg en el grupo de control y entre 133,7 y 139 mmHg en el grupo de estudio, puede comprobarse que los dos intervalos de confianza no se solapan. Los estadísticos, por tanto, dicen que la diferencia observada entre los grupos es estadísticamente significativa y se puede asumir que ésta fue realmente causada por el tratamiento.

¿Pero cómo de fiable es esa confianza? Los estadísticos generalmente dicen que un 95% es suficientemente fiable; esto significa que están preparados para vivir con el hecho de que el 5% de las veces (1 de cada 20 veces) habrá un error debido exclusivamente a la casualidad. Para estar incluso más seguros de que se han obtenido datos reales será necesario tomar datos a más pacientes e incluso entonces, la única manera para estar 100% seguros sería tomar datos de toda la población!

Si el resultado acabara por no ser estadísticamnte significativo, una de las preguntas clave sería si se han incluido suficientes pacientes en el ensayo. Tal vez el efecto del tratamiento sea menor de lo incialmente estimado (con una muestra mayor, se podría haber detectado alguna diferencia entre los dos grupos de pacientes).

Aplicando los ensayos de control aleatorio (ECA) al mundo real

Un ensayo bien diseñado y adecuadamente analizado es una potente herramienta para los investigadores médicos (siempre que los médicos, con la información necesaria, tomen las decisiones adecuadas durante el tratamiento de sus pacientes). Aunque en cualquier caso los ECA tienen sus limitaciones.

En primer lugar, no es suficiente saber que el nuevo tratamiento produce una diferencia estadísticamente significativa. ¿Es esta diferencia también clínicamente significativa?, por ejemplo: ¿un decenso de 5 mmHg en la máxima supone una diferencia real en la salud y el bienestar del paciente? Después de todo, en nuestro ejemplo, el tratamiento no redujo la presión al rango normal de 90-120 mmHg. Para apreciar si esto es clínicamente relevante, los médicos tal vez tengan que llevar a cabo otro tipo de investigaciones.

Una limitación más de los ECA es que los pacientes en el ensayo pueden no representar a la población del mundo real que debe ser tratada. Puesto que los ensayos tienen como objetivo contralar el mayor número de factores posible, tienen estrictos criterios de inclusion y exclusion. Por ejemplo, las mujeres embarzadas no son incluidas debido a los riesgos potenciales para el feto; esto significó que nadie reparó en que la talidomida causaba defectos a los bebés hasta que se introdujo la práctica generalizada a finales de la década de 1950^w4.

Y luego está la cuestión de cómo se publican los ECA. Nadie quiere publicar malas noticias, especialmente aquellos que han dedicado tiempo y esfuerzo para desarrollar un nuevo tratamiento. Históricamente, por tanto, los investigadores publican ensayos en los que no hay diferencias apreciables, y menos aún que un viejo tratamiento sea major. Algunos investigadores sin escrúpulos incluso publican datos parciales o incompletos, lo que hace que un nuevo tratamiento parezca mejor de lo que realmente es. La comunidad de investigadores ha tomado medidas para detener ambas prácticas obligando a las compañías e investigadores a registrar el comienzo del ensayo con el fin de que sea más difícil ocultar resultados desfavorables, aunque aún no es imprescindible informar de todos los resultados. Las publicaciones están también estandarizando la información que demandan de los investigadores incluyendo sus notas manuscritas, lo que hace más difícil ocultar los malos resultados.

Imagen cortesía de stevecolecs
/ iStockphoto

Sobre todo, los ECA resultan caros y exigen tiempo. Como resultado, muchos ensayos no se llevan a cabo, o la muestra o su duración son limitados. Esto puede significar que el ensayo no sea lo suficientemente fiable como para detectar si el tratamiento es eficaz, cuando en realidad puede serlo. Ensayos más pequeños pueden también suponer que se pierdan importantes efectos adversos (que pueden ser raros), y ensayos más limitados en el tiempo no sirven para aclarar los efectos producidos a largo plazo.

Los investigadores clínicos, por lo tanto, a menudo revisan los resultados conjuntos de un número de ensayos en un análisis meticuloso conocido como revision sistemática. Organizaciones como la Cochrane Collaboration^w5 y el National Institute for Health and Clinical Excellence (Instituto Nacional para la Excelencia Clínica y de la Salud del Reino Unido)^w6 basan sus recomendaciones a la comunidad médica en las revisiones sistemáticas.

Desde la década de 1940, el uso de los ECA ha modificado significativamente la práctica médica. Los medicos ya no tienen que basarse en sus propias observaciones, sino que se basan en evaluaciones rigurosas que aseguran que el beneficio del nuevo tratamiento es superior a sus riegos.

La evidencia puede cambiar el punto de vista

Recientemente se realizó una revision sistemática de la evidencia de la minociclina, un antibiótico que fue muy promocionado como el mejor remedio para el acné, con el fin de investigar su eficacia y su seguridad.

Un efecto secundario de la minociclina es el riesgo de desarrollo hepatitis autoinmune con consecuencias fatales. Los problemas son raros u ocasionales. La mayoría de los médicos no se han encontrado con ningún caso e, incluso si ha sido así, no pueden hacer una conexion directa con el medicamento.

Sólo cuando se ha revisado conjuntamente toda la información se puede establecer el vínculo. Una revision sistemática mostró que no había evidencia de que la minociclina fuera major para la cura del acné que cualquier otro tratamiento conocido. Dados los riesgos, los autores concluyeron que no debería ser usado preferentemente con respecto a otros tratamientos conocidos (Garner et al., 2003).

Agradecimientos

Si le gustó este artículo y quiere saber más sobre las matemáticas involucradas en él, lea la version orginal, más larga^w3, que apareció en la revista Plus^w7, una revista online gratuita que abre las puertas al mundo de las matemáticas con toda su belleza y aplicaciones.

References

Garner SE (2003) Minocycline for acne vulgaris: efficacy and safety. Cochrane Database of Systematic Reviews 1: CD002086. doi: 10.1002/14651858.CD002086

Web References

w1 – Para más información sobre las recomendaciones para el reposo en cama, vea el sección “management” del artículo “Low back pain and sciatica” de la página web de los pacientes del Reino Unido (www.patient.co.uk) o use el enlace directo: http://tinyurl.com/y9gghww
w2 – Puede leer una buena explicación de cómo los efectos del tratamiento y el tamaño de la muestra pueden afectar el poder de las estadísticas en: Jerry Dallal Little Handbook of Statistical Practice: www.jerrydallal.com/LHSP/sizenotes.htm
w3 – Para la version original de este artículo, incluyendo más detalles de las estadísticas, consulte:
- Garner S, Thomas R (2010) Evaluating a medical treatment – how do you know it works? Plus Magazine. http://plus.maths.org/latestnews/jan-apr10/rct
w4 – Para saber más sobre el desastre de la talidomida y también sobre recientes investigaciones sobre la talidomida y la formación de los miembros, consulte:
- Zimmer C (2010) Answers begin to emerge on how thalidomide caused defects. New York Times 16 Mar: D3. www.nytimes.com
w5 – Cochrane Collaboration es una red internacional de personas que ofrecen ayuda a personal sanitario, responsables politicos o pacientes, sus abogados y cuidadores toman decisiones basadas en una buena información sobre la salud humana. Consulte: www.cochrane.org
w6 – The National Institute for Health and Clinical Excellence (NICE) (Instituto Nacional para la Excelencia Clínica y la Salud) es una organización independiente responsible de facilitar orientaciones para la promoción de hábitos saludables y la prevención de enfermedades en el Reino Unido. Consulte: www.nice.org.uk
w7 – Para saber más sobre Plus, la revista gratuita online de matemáticas, visite: http://plus.maths.org

Resources

Para una breve descripción de las cuatro fases de un ensayo clínico, vea el apartado de información en:
Wynne K, Bloom S (2007) Oxyntomodulin: a new therapy for obesity? Science in School 6: 25-29. www.scienceinschool.org/2007/issue6/oxyntomodulin
Ledford H (2010) Companies pledge to make more trial data public. Nature News 15 Jun. doi: 10.1038/news.2010.299.
Para escuchar el podcast que acompaña la version original de este artículo (Plus podcast 22, February 2010: Evaluating a medical treatment) visite: http://plus.maths.org/podcast
La organización sin ánimo de lucro Sense about Science ha publicado una útil guía para interpretar las demandas médicas en la prensa (‘I’ve got nothing to lose by trying it’– No tengo nada que perder por intentarlo). Se puede descargar gratis desde la página web de Sense About Science (www.senseaboutscience.org.uk) o desde el enlace directo: http://tinyurl.com/63zv4l
Freiberger M (2010) Medical research plagued by bad reporting. Plus Magazine. http://plus.maths.org/latestnews/jan-apr10/reporting
Plus Magazine ofrece un variedad de artículos, podcasts y actividades para clase sobre las matemáticas relacionadas con la salud y la medicina: ‘Do you know what’s good for you?’ (¿Sabes lo que es bueno para ti?). Consulte: http://plus.maths.org/wellcome

Author(s)

Dra. Sarah Garner es la directora asociada para investigación y desarrollo en el National Institute for Health and Clinical Excellence (NICE) (Instituto Nacional para la Excelencia Clínica y la Salud)^w6 que basa sus recomendaciones a la comunidad médica en las revisiones sistemáticas.

Rachel Thomas es co-editora de la revista Plus^w7.

Review

Este artículo ofrece una mirada a la medicina moderna basada en la evidencia, siguiendo el camino desde el desarrollo de los medicamentos a los fructíferos tratamientos medicos, a menudo pasado por alto y raramente comprendido. Se discuten los métodos estadísticos y sus problemas ofreciendo oportunidades de enseñanza interdisciplinar para estudiantes de 14 años en adelante.

Está lleno de temas candentes para la discussion con estudiantes mayores y profesores de diferentes materias. Por ejemplo:

“El conocimiento” no es estático: el conocimiento puede cambiar a la vez que se informa sobre nuevos efectos o se acumulan nuevas evidencias.
Con frecuencia los ensayos clínicos que son necesarios antes de que un ¿Por qué la publicación de los nuevos tratamientos puede influenciar?
¿Dan las estadísticas una falsa sensación de seguridad?

Tomando el ejemplo de la presión sanguínea y lo variable que ésta es, la clase puede medir su presión sanguínea y observar las variaciones entre estudiantes. Ellos podrían subir y bajar escaleras unas cuantas veces para comprobar cómo puede variar la presión sanguínea de una persona. Teniendo en cuenta estas variaciones ¿cómo determinan los investigadores los efectos de los medicamietnos en la disminución de la presión sanguínea?

Este artículo pude ser usado también para iniciar actividades más complejas. Por ejemplo, se puede facilitar a los estudiantes artículos de prensa sobre investigaciones clínicas o sobre “medicamentos milagro”, tal vez relacionados con situaciones que les resulten familiares como migrañas, intolerancia a la glucosa o alergias. En grupos, los estudiantes podrían usar libros de texto, Internet u otras fuentes de información para investigar:

La enfermedad objeto del tratamiento;
Qué tratamientos son conocidos hasta el momento para esa enfermedad;
Si el tratamiento ha sido probado en animales;
Si se han publicado otros ensayos clínicos sobre ese tratamiento;
Cómo se diseñó el ensayo clínico y qué análisis estadísticos se hicieron;
Cómo creen que podría habese mejorado el ensayo.

Sobre la base de esta investigación, cada grupo de estudiantes puede escribir su propio artículo sobre la investigación científica. ¿Creen que el artículo original era acertado?. Si no, ¿por qué?

Para la mayoría de los profesores, el artículo también puede ser una fuente de información de interés sobre la historia de la investigación científica y los ensayos de control aleatorio.

La evaluación de los tratamientos médicos Understand article

El desarrollo de los ensayos de control aleatorio

La evidencia modifica la práctica medica