2-8.p-TIPOS DE VARIABLES

 


Resumen Rápido:

Tipo de DatoEjemplo en tu textoGráfico Recomendado
DiscretoNúmero de ingresos por mesBarras o Líneas (temporal)
DiscretoProporción de complicacionesSectores (Pastel) o Barras
ContinuoDistribución de la presión arterialHistograma
ContinuoComparar glucemia entre gruposCaja y Bigotes (Box Plot)
ContinuoRelación entre edad y función pulmonarDispersión (Scatter Plot)

Sean todos muy bienvenidos a esta sesión en la que vamos a explorar cómo clasificar datos en función de su tipo.



Comprender estos tipos de datos es fundamental para realizar análisis estadísticos precisos y seleccionar las visualizaciones correctas que nos permitan tomar mejores decisiones.

Imagínate que trabajas en un hospital y te encargan analizar la efectividad de un nuevo fármaco para reducir la presión arterial.

Cómo decides qué métodos estadísticos utilizar?

Todo comienza con la clasificación correcta de los datos.

Si no tienes claro el tipo de datos con los que vas a trabajar, podrías elegir mal las herramientas y técnicas y esto llevaría a resultados engañosos en el análisis financiero y en el análisis de negocios.

Trabajar con datos incorrectamente clasificados puede resultar en errores significativos, en modelos predictivos, en la interpretación de métricas clave o incluso en la evaluación de riesgos.

Por eso, antes de aplicar cualquier análisis, es vital que entiendas qué tipos de datos tienés en tus manos.

Esta comprensión será la base para tomar decisiones más acertadas.

Ahora pasemos a entender cómo se clasifican los datos.

Hay dos grandes categorías que debemos conocer.
Categoricos vs Numericos(discretos-Continuos).


Para ayudarte a visualizar esto, podemos pensar en la clasificación de datos como un árbol de clasificación,.
En un alto nivel tenemos los datos categóricos que agrupan información en categorías y los datos numéricos que incluyen cifras y medidas.

Dentro de los datos numéricos, además encontramos una subdivisión entre discretos y continuos.

Esta distinción es crucial cuando tratamos de modelar o analizar tendencias.


Los datos categóricos y los datos numéricos.



Vamos a profundizar en cada uno de estos tipos para que comprendas cómo puedes aplicar este conocimiento en tus análisis.

Primero hablemos de los datos categóricos.


CATEGORICOS

Como su nombre lo indica, este tipo de datos nos ayuda a clasificar o agrupar información. Por ejemplo, en un hospital o centro de salud, podrías querer analizar a los pacientes en función de su diagnóstico, siendo más específico, diabetes, hipertensión o asma.

Otro ejemplo sería evaluar el tipo de tratamiento recibido como quirúrgico, farmacológico o rehabilitación. Estos datos no tienen un valor numérico en sí mismo, sino que representan categorías o grupos (categóricos).

La correcta identificación de los datos categóricos te permitirá, por ejemplo, segmentar mejor a los pacientes, diseñar campañas de prevención más efectivas o personalizar tratamientos médicos. 

Para visualizar datos categóricos, suelen ser muy útiles los gráficos de barras o gráficos de sectores (gráficos de pastel o anillo), que nos muestran claramente cómo se distribuyen las categorías, como la frecuencia de una enfermedad por grupo de edad o sexo.

DATOS NUMERICOS

A continuación, vamos a profundizar en los datos numéricos. Empecemos con los datos discretos.

Los datos discretos(sin decimal) son aquellos que pueden ser contados. Estos valores son enteros y no pueden tener decimales. Un ejemplo clásico en el ámbito sanitario es el número de veces que un paciente acude a consulta en un año, la cantidad de cigarrillos que una persona fuma al día o el número de brotes de una enfermedad infecciosa en una comunidad durante un mes determinado.

discretos(sin decimal)

Este tipo de datos es ideal para situaciones donde estás haciendo un conteo (discretos sin decimal), como el número de personas vacunadas durante una campaña específica, la cantidad de efectos adversos reportados tras la administración de un fármaco en un trimestre, o el número de pulsaciones por minuto (aunque se mida como entero, en realidad es un conteo de eventos en un intervalo de tiempo).


Cuando trabajas con datos discretos, puedes utilizar gráficos de columna o tablas para mostrar de manera efectiva como se distribuyen estos conteos y cómo evolucionan con el tiempo.

Ahora pasemos a los datos continuos,

Son los que encontramos con mayor frecuencia en el análisis de datos clínicos y epidemiológicos avanzados.

Los datos continuos pueden tomar cualquier valor dentro de un rango, incluyendo cifras decimales extremadamente precisas. Un buen ejemplo sería la presión arterial  de un paciente, que puede variar minuto a minuto durante una medición continua.

Aquí no podemos limitar los valores a enteros, ya que las mediciones clínicas pueden tener múltiples decimales dependiendo de la precisión del instrumento de medición.

Otro ejemplo sería el nivel de glucosa en sangre de un paciente diabético, que puede cambiar con precisión decimal a lo largo del día. Estos datos son muy útiles para analizar tendencias evolutivas de una enfermedad o para realizar modelos de regresión que predigan la progresión de una patología o la respuesta a un tratamiento.

Cuando visualices datos continuos en bioestadística, los gráficos de líneas (para series temporales) y los histogramas (para distribuciones) son tus mejores aliados, ya que te permiten ver la distribución y las tendencias de forma clara en poblaciones de pacientes.


Ahora entremos en el análisis comparativo entre datos discretos y continuos utilizando ejemplos relevantes en el ámbito sanitario y hospitalario.

Primero hablemos de los datos discretos(Enteros).

Como mencionamos antes, estos datos son contables y finitos, es decir, se pueden contar y siempre resultan en un número entero.

Por ejemplo, si estamos analizando el número de ingresos hospitalarios de un paciente en un año, este será siempre un valor entero. Podrían ser uno, o cinco, o quizás 20 ingresos.

Otro ejemplo típico sería el número de sesiones de quimioterapia recibidas por un paciente oncológico, o el número de fármacos prescritos en una consulta, ya que no podemos administrar una fracción de una sesión o de un medicamento completo.


Sin embargo, aquí surge una duda bastante válida: ¿Qué pasa con un número decimal exacto como 36.5 °C de temperatura corporal? ¿No debería considerarse también discreto ya que tiene un valor exacto?

Esta es una pregunta muy válida y vale la pena aclarar este punto.

Aunque un valor como 36.5 °C parece exacto, en realidad pertenece a la categoría de datos continuos. La razón es que los datos continuos pueden tomar cualquier valor dentro de un rango y permiten una precisión infinita después del punto decimal.

Aunque redondeamos —y esta es la palabra clave—, estamos redondeando para facilitar su uso en la práctica clínica. Por ejemplo, en termómetros digitales que muestran solo un decimal.

En su naturaleza, el valor puede tener más dígitos decimales si se mide con mayor precisión. Un termómetro más sensible podría registrar 36.5238 °C, pero nosotros redondeamos a 36.5 °C por razones prácticas.


Ejemplo clásico en bioestadística: estatura y peso

Cuando decimos que un paciente mide 1.75 metros, esa es una medición redondeada. En realidad, su estatura exacta podría ser 1.7545789 metros y un número infinito de decimales que estamos redondeando a 1.75 metros por conveniencia clínica.

Lo mismo ocurre con el peso corporal (75.3 kg), la concentración de colesterol (189.5 mg/dL) o el volumen espiratorio forzado en espirometrías (2.45 litros).


Tabla comparativa en contexto sanitario:

Tipo de datoEjemplos en saludCaracterística
DiscretosNúmero de hospitalizaciones, dosis de medicamento, hijos por paciente, días de ingresoNúmeros enteros (contables)
ContinuosTemperatura, peso, talla, presión arterial, glucosa, colesterolPueden tener decimales infinitos (medibles)

Conclusión práctica en bioestadística:

discretos(sin decimal)

  • Los datos discretos nos ayudan a contar eventos clínicos (frecuencias)

  • Los datos continuos nos ayudan a medir variables fisiológicas con precisión

  • Ambos son fundamentales para el análisis estadístico en investigación clínica y la toma de decisiones basadas en evidencia




Los datos discretos son ideales para contar eventos concretos como el número de clientes que adquieren un producto.

Y los datos continuos, en cambio, capturan variaciones precisas y nos permiten hacer análisis más detallados como la proyección de rentabilidades o el seguimiento de precios de acciones en tiempo real.

RESUMEN: Tipos de datos en bioestadística clínica

En resumen:

Los datos discretos son ideales para contar eventos clínicos concretos, como el número de pacientes que presentan una complicación postoperatoria, la cantidad de ingresos hospitalarios en un servicio durante un mes, o el número de dosis de medicamento administradas a un paciente.

Los datos continuos, en cambio, capturan variaciones precisas en las mediciones fisiológicas y nos permiten hacer análisis más detallados, como el seguimiento de la evolución de la presión arterial en pacientes hipertensos, la variación de la glucemia a lo largo del día, o la proyección de la función pulmonar en pacientes con EPOC.

Entender esta distinción es clave para seleccionar las herramientas estadísticas y visualizaciones correctas, optimizando así la precisión de tu análisis y la toma de decisiones clínicas basadas en evidencia.


Hemos cubierto bastante terreno en esta sesión y para resumir:

Tipo de datoFunción principalEjemplos en salud
Datos categóricos (cualitativos)Clasificar información en gruposSexo, grupo diagnóstico, fumador/no fumador, tipo de tratamiento
Datos discretos (cuantitativos contables)Contar eventosN° de hospitalizaciones, dosis administradas, días de ingreso
Datos continuos (cuantitativos medibles)Medir variaciones precisasPeso, talla, presión arterial, glucosa, colesterol

Aplicación práctica en el entorno hospitalario:

  • Los datos categóricos te ayudan a segmentar poblaciones de pacientes para análisis comparativos

  • Los datos discretos te permiten cuantificar la carga asistencial y los recursos utilizados

  • Los datos continuos son esenciales para el monitoreo de la evolución clínica y la detección temprana de deterioro en los pacientes

Dominar esta clasificación te permitirá:

  1. Diseñar mejores estudios de investigación clínica

  2. Seleccionar las pruebas estadísticas adecuadas (t-student, Chi-cuadrado, ANOVA, etc.)

  3. Interpretar correctamente los resultados de artículos científicos

  4. Comunicar hallazgos de manera efectiva al equipo multidisciplinario

  5. Contribuir a la medicina basada en evidencia y a la mejora continua de la calidad asistencial






Comentarios

Entradas más populares de este blog

11

1-6-p-POBLACION

5-11-INTRODUCCION