6-12-Tiempo de recuperación

Problema: Tiempo de recuperación

Sean todos muy bienvenidos a esta nueva sesión en la que nos adentraremos en el análisis y visualización de variables numéricas dentro del campo de la bioestadística.

En la sesión anterior exploramos las variables categóricas y aprendimos a organizarlas en tablas de frecuencia, además de visualizarlas mediante gráficos de barras y diagramas circulares. Incluso aprendimos a construir un diagrama de Pareto, útil para identificar los factores más relevantes en un estudio.

El enfoque de esta sesión será trabajar con variables numéricas , específicamente en la construcción de distribuciones de frecuencia y su interpretación a través de histogramas.

Es importante destacar que en esta sesión aprenderemos a construir histogramas, que son ideales para representar variables numéricas continuas, ya que permiten agrupar los datos en intervalos y reflejar la continuidad de los valores.

Por otro lado, las variables numéricas discretas, debido a su naturaleza de valores separados y contables, suelen representarse con gráficos de barras, similares a los usados para variables categóricas.

Para contextualizar nuestro estudio, trabajaremos con un caso práctico. Analizaremos los tiempos de recuperación en días de un grupo de pacientes hospitalizados tras una intervención quirúrgica menor.

Tiempo
1	3
2	5
3	7
4	8
5	16
6	18
7	21
8	27
9	29
10	32
11	38
12	40
13	43
14	51
15	56
16	57
17	58
18	61
19	69
20	71
21	73
22	83
23	93
24	97
25	98
26	100
27	102
28	110
29	113
30	122
31	123
32	126
33	127
34	132
35	136
36	138
37	142
38	146
39	148
40	152
41	153
42	157
43	160
44	164
45	166
46	167
47	169
48	175
49	177
50	183

Imaginemos que contamos con datos de 50 pacientes, cuyos tiempos de recuperación varían entre 3 y 183 días. Nuestro objetivo será organizar esta información en una tabla de distribución de frecuencia y luego construir un histograma para visualizar cómo se distribuyen los tiempos de recuperación.

El primer paso será calcular el número de intervalos óptimos. Para ello, utilizaremos la regla de Sturges, que establece que el número de intervalos se obtiene con la fórmula:

k=1+3.322log⁡10(n)k = 1 + 3.322 \log_{10}(n)

Donde n es el número de observaciones. Aplicando esta regla a nuestro conjunto de datos (50 observaciones), obtenemos aproximadamente 6.64 intervalos, que podemos redondear a 7. Otra alternativa es calcular la raíz cuadrada del número de observaciones, lo que también nos da un valor cercano a 7.

El siguiente paso es determinar el tamaño del intervalo, utilizando la fórmula:

Taman˜o del intervalo=Valor maˊximo−Valor mıˊnimoNuˊmero de intervalos\text{Tamaño del intervalo} = \frac{\text{Valor máximo} - \text{Valor mínimo}}{\text{Número de intervalos}}

Sustituyendo nuestros valores:

183−37=25.71\frac{183 - 3}{7} = 25.71

Podemos redondear a 26 para simplificar la construcción de la tabla de distribución de frecuencia.

Con esta información, construimos la tabla, asignando cada dato del paciente a su correspondiente intervalo y contando la frecuencia de cada grupo. Luego, calculamos la frecuencia relativa dividiendo la frecuencia absoluta entre el total de observaciones.

Para la visualización, crearemos un histograma en Excel. Aunque Excel tiene una opción predeterminada de histograma, podemos construirlo manualmente utilizando un gráfico de columnas agrupadas y ajustando el ancho de las barras para que estén unidas, resaltando así la continuidad de los datos.

Este análisis es fundamental en bioestadística, ya que permite interpretar la distribución de variables clínicas y epidemiológicas, facilitando la toma de decisiones en el ámbito de la salud.

Con esto finalizamos la sesión. Muchas gracias por su atención.

Buscar este blog

SOTELO-ESTADISTICAS

6-12-Tiempo de recuperación

Problema: Tiempo de recuperación

Comentarios

Publicar un comentario

Entradas más populares de este blog

11

1-6-p-POBLACION

3-9. -CALSIFICACION PRO MEDICION