6-12-Tiempo de recuperación

 https://docs.google.com/forms/d/e/1FAIpQLSfU_mIsLH4b9yAYcmAmbraet6sHliDnBAF6KFfq6JpTJ5DUuQ/viewform?usp=sharing

https://docs.google.com/spreadsheets/d/1E87X2Z96L76IlQimzpGhYZYIhfGSrXmkhuSXzmmeYWc/edit?usp=sharing

Problema: Tiempo de recuperación


Sean todos muy bienvenidos a esta nueva sesión en la que nos adentraremos en el análisis y visualización de variables numéricas dentro del campo de la bioestadística.

En la sesión anterior exploramos las variables categóricas y aprendimos a organizarlas en tablas de frecuencia, además de visualizarlas mediante gráficos de barras y diagramas circulares. Incluso aprendimos a construir un diagrama de Pareto, útil para identificar los factores más relevantes en un estudio.

El enfoque de esta sesión será trabajar con variables numéricas , específicamente en la construcción de distribuciones de frecuencia y su interpretación a través de histogramas.


Es importante destacar que en esta sesión aprenderemos a construir histogramas, que son ideales para representar variables numéricas continuas, ya que permiten agrupar los datos en intervalos y reflejar la continuidad de los valores. 

Por otro lado, las variables numéricas discretas, debido a su naturaleza de valores separados y contables, suelen representarse con gráficos de barras, similares a los usados para variables categóricas.

Para contextualizar nuestro estudio, trabajaremos con un caso práctico. Analizaremos los tiempos de recuperación en días de un grupo de pacientes hospitalizados tras una intervención quirúrgica menor.


Tiempo

1

3

2

5

3

7

4

8

5

16

6

18

7

21

8

27

9

29

10

32

11

38

12

40

13

43

14

51

15

56

16

57

17

58

18

61

19

69

20

71

21

73

22

83

23

93

24

97

25

98

26

100

27

102

28

110

29

113

30

122

31

123

32

126

33

127

34

132

35

136

36

138

37

142

38

146

39

148

40

152

41

153

42

157

43

160

44

164

45

166

46

167

47

169

48

175

49

177

50

183


Imaginemos que contamos con datos de 50 pacientes, cuyos tiempos de recuperación varían entre 3 y 183 días. Nuestro objetivo será organizar esta información en una tabla de distribución de frecuencia y luego construir un histograma para visualizar cómo se distribuyen los tiempos de recuperación.

El primer paso será calcular el número de intervalos óptimos. Para ello, utilizaremos la regla de Sturges, que establece que el número de intervalos se obtiene con la fórmula:

k=1+3.322log⁡10(n)k = 1 + 3.322 \log_{10}(n)



Donde n es el número de observaciones. Aplicando esta regla a nuestro conjunto de datos (50 observaciones), obtenemos aproximadamente 6.64 intervalos, que podemos redondear a 7. Otra alternativa es calcular la raíz cuadrada del número de observaciones, lo que también nos da un valor cercano a 7.

El siguiente paso es determinar el tamaño del intervalo, utilizando la fórmula:

Taman˜o del intervalo=Valor maˊximo−Valor mıˊnimoNuˊmero de intervalos\text{Tamaño del intervalo} = \frac{\text{Valor máximo} - \text{Valor mínimo}}{\text{Número de intervalos}}

Sustituyendo nuestros valores:

183−37=25.71\frac{183 - 3}{7} = 25.71

Podemos redondear a 26 para simplificar la construcción de la tabla de distribución de frecuencia.

Con esta información, construimos la tabla, asignando cada dato del paciente a su correspondiente intervalo y contando la frecuencia de cada grupo. Luego, calculamos la frecuencia relativa dividiendo la frecuencia absoluta entre el total de observaciones.

Para la visualización, crearemos un histograma en Excel. Aunque Excel tiene una opción predeterminada de histograma, podemos construirlo manualmente utilizando un gráfico de columnas agrupadas y ajustando el ancho de las barras para que estén unidas, resaltando así la continuidad de los datos.

Este análisis es fundamental en bioestadística, ya que permite interpretar la distribución de variables clínicas y epidemiológicas, facilitando la toma de decisiones en el ámbito de la salud.

Con esto finalizamos la sesión. Muchas gracias por su atención.


Comentarios

Entradas más populares de este blog

11

1-6-p-POBLACION

5-11-INTRODUCCION