INTRODUCCION
La estadística es una colección de herramientas que se utilizan para obtener respuestas a preguntas importantes sobre los datos.
El campo de la estadística es la ciencia de aprender de los datos. Saber de estadística te permite utilizar los métodos adecuados para recopilar datos, hacer análisis de forma correcta y presentar los datos de forma eficaz.
Es un proceso crucial detrás de cómo hacemos descubrimientos en la ciencia, cómo tomamos decisiones basadas en datos y hacemos predicciones.
Y por qué debería estudiar estadística?
Hay muchas razones por la cual deberías estudiar estadística.
La primera es para poder hacer investigaciones.
Si no conoces los métodos estadísticos necesarios, será muy difícil tomar decisiones basadas en tus datos.
Tendrás que saber recopilar tus datos, escoger el texto adecuado y analizar los resultados. Estudiar estadística también desarrolla tus habilidades críticas y analíticas.
La estadística puede ser utilizada para engañar o para desinformar. Entonces, si entiendes la estadística, estarás en mucha mejor posición para poder evaluar las conclusiones que te comunican los demás.
Si trabajas con datos de cualquier tipo, haces investigaciones o quieres meterte en el mundo de la ciencia. de Datos, Aprender estadística puede ser muy valioso.
=================================================
La estadística se puede dividir en dos bloques básicos la estadística descriptiva y la estadística inferencia.
La estadística descriptiva se refiere a métodos utilizados para resumir nuestros datos y para aprender y compartir información sobre ellos.
Una forma de pensar sobre la estadística descriptiva es la de hacer cálculos para resumir las propiedades de nuestros datos.
La estadística descriptiva también puede incluir gráficos y visualizaciones que nos permiten entender nuestros datos de una forma más visual.
La estadística inferencial es una forma de cuantificar las propiedades de una población a partir de una muestra y hacer inferencias y predicciones.
Podemos testear hipótesis utilizando diferentes grados de confianza.
=====================Poblacion y Muestra=============================
Entonces, qué es la población?
La población denotada normalmente con N mayúscula, se refiere al universo conjunto o totalidad de los elementos sobre los que se investiga o se hacen estudios.
Es toda la población, mientras que la muestra denotada n minúscula normalmente es una parte o un subconjunto de elementos que se seleccionan previamente de una población para realizar un estudio.
Los parámetros suelen ser los datos de la población, mientras que los estadísticos son los datos de la muestra.
De ahí el nombre estadística.
La población es un poco difícil de definir.
Imagínate, por ejemplo, la población de la Universidad .
Cuántos alumnos son?
Todos los que están de vacaciones, los que están de intercambio en otros países, pueden ser todos ellos la población.
Por eso es difícil definir .
Una muestra en cambio, es más fácil.
Puedes entrar a la cafetería de la universidad y buscar a 50 alumnos.
Esto sería una muestra de la población de los alumnos de la universidad.
Entiendes la diferencia entre población y muestra?
La muestra debe ser siempre al azar y representativa, que debe reflejar los miembros de la población.
En el ejemplo que acabamos de hablar, si entramos a la cafetería de la universidad, no estamos eligiendo los alumnos al azar, ya que estamos escogiendo aquellos que estaban en ese momento en la cafetería.
No hemos escogido de todos los alumnos.
Por eso en este caso esta muestra no está escogida al azar y son representativos.
Bueno, nuestra muestra sería de aquellos alumnos que comen o van a la cafetería.
Pero qué pasa con los alumnos que nunca van a la cafetería?
Ellos también deberían ser parte de nuestra muestra. Por eso esta muestra tampoco es representativa.
Y cómo aseguramos de que nuestra muestra sea escogida al azar y sea representativa?
Una cosa que podríamos hacer es pedir acceso a la base de datos de todos los estudiantes de la universidad
y escoger un número de estudiantes al azar utilizando alguna técnica o algún programa para hacer esto.
Entonces, espero que hayás entendido la diferencia entre población y muestra y cómo escoger una muestra al azar y que sea representativa de nuestra población.
==================TIPOS DE DATOS================================
Hola y bienvenido a esta clase, donde hablaremos de los tipos de datos que existen.
Hay básicamente dos tipos de datos generales que existen.
Los categóricos o los numericos?
Los categóricos, por ejemplo, podrían ser la marca de un producto, un hombre o mujer si o no..
Esto serían respuestas a preguntas como qué marca de producto utilizas más?
Eres estudiante de la universidad?
Todas estas preguntas tienen respuestas categóricas.
Por ejemplo, la marca de ese producto, un sí o un no. Como hemos dicho.
Luego tenemos variables numéricas o datos numéricos y que están separados en discretos y continuos.
Un dato numérico discreto sería, por ejemplo, el número de hijos que alguien tiene.
Nadie tiene 1,5 hijos, un hijo y medio.
Es un número entero.
Vale, en este caso, el número de hijos.
Cualquier tipo de objeto que se cuenta realmente serían variables discretas.
El otro tipo de dato numérico es el continuo, es infinito e imposible de contar.
Por ejemplo, tu peso puedes pesar 70 kilos exactos o puedes pesar 70 con 2, 5, 3.
Por ejemplo.
Otros ejemplos de datos continuos serían la distancia
y el tiempo, que puede ser cualquier valor.
Entonces, los dos tipos de datos generales son categóricos y numéricos, y los numéricos pueden ser separados en discretos y continuos.
Vale, en la siguiente clase hablaremos sobre los niveles de medición.
=============================8. Visualización de datos categóricos==============
Has oído hablar de la frase una imagen vale más que mil palabras?
Pues un gráfico vale más que mil números.
Ahora que hemos visto los tipos de datos y niveles de medición que existen, podemos explorar los diferentes tipos de gráficos y tablas que nos permitirán resumir nuestros datos en visualizaciones.
Empezaremos con la representación de datos categóricos.
Qué tipos de gráficos y tablas podemos utilizar?
Existen cuatro tipos de representaciones que son las más utilizadas.
Tenemos primero las tablas de frecuencia donde podemos contar el número de cada categoría y también calcular la frecuencia relativa.
No te preocupes que ahora haremos un ejemplo.
El segundo tipo es el gráfico de barras, donde podemos ver visualmente el número de ocurrencias de cada categoría.
Luego está el gráfico de tarta, donde podemos ver la proporción de cada categoría.
Este tipo de gráfico es utilizado mucho en cuotas de mercado, por ejemplo, pero hay que tener mucho cuidado porque no nos da valores absolutos, sino una proporción.
El último es un diagrama de Pareto que nos permite ver los valores con barras, pero también tiene la frecuencia acumulada visualizada en una línea.
Este gráfico una de las ventajas del gráfico de barras y en el gráfico de tarta en 1.
********************************************Ahora haremos un ejemplo para que lo veáis.
Vale, pues aquí tenéis una tabla de frecuencia con tres productos producto A, producto B y producto
C. Tenemos 250 de producto A, 150 del punto B y 100 del producto C que suma 500, y esto podemos imaginarnos
que son ventas de un producto.
Entonces tenemos la frecuencia.
También tenemos la frecuencia relativa que veréis aquí que la frecuencia relativa es el número de ocurrencias
de ese producto dividido, el total.
Entonces con esta tabla nos da una visualización de estos datos categóricos con frecuencia y frecuencia
relativa.
Entonces ya podemos ver que el 50 por ciento de las ventas fueron producto a, el 30 por ciento fueron
producto B y el 20 por ciento fueron producto C.
Pero aparte de la tabla de frecuencia, podemos crear un gráfico de barras, como veis en este gráfico,
visualmente ya podemos ver el número de ventas de producto.
Y vemos que es mucho mayor que producto de producto.
C Cuando tenemos muchos productos.
A lo mejor crear una tabla de frecuencia tan grande pues nos es incomodo y realmente no se visualiza
también.
Entonces por eso el gráfico de barras es un gráfico muy utilizado cuando tienes que contar el número
de ocurrencias en cada categoría.
Luego tenemos el gráfico de tarta.
Como veis aquí, el gráfico de tarta separa en lo que parece cortes en una tarta.
El porcentaje en los diferentes productos este como he mencionado antes, este gráfico pues sirve para
ver las proporciones.
Vale, como vemos, la mitad de la tarta 50 por ciento es el producto A 30 el producto B y el 20 es
el producto C, y esto no nos deja verlo de una forma más visual.
El último que habíamos mencionado es el diagrama de Pareto.
Para hacer el diagrama de Pareto tenemos que calcular la frecuencia acumulada.
Como veis, aquí primero tenemos que ordenar.
En este caso ya estaban ordenados por 250, 150 y 100 y tenemos que crear aquí la frecuencia acumulada.
Vale.
Utilizando estos datos podemos crear este gráfico, que parece un gráfico de líneas con un gráfico de
barras encima.
Vale, y esto es el diagrama de Pareto.
Cuando tienes muchos productos puedes ver la proporción de cada producto.
Por ejemplo, aquí ya directamente vemos que hay 250 y vemos también que es el 50 por ciento de los
productos.
Utilizamos la acumulación para decir, por ejemplo, que los dos productos que además se venden venden
el 80 por ciento de los productos de acuerdo.
Y de dónde viene este gráfico de Pareto?
Pues el gráfico de Pareto fue inventado por Wilfredo Pareto, que fue un ingeniero, sociólogo, economista
y filósofo italiano.
Es muy conocido por el principio de Pareto.
La regla del 80 20, que seguramente habréis escuchado hablar del 80 por ciento del efecto, normalmente
viene del 20 por ciento de las causas.
Un ejemplo que contó Microsoft es que solucionando el 20 por ciento de sus bugs o fallos en su código
solo cenaban el 80 por ciento de los problemas de sus clientes.
Y este número del 80/20 es un número que se repite en un montón de diferentes ámbitos que sean de negocio
de tecnología y ciencia.
Siempre o casi siempre.
El 80 por ciento del efecto normalmente viene del 20 por ciento de las casas.
De acuerdo.
Así que para la representación de datos categóricos acordaros que existe la tabla de frecuencia del
gráfico de barras.
El gráfico de tarta y el diagrama de Pareto.
Comentarios
Publicar un comentario