Módulos sobre análisis estadísticos (regresión, correlación, probabilidad, muestreo e hipótesis)
Modulo 1. Regresión y Correlación
Establecer y explicar el objeto y la finalidad del análisis del regresión y correlación. Ejemplo
Regresión lineal simple tiene como objeto estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta. Cuando la relación lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, según lo establecido, se tendrá
De manera equivalente, otra formulación del modelo de regresión lineal simple sería: si xi es un valor de la variable predictora e Yila variable respuesta que le corresponde, entonces
Ei es el error o desviación aleatoria de Yi .
Ejemplo de regresión lineal
La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra. Además la correlación determina la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.
Ejemplo de correlación
Y/X | 100 | 50 | 25 |
14 | 1 | 1 | 0 |
18 | 2 | 3 | 0 |
22 | 0 | 1 | 2 |
Obtener e interpretar el coeficiente de correlación lineal.
Convertimos la tabla de doble entrada en una tabla simple.
xi | yi | fi | xi · fi | xi2 · fi | yi · fi | yi2· fi | xi · yi · fi |
100 | 14 | 1 | 100 | 10 000 | 14 | 196 | 1 400 |
100 | 18 | 2 | 200 | 20 000 | 36 | 648 | 3 600 |
50 | 14 | 1 | 50 | 2 500 | 14 | 196 | 700 |
50 | 18 | 3 | 150 | 7 500 | 54 | 972 | 2 700 |
50 | 22 | 1 | 50 | 2 500 | 22 | 484 | 1 100 |
25 | 22 | 2 | 50 | 1 250 | 44 | 968 | 1 100 |
10 | 600 | 43 750 | 184 | 3 464 | 10 600 |
Es una correlación negativa débil.
BIBLIOGRAFIA
http://e-stadistica.bio.ucm.es/cont_mod_1.html
http://es.wikipedia.org/wiki/Correlación
Kenney, J. F. and Keeping, E. S., Mathematics of Statistics, Pt. 2, 2nd ed. Princeton, NJ: Van Nostrand, 1951.
http://www.ditutor.com/estadistica_2/correlacion_estadistica.html
Modulo 2. Probabilidad
Dar ejemplos de casos en las que se puede aplicar la probabilidad
Nuestra vida cotidiana está llena de imponderables, cosas que nos suceden sin que podamos predecir los resultados con exactitud. Por ejemplo, tras esparcir dulce sobre una rebanada de pan, ésta se nos puede caer de las manos. ¿Sabemos a ciencia cierta si a consecuencia de ello ensuciaremos el piso? Claramente no, pues nuestra experiencia nos indica que algunas veces el lado con dulce cae para abajo y otras para arriba. Cuando el referí de un partido revolea la moneda para determinar qué equipo hará el saque, ¿sabemos con seguridad a cuál le tocará hacerlo? La respuesta es “tampoco”.
Estos son sólo dos de los innumerables ejemplos en los cuales el azar interviene. A los sucesos donde interviene el azar se los llama “aleatorios” o “probabilísticos”. Diremos que hay una probabilidad que se caiga el pan y el dulce ensucie el piso. Hay una probabilidad que nuestro equipo gane el saque, pero (¡desgraciadamente!) no podemos tener la certeza de ello.
Detección de plagas en la siembra
Para detectar qué plagas hay en la siembra, los campesinos o agrónomos, revisan al azar determinado número de plantas. Si están afectadas deben tomar medidas al respecto.
Juegos de Azar
Cuando se juega a los volados o a los dados no sabemos con seguridad quién ganará u obtendrá el premio, pero podemos predecir un número si observamos los resultados que se obtienen en una serie de volados o tiradas.
Hagamos el experimento de revolear una moneda varias veces. Seguramente comprobaremos lo que nuestra experiencia previa ya nos indica: en promedio, una de cada dos veces que revoleamos la moneda sale “cara”. Sin embargo, antes de cada tirada, no podemos asegurar si justo esa vez saldrá cara o saldrá ceca. Esto no quiere decir que si repetimos sólo dos veces nuestro intento necesariamente obtendremos una cara y una ceca, sino más bien que si revoleamos la moneda un número muy grande de veces, la cantidad de caras y cecas serán muy similares. Decimos entonces que la probabilidad de sacar cara es ½. Lo mismo sucede con la probabilidad de sacar ceca, que también es ½. La probabilidad de sacar cara o ceca es la suma de ambas probabilidades, ya que cuando cae la moneda o sale cara o sale ceca, no hay otro resultado.
Cuando estamos completamente seguros que un suceso ocurrirá, decimos que éste tiene probabilidad 1. Por ejemplo, si faltando tres fechas para finalizar el campeonato Boca le lleva 10 puntos al segundo equipo, la probabilidad que salga campeón es 1, es decir tenemos la certeza que va a ser campeón (aunque pierda los últimos partidos).
Cuando es imposible que algo ocurra, decimos que ese suceso tiene probabilidad cero. Si faltando 3 fechas River le lleva a Boca 10 puntos, la probabilidad que Boca salga campeón es cero, puesto que ya no hay forma en que pueda lograrlo.
Cuando un suceso es probabilístico (o aleatorio) siempre tiene varios resultados posibles (más de uno). Si pudiéramos repetirlo muchas veces y anotáramos la cantidad de veces que cada resultado se repite, estaríamos haciendo una estadística de este suceso y comprobaríamos que a medida que repetimos la prueba, el cociente (o división) entre el número de veces que sale un resultado y el número de pruebas efectuadas se va haciendo más y más próximo a un determinado número. Por ejemplo, a medida que revoleamos una moneda más y más veces, ese número se va acercando a ½. Ese número es la probabilidad que en el suceso estudiado se obtenga el resultado considerado.
BIBLIOGRAFIA
http://www.conevyt.org.mx/cursos/cursos/infygraficas/ig01_01.html
http://www.cnea.gov.ar/xxi/divulgacion/probabilidades/m_probabilidad_f1.html
Modulo 3. Teoría del muestreo
Listar las situaciones en las que sea preferible hacer un muestreo a efectuar un censo y viceversa.
El censo es el recuento que se hace de una población finita; es decir, debe ser numerable y contable. Es claro que si la población es grande, los costos y el tiempo serán mucho mayores que cuando se utiliza muestreo, no obstante, dado la naturaleza de la variable en estudio y de los objetivos de la investigación, es posible que en algunos casos se recomiende éste procedimiento. De cualquier manera, el censo no garantiza una confiabilidad en los resultados del 100%, precisamente porque existen otros factores que inciden en las diferentes mediciones en una investigación.
Un censo se efectúa sobre el total del universo relevado.
Ejemplo: un caso en que se puede utilizar los censos sería como el censo económico que se aplica a las empresas, comercios, establecimientos comerciales y el de Población es para la contabilización del número de habitantes de cierta área, país, ciudad.
Hay que recordar que en un censo se analizan todos y cada uno de los elementos de la población. Es considerado como el único procedimiento utilizable para saber sobre fenómenos con poca frecuencia.
Sus usos son:
- Como base para el análisis y la evaluación demográfica.
- Para proyectar, establecer y desarrollar políticas de gobierno.
- Como “marco muestral” para encuestas.
- La información obtenida puede presentarse por unidades administrativas u otras unidades de estratificación cualquiera sea su tamaño, pudiendo obtener datos para áreas pequeñas.
- Punto de referencia para las estadísticas continuas.
Una muestra es un subconjunto de la población estadística, es decir, es una parte de ella y por lo tanto tiene que poseer las mismas características de la población objeto de estudio.
Una muestra es una selección de parte del universo.
Ejemplo: se toman 1000 personas seleccionadas de un total de 1.000.000 que viven en una ciudad para preguntar en una encuesta de voto político.
Si la población es grande un censo puede ser extremadamente caro. También puede ocurrir que la demora en obtener información de un censo haga que la información ya no sea válida cuando la tenemos. Para ejemplificar otra situación imagine que queremos tener información de la duración de lavadoras. En este caso además tenemos que destruir la unidad para obtener la información, por lo que un censo tampoco es posible.
Para asegurarnos que toda muestra aleatoria simple tenga la misma probabilidad de ser seleccionada necesitamos algún dispositivo confiable de selección de las unidades. Existen métodos alternativos como la selección de fichas de una urna, la selección de papeles numerados de una bolsa y otros. Pero un sistema confiable y seguro que siempre funciona es la tabla de números aleatorios.
En diferencia al censo, en la muestra se analiza una parte de la población.
BIBLIOGRAFIA
www.scribd.com/doc/7861294/Unidad-1-Censo-y-Muestreo
http://es.answers.yahoo.com/question/index?qid=20111129213016AATBk2O
http://www.virtual.unal.edu.co/cursos/sedes/manizales/4010039/Lecciones/CAPITULO%20II/dmuestra.htm
Modulo 4. Prueba de hipótesis
Conocer la teoría de la hipótesis como una herramienta para la inferencia estadística
Dentro de la inferencia estadística, un contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es un procedimiento para juzgar si una propiedad que se supone en una población estadística es compatible con lo observado en una muestra de dicha población. Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson.
Mediante esta teoría, se aborda el problema estadístico considerando una hipótesis determinada Ho y una hipótesis alternativa H1, y se intenta dirimir cuál de las dos es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto número de experimentos.
Está fuertemente asociada a los considerados errores de tipo I y II en estadística, que definen respectivamente, la posibilidad de tomar un suceso falso como verdadero, o uno verdadero como falso.
Existen diversos métodos para desarrollar dicho test, minimizando los errores de tipo I y II, y hallando por tanto con una determinada potencia, la hipótesis con mayor probabilidad de ser correcta. Los tipos más importantes son los test centrados, de hipótesis y alternativa simple, aleatorizados, etc. Dentro de los tests no paramétricos, el más extendido es probablemente el test de la U de Mann-Whitney.
Las técnicas de contraste de hipótesis son también de amplia aplicación en muchos otros casos, como ensayos clínicos de nuevos medicamentos, control de calidad, encuestas, etcétera.
Al realizar cualquier contraste de hipótesis estadístico se deben seguir las siguientes etapas:
- Plantear el contraste de hipótesis, definiendo la hipótesis nula (H0, hipótesis que se desea contrastar), y la hipótesis alternativa (H1, cualquier forma de negación de la hipótesis nula).
- Definir una medida de discrepancia entre la información que proporciona la muestra (X) y la hipótesis H0. Esta medida de discrepancia
Se denomina estadístico del contraste y será cualquier función de los datos muestrales y de la información de la hipótesis nula Ho. La medida de discrepancia debe seguir una distribución conocida cuando H0 sea cierta, de forma que se pueda distinguir entre:
-
-
- una discrepancia grande, la que tiene una probabilidad muy pequeña de ocurrir cuando H0 es cierto.
- una discrepancia pequeña, la que tiene una probabilidad grande de ocurrir cuando H0 es cierta.
-
- Decidir qué valores de d se consideran muy grandes, cuando H0 es cierto, para que sean atribuibles al azar. Esto es, decidir que discrepancias se consideran inadmisibles cuando H0 es correcto, lo que equivale a indicar el valor del nivel de significación, que se denota por α.
- Tomar la muestra (X), calcular el valor del estadístico d asociado a la muestra (valor crítico del contraste) y analizar:
- Si d es pequeño (pertenece a la región de aceptación), entonces se acepta la hipótesis H0.
- Si d es grande (pertenece a la región de rechazo), entonces se rechaza la hipótesis H0.
BIBLIOGRAFIA
http://e-stadistica.bio.ucm.es/mod_contraste/contraste1.html
http://es.wikipedia.org/wiki/Contraste_de_hipótesis
Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill, 1960, page 288.)
http://www.udc.es/dep/mate/estadistica2/sec1_3.html
Citar este texto en formato APA: _______. (2021). WEBSCOLAR. Módulos sobre análisis estadísticos (regresión, correlación, probabilidad, muestreo e hipótesis). https://www.webscolar.com/modulos-sobre-analisis-estadisticos-regresion-correlacion-probabilidad-muestreo-e-hipotesis. Fecha de consulta: 21 de diciembre de 2024.