Fisicanet ®

Inferencia Estadística

Contenido: Estimadores puntuales y por intervalo de confianza para media y varianza poblacional

Estimadores puntuales y por intervalo de confianza para media y varianza poblacionales

Introducción al tema

• El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un subconjunto más o menos amplio de los mismos es el Método Estadístico.

• En el experimento típico, el objetivo básico es estimar algunas características que describan la población de interés. Es decir:

• Estimar los parámetros que caracterizan a la función de probabilidad de la variable aleatoria en estudio

Mapa conceptual

Mapa conceptual

Introducción al tema

Veamos el caso de un especialista en producción animal:

Después de alimentar un lote de terneros con una ración alimenticia particular, necesita expresar numéricamente el aumento medio de peso de sus animales

En este caso, suponemos que se dispone de los conocimiento suficientes como para decir:

La variable aleatoria x de nuestro problema, tiene una función de probabilidad conocida: f(X; θ12; ... ; θp)y depende de:

Parámetros θ1 hasta θp que son desconocidos.

Podría ocurrir que el aumento de peso de los terneros siguieran una distribución normal con media μ y varianza σ².

En este caso el experimentador persigue como objetivo, estimar a μ y σ².

Lo hará a partir de la manipulación de un conjunto de observaciones que ha de seleccionar de la población y que constituirán una muestra aleatoria de la misma.

Razonamiento a seguir:

• Pensar como se define la población y la muestra

• Qué tipo de procedimiento utilizar para seleccionar una muestra aleatoria.

• Qué debería calcular para estimar los parámetros de interés. (estadístico)

• Qué función de distribución presentan los estimadores elegidos.

• Cómo validar las estimaciones a partir de la muestra.

Es decir Inferir de la Muestra a la población

Inferencia Estadística

La inferencia estadística es la forma de tomar decisiones basadas en probabilidades y presenta dos aspectos:

1. Estimación de parámetros:

- Puntual
- Por intervalos

2. Prueba de Hipótesis con respecto a una función elegida como modelo.

En esta clase discutiremos estos puntos

Estimación Puntual

Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media , μ, o la desviación estándar , σ), es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional.

Una estimación puntual es el valor de la estadística de la muestra correspondiente.

Estimadores puntuales de los parámetros de una población normal

Sea una muestra aleatoria simple, X1, X2, ...... , Xn de una población con distribución N(μ, σ²).

-Estimador de la media

La distribución muestral de la media es:

x ≡ N(μ,σ/√n)

Estimadores puntuales de los parámetros de una población normal

S/√n estima a la desviación típica de la media σ/√n y se denomina error estándar de la media muestral, por esta razón se dice que el error estándar de la media mide la variabilidad de la media en el muestreo.

-Estimador de la Varianza

Varianza muestral

Sea X1, X2, ... , Xn, una muestra aleatoria simple de una población X ≡ N(μ,σ²), entonces la variable aleatoria

Inferencia Estadística

sigue una ji-cuadrado con n-1 grados de libertad.

Del resultado anterior se deduce que la variable (n - 1).S²/σ² sigue una distribución ji-cuadrado con n-1 grados de libertad.

Realizada la estimación de un parámetro cabe preguntarse:

1- ¿ES exacta la estimación?

2- ¿ES probable que la estimación sea alta o baja?

3- ¿Con otra muestra se obtendría el mismo resultado, o bastante diferente?

4- la calidad de un procedimiento de estimación ¿mejora bastante si la estadística de la muestra es menos variable e insesgada a la vez?

Estimadores y propiedades deseables de los estimadores

• la distancia entre el estimador y el parámetro a estimar puede medirse mediante los que se denomina el error cuadrático medio, que se define como el valor esperado del cuadrado de la diferencia entre el estimador y el verdadero parámetro.

ECM (Theta) = E(Theta - θ)²

El ECM es importante ya que puede escribirse como

ECM (Theta) = AVR (Theta) + [θ - E(Theta)]²

una es la varianza del estimador y otra el cuadrado del sesgo.

• -Ausencia de sesgo-

Se dice que un estimador es insesgado (o centrado) si la esperanza del estimador coincide con el parámetro a estimar E(Theta) = θ.

• -Consistencia-

Se dice que un estimador es consistente si se aproxima cada vez más al verdadero valor del parámetro a medida que se aumenta el tamaño muestral.

Pr[(Theta - θ) > ε] → 0

n → ∞, ε > 0

La distribución del estimador se concentra más alrededor del verdadero parámetro cuando el tamaño muestral aumenta.

• -Eficiencia-

Es claro que un estimador será tanto mejor cuanto menor sea su varianza, ya que se concentra más alrededor del verdadero valor del parámetro. Se dice que un estimador insesgado es eficiente si tiene varianza mínima.

• -Suficiencia-

Un estimador es suficiente si utiliza una cantidad de la información contenida en la muestra de manera que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está estimando.

Efectos de la variabilidad y el sesgo

 

Sesgo negativo
(subestimación)

Insesgada
(estimación en el blanco)

Sesgo positivo
(sobreestimación)

Alta variación

Baja variación

Métodos de estimación

Hay varios métodos de estimación, el de máxima verosimilitud es el que proporciona estimadores consistentes pero no siempre insesgados. Los estimadores mencionados en los puntos anteriores (x, S²) eran estimadores máximo verosimiles. El mismo resultado se puede obtener por el método de los momentos.

El método de mínimos cuadrados se verá cuando se trate regresión.

Estimación por intervalos

Dada una muestra aleatoria X1, X2, ... , Xn , de una población con función de densidad f(x;θ) Un intervalo de confianza, de extremos Linferior y Lsuperior, para el parámetro θ de la población es un par ordenado de funciones reales de las n medidas de la muestra

I θ = [L inferior (X1,...,Xn);L superior (X1,..., Xn)]

Construidas de forma que la probabilidad de que los extremos contengan al verdadero valor del parámetro es un valor prefijado (1 - α). Al número (1 - α) se le denomina "nivel de confianza".

• El nivel de confianza suele ser 0,95 (95%) ó 0,99 (99%). La interpretación práctica es sencilla, por ejemplo si el nivel de confianza es del 95%, significa que en el 95% de las veces que repitiéramos el experimento, el intervalo de confianza calculado contendría al verdadero valor del parámetro y en el 5% restante el intervalo no contendría el verdadero valor.

• Una vez que el intervalo de confianza ha sido calculado para una muestra concreta, el intervalo obtenido contiene o no contiene al verdadero valor del parámetro, con probabilidad 1, por esa razón, cuando ya tenemos un valor concreto hablamos de confianza y no de probabilidad. Confiamos en que el intervalo que hemos calculado sea del 95% que contiene el verdadero valor.

Nivel de confianza gráficamente

Figura 2: interpretación del nivel de confianza en un intervalo para la media de una distribución normal.

Intervalo de confianza para la media poblacional, σ conocido

Supongamos que disponemos de una población en la que tenemos una v.a. con distribución N(μ,σ) con σ conocida (de estudios previos, por ejemplo).

Obtenemos una muestra de tamaño n y deseamos estimar la media μ de la población. El estimador puntual de la misma es la media muestral cuya distribución muestral es conocida

la cantidad

x ≡ N(μ,σ/√n)

z = (x - μ)/(σ/√n)

tendrá distribución normal estándar

Sobre la distribución N(0, 1) podremos seleccionar dos puntos simétricos -zα/2 y z α/2 , tales que

P(-z α/2≤ Z ≤ z α/2 ) = 1-α

Figura 1: selección de los puntos críticos para el cálculo del intervalo de confianza.

Sustituyendo Z por su valor en este caso particular

Inferencia Estadística

Despejando nos queda el intervalo de confianza,

Inferencia Estadística

Ejemplo,

• Obtener un I. C. del 95% para el promedio de un lote de 500 novillos, de los cuales se pesa una muestra de 25 animales, obteniéndose un = 390 kg. Se sabe que σ² es de 400 kg².

Inferencia Estadística

{382,16 ≤ μ ≤ 397,84}

Recordemos que si la varianza poblacional es desconocida y la variable es normal o se puede aproximar a la distribución normal por el Teorema central del límite, entonces se usaría la t de Student con n - 1 grados de libertad y el desvío estándar muestral.

El intervalo de confianza que resulta,

Inferencia Estadística

Ejemplo,

En un establecimiento dedicado a la elaboración de alimentos balanceados para aves, se afirma que su producto aumenta el peso promedio de las aves en 30 g diarios. En una muestra de 9 aves tomadas al azar, se obtuvo un aumento promedio de 35 g con desviación de 3,04 g. Estimar el intervalo de confianza del 95% para el verdadero aumento promedio

Inferencia Estadística

{32,66 ≤ μ ≤ 37,34}

Determinación del tamaño de muestra n para un grado de precisión dado

z 1 - α/2.(σ/√n) es la mitad del ancho del intervalo de confianza (producto del coeficiente y el error estándar) y se denomina error máximo de estimación E.

Dado un valor de error y un cierto nivel de confianza, puedo estimar cuál sería el tamaño de la muestra

1 - α.σ²/E² = n

Intervalo de confianza para la varianza poblacional

Sea X una variable aleatoria con distribución normal con μ y σ desconocidos y sea X1, X2, ..., Xn una muestra aleatoria de tamaño n.

El intervalo de confianza se construye a partir de la variable

χ² = (n - 1).S²/σ²

Que tiene una distribución ji-cuadrado con n-1 grados de libertad y dos valores tales que delimiten el 100(1 - α)%

Pr {χ²(n - 1);α/2 ≤ χ²(n - 1) ≤ χ²(n - 1);α/2}

Reemplazando la variable χ² en el intervalo

Pr {χ²(n - 1);α/2Inferencia Estadística ≤ χ²(n - 1);α/2}

Despejando el intervalo de confianza queda,

Inferencia Estadística

Ejemplo,

Se sembró cierta variedad de trigo en parcela de cierta localidad, se extrajo una muestra al azar de 20 parcelas y se midió el rendimiento. Se obtuvo un rendimiento de 58 kilogramos por parcela y una desviación típica de 8 kg por parcela. Estimar la varianza poblacional con un nivel de confianza del 95%, sabiendo que el rendimiento se distribuye normalmente

{(19).64/32,9 ≤ σ² ≤ (19).64/8,91}

{32,66 ≤ σ² ≤ 37,34}

Si has utilizado el contenido de esta página, por favor, no olvides citar la fuente "Fisicanet ®".

Por favor, "copia y pega" el siguiente enlace completo:

https://www.fisicanet.com.ar/matematica/estadisticas/ap08_inferencia_estadistica.php

¡Gracias!

Copyright © 2000-2018 Fisicanet ® Todos los derechos reservados