miércoles, 11 de junio de 2014

Variables Aleatorias Continuas

Una variable aleatoria X es continua si su función de distribución es una función continua.
En la práctica, se corresponden con variables asociadas con experimentos en los cuales la variable medida puede tomar cualquier valor en un intervalo: mediciones biométricas, intervalos de tiempo, áreas, etc.
Ejemplos
  • Resultado de un generador de números aleatorios entre 0 y 1. Es el ejemplo más sencillo que podemos considerar, es un caso particular de una familia de variables aleatorias que tienen una distribución uniforme en un intervalo [ab]. Se corresponde con la elección al azar de cualquier valor entre a y b.
  • Estatura de una persona elegida al azar en una población. El valor que se obtenga será una medición en cualquier unidad de longitud (m, cm, etc.) dentro de unos límites condicionados por la naturaleza de la variable. El resultado es impredecible con antelación, pero existen intervalos de valores más probables que otros debido a la distribución de alturas en la población. Más adelante veremos que, generalmente, variables biométricas como la altura se adaptan un modelo de distribución denominado distribución Normal y representado por una campana de Gauss.
Dentro de las variables aleatorias continuas tenemos las variables aleatorias absolutamente continuas.
Diremos que una variable aleatoria X continua tiene una distribución absolutamente continua si existe una función real f, positiva e integrable en el conjunto de números reales, tal que la función de distribución F de X se puede expresar como

Distribución normal o de Gauss

             La distribución normal fue definida por De Moivre en 1733 y es la distribución de mayor importancia en el campo de la estadística.
Una variable es normal cuando se ajusta a la ley de los grandes números, es decir, cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que influyen infinitas causas de efecto infinitesimal.
Las variables normales tienen una función de densidad con forma de campana a la que se llama campana de Gauss.
Su función de densidad es la siguiente:

Los parámetros de la distribución son la media y la desviación típica, μ y σ, respectivamente. Como consecuencia, en una variable normal, media y desviación típica no deben estar correlacionadas en ningún caso (como desgraciadamente ocurre en la inmensa mayoría de las variables aleatorias reales que se asemejan a la normal.
La curva normal cumple las siguientes propiedades:
1)     El máximo de la curva coincide con la media.
2)     Es perfectamente simétrica respecto a la media (g1 = 0).
3)     La curva tiene dos puntos de inflexión situados a una desviación típica de la media. Es convexa entre ambos puntos de inflexión y cóncava en ambas colas.
4)     Sus colas son asintóticas al eje X.
             Para calcular probabilidades en intervalos de valores de la variable, habría que integrar la función de densidad entre los extremos del intervalo. por desgracia (o por suerte), la función de densidad normal no tiene primitiva, es decir, no se puede integrar. Por ello la única solución es referirse a tablas de la función de distribución de la variable (calculadas por integración numérica) Estas tablas tendrían que ser de triple entrada (μ, σ, valor) y el asunto tendría una complejidad enorme.
Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una correspondencia de sus valores con los de otra variable con distribución normal, media 0 y varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas variables se obtiene mediante la ecuación:
            

La función de distribución de la variable normal tipificada está tabulada y, simplemente, consultando en las tablas se pueden calcular probabilidades en cualquier intervalo que nos interese.
             De forma análoga a lo pasaba con las variables Poisson, la suma de variables normales independientes es otra normal.
Histograma de una normal idealizada
Histograma de una muestra de una variable normal

 

Distribución Gamma (Γ)

             La distribución gamma se define a partir de la función gamma, cuya ecuación es:

La función de densidad de la distribución gamma es:

α y β son los parámetros de la distribución.
La media y la varianza de la variable gamma son:



Distribución exponencial

             Es un caso particular de la distribución gamma cuando α = 1. Su función de densidad es:

Su parámetro es β.
La media y la varianza de la distribución exponencial son:
            




Distribución Chi-cuadrado (c2)

             Es otro caso particular de la distribución gamma para el caso β = 2 y α = n / 2, siendo n un número natural. 
Su función de densidad es:

El parámetro de la distribución c2 es n y su media y su varianza son, respectivamente:
            
Otra forma de definir la distribución c2 es la siguiente: Supongamos que tenemos n variables aleatorias normales independientes, X1,..., Xn, con media μi y varianza (i = 1 ... n), la variable definida como

tiene distribución c2 con n grados de libertad y se le denomina c2n.
Variables chi-cuadrado con valores de  progresivamente
mayores son cada vez menos asimétricas.




Distribución T de Student

             Supongamos dos variables aleatorias independientes, una normal tipificada, Z , y otra con distribución c2 con n grados de libertad, la variable definida según la ecuación:

tiene distribución t con n grados de libertad.
La función de densidad de la distribución t es:

El parámetro de la distribución t es n, su número de grados de libertad.
Esta distribución es simétrica respecto al eje Y y sus colas se aproximan asintóticamente al eje X. Es similar a la distribución Z salvo que es platicúrtica y, por tanto, más aplanada.
Cuando n tiende a infinito, t tiende asintóticamente a Z y se pueden considerar prácticamente iguales para valores de n mayores o iguales que 30..
Variables T con valores de n progresivamente mayores
son cada vez menos platicúrticas
Comparación entre la variable T y la normal tipificado.



Distribución F de Snedecor

             Sean U y V dos variables aleatorias independientes con distribución c2 con n1 y n2 grados de libertad, respectivamente. La variable definida según la ecuación:

tiene distribución F con n1, n2 grados de libertad.
La función de densidad de la distribución F es:

Los parámetros de la variable F son sus grados de libertad n1 y n2.
Las distribuciones F tienen una propiedad que se utiliza en la construcción de tablas que es la siguiente:
            Llamemos  fa,n1,n2 al valor de una distribución F con n1 y n2 grados de libertad que cumple la condición, P(F > fa,n1,n2) = α; llamemos f1-a,n1,n2 al valor de una distribución F con n1 yn2 grados de libertad que cumple la condición, P(F > f1-a,n1,n2) = 1- α. Ambos valores están relacionados de modo que uno es el inverso del otro.

Variables F con distintos valores de 1,2

sábado, 31 de mayo de 2014

Teorema de Bayes

La interpretación más aceptada del teorema de Bayes, es que su estructura permite el calculo de probabilidades después de haber sido realizado un experimento (probabilidades aposteriori), basándose en el conocimiento de la ocurrencia de ciertos eventos que dependan del evento estudiado, o sea, se parte de probabilidades conocidas antes de efectuar el experimento (probabilidades apriori), las cuales son afectadas por las probabilidades propias del experimento (las que aparecen durante la ocurrencia del evento).

Continuando nuestro análisis sobre el teorema de Bayes, la probabilidad condicional deAi dado B, para cualquier i, es:


Aplicando en el numerador la Regla de Multiplicación P(AiÇB) = P(Ai) P(B|Ai) y en el denominador el Teorema de Probabilidad Total  P(B) = P(A1) P(B | A1) + P(A2) P(B | A2) + . . . + P(An) P(B | An), obtenemos la ecuación que representa al:

Teorema de Bayes
 
Ejemplo 3. 11. Referente al problema de la fábrica que produce dos tipos de reguladores A y B visto anteriormente en la aparte corresponde al Teorema de Probabilidad Total, cabe hacer el siguiente análisis: si se selecciona un regulador al azar de la producción de la fábrica y se ve que funciona bien ¿Cuál es la probabilidad de que sea del tipo B?

Solución

En este caso el estudio se restringe a los reguladores que funcionan bien, por lo que ese evento actúa como espacio muestral reducido, o sea como evento condición. Por lo tanto, el planteamiento de la pregunta es P(B | F).
Los datos que se tienen son :

P(A) = 0.75     P(F | A) = 0.95
P(B) = 0.25     P(F | B) = 0.98

De acuerdo al Teorema de Bayes:
Podemos observar que el denominador corresponde al resultado obtenido al aplicar el Teorema de Probabilidad Total, lo cual debe ser así, ya que la probabilidad condicional establece que . 
De esta forma podemos ver que la Probabilidad

Total es el denominador de la fórmula del Teorema de Bayes. También podemos observar que aplicando los conceptos de la Regla de Multiplicación y del Teorema de Probabilidad Total llegamos al planteamiento del teorema de Bayes, Veamos:
 

Esperanza matemática

La esperanza matemática valor esperado de una variable aleatoria discreta es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso.

Los nombre de esperanza matemática y valor esperado tienen su origen en los juegos de azar y hacen referencia a la ganancia promedio esperada por un jugador cuando hace un gran número de apuestas.
Si la esperanza matemática es cero, E(x) = 0, el juego es equitativo, es decir, no existe ventaja ni para el jugador ni para la banca.


Ejemplos
Si una persona compra una papeleta en una rifa, en la que puede ganar de 5.000 € ó un segundo premio de 2000 € con probabilidades de: 0.001 y 0.003. ¿Cuál sería el precio justo a pagar por la papeleta?
E(x) = 5000 · 0.001 + 2000 · 0.003 = 11 €


Un jugador lanza dos monedas. Gana 1 ó 2 € si aparecen una o dos caras. Por otra parte pierde 5 € si no aparece cara. Determinar la esperanza matemática del juego y si éste es favorable.
E = {(c,c);(c,x);(x,c);(x,x)}
p(+1) = 2/4
p(+2) = 1/4
p(−5) = 1/4

E(x)= 1 · 2/4 + 2 · 1/4 - 5 · 1/4 = −1/4. Es desfavorable

martes, 29 de abril de 2014

Distribución Hipergeometrica

Los experimentos que tienen este tipo de distribución tienen las siguientes características:
a)Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.
b)Las probabilidades asociadas a cada uno de los resultados no son constantes.
c)Cada ensayo o repetición del experimento no es independiente de los demás.
d)El número de repeticiones del experimento (n) es constante.
Ejemplo:
En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos?
Solución:
                                
donde:
p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados

muestras de objetos en donde hay x que son defectuosos y n-x buenos

todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral


Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos?

Solución:

N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
       


                 


donde:

probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes

formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos
  
Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes.

Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería:


                                                            

lunes, 28 de abril de 2014

Distribución Binomial

Cuando se dispone de una expresión matemática, es factible calcular la probabilidad de ocurrencia exacta correspondiente a cualquier resultado específico para la variable aleatoria.
La distribución de probabilidad binomial es uno de los modelos matemáticos (expresión matemática para representar una variable) que se utiliza cuando la variable aleatoria discreta es el número de éxitos en una muestra compuesta por n observaciones.

- La muestra se compone de un número fijo de observaciones n
- Cada observación se clasifica en una de dos categorías, mutuamente excluyentes (los eventos no pueden ocurrir de manera simultánea. Ejemplo: Una persona no puede ser de ambos sexos) y colectivamente exhaustivos (uno de los eventos debe ocurrir. Ejemplo: Al lanzar una moneda, si no ocurre cruz, entonces ocurre cara). A estas categorías se las denomina éxito y fracaso.
- La probabilidad de que una observación se clasifique como éxito, p, es constante de una observación o otra. De la misma forma, la probabilidad de que una observación se clasifique como fracaso, 1-p, es constante en todas las observaciones.
- La variable aleatoria binomial tiene un rango de 0 a n
Ecuación:
PX=n!X!n-X!·pX·1-pn-X
Donde
PX=Probabilidad de X éxitos, dadas y
n = Número de observaciones
p = Probabilidad de éxitos
1-p = Probabilidad de fracasos
X = Número de éxitos en la muestra (= 0, 1, 2, 3, 4,………)
Ejemplo ilustrativo N° 1
Determine P(X=5) para n = 6 y p = 0,83
Solución:
Aplicando la ecuación se obtiene:
PX=n!X!n-X!·pX·1-pn-X
PX=5=6!5!6-5!·0,835·1-0,836-5=0,4018

Variable Aleatoria Discreta


Las variables aleatorias pueden ser discretas y continuas. En el capítulo siguiente trataremos extensamente las variables aleatorias continuas (v. a. c.), pero de momento, con el objeto de visualizar la diferencia entre ellas, podemos decir que las discretas surgen generalmente al contar, mientras que las continuas aparecen cuando se mide.
na variable aleatoria continua teóricamente puede asumir cualquier valor entre dos límites dados, o sea que sus variaciones son infinitesimales, mientras que en las variables aleatorias discretas existen “saltos” o “interrupciones” entre los valores que puede tomar.
De acuerdo a lo anterior podemos decir que:

Una variable aleatoria X es discreta, si solamente puede tomar un conjunto numerable de valores.

Como ejemplos de variables aleatorias discretas podemos mencionar: el número de libros en una biblioteca, el número de habitantes en una población, la cantidad de dinero que una persona trae en su bolsillo, el número de aves en un gallinero, el número de admisiones diarias a un hospital, el número de accidentes automovilísticos en una carretera durante un año, etc.

Sea X una variable aleatoria asociada con un experimento aleatorio. Si el resultado de un experimento es a, entonces decimos que en esta prueba la variable aleatoria X ha tomado el valor a, o que hemos observado el valor X = a.

Una variable aleatoria tiene las siguientes propiedades:

1.La variable aleatoria X es un evento que se define en el espacio muestral S del experimento y sus valores son números reales.

2.Sea a cualquier número real y sea I cualquier intervalo de S. Entonces el
conjunto de todos los valores para los que X = atiene una probabilidad bien
definida y lo mismo se cumple para todos los valores de X que están en I.

Ejemplo. Sea el experimento de lanzar 3 veces una moneda y representemos por X el evento del número de caras que aparecen. Encontrar los valores que puede tomar la variable aleatoria.

Solución.

El espacio muestral de lanzar 3 veces una moneda es:
S = { ccc, cc+, c+c, +cc, c++, +c+, ++c, +++}

Si solamente nos interesa el número de caras que aparecen, entonces al punto muestral (+++) le corresponde el valor cero porque no hay ninguna cara, a cada punto muestral donde hay una cara (c++, +c+, ++c) le corresponde el valor 1 y así los demás puntos muestrales. Por lo tanto:
X(+++) = 0
(c++) = X(+x+) = X(++c) = 1
X(cc+) =  X(c+c) = X(+cc) = 2
X(ccc) = 3

sábado, 22 de marzo de 2014

Teorema de Bayes


El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto en el Teorema de la probabilidad total:
Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (¿estaba lloviendo o hacía buen tiempo?).
La fórmula del Teorema de Bayes es:
Tratar de explicar estar fórmula con palabras es un galimatías, así que vamos a intentar explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema también exige que el suceso A forme un sistema completo.

Ejercicio 1º: El parte meteorológico ha anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Según estos posibles estados meteorológicos, la posibilidad de que ocurra un accidente es la siguiente:
a) Si llueve: probabilidad de accidente del 10%.
b) Si nieva: probabilidad de accidente del 20%
c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estabamos en la ciudad no sabemos que tiempo hizo (nevó, llovío o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades:
Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 60%, nieve con el 30% y niebla con el 10%).
Una vez que incorporamos la información de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori".
Vamos a aplicar la fórmula:
a) Probabilidad de que estuviera lloviendo:
La probabilidad de que efectivamente estuviera lloviendo el día del accidente (probabilidad a posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:
La probabilidad de que estuviera nevando es del 21,4%.
c) Probabilidad de que hubiera niebla:
La probabilidad de que hubiera niebla es del 7,1%.