viernes, 3 de octubre de 2008
Comentario acerca de la elaboracion del Blog
Comentario
jueves, 25 de septiembre de 2008
PROBABILIDAD
INTRODUCCION A LA TEORIA DE PROBABILIDADES
El concepto de probabilidad nace con el deseo del hombre de conocer con certeza los eventos futuros. Es por ello que el estudio de probabilidades surge como una herramienta utilizada por los nobles para ganar en los juegos y pasatiempos de la época. El desarrollo de estas herramientas fue asignado a los matemáticos de la corte.
Con el tiempo estas técnicas matemáticas se perfeccionaron y encontraron otros usos muy diferentes para la que fueron creadas. Actualmente se continúo con el estudio de nuevas metodologías que permitan maximizar el uso de la computación en el estudio de las probabilidades disminuyendo, de este modo, los márgenes de error en los cálculos.
Se define como cálculo de probabilidad al conjunto de reglas que permiten determinar si un fenómeno ha de producirse, fundando la suposición en el cálculo, las estadísticas o la teoría.
El objetivo de esta práctica es realizar varios experimentos de probabilidad, anotar los resultados y posteriormente compararlos con los resultados teóricos.
Objetivos de las Probabilidades
El objetivo fundamental de la probabilidad, es la de mostrar al alumno la importancia y utilidad del Método Estadístico en el ámbito económico-empresarial. Con tal fin, el alumno deberá aprender a manejar los métodos y técnicas más adecuadas para el correcto tratamiento y análisis de la información proporcionada por los datos que genera la actividad económica.
Para ello se comienza afianzando los conocimientos que el alumno ya posee de Estadística Descriptiva, además de algunos conceptos nuevos relacionados con este tema.
Eventos mutuamente excluyentes y eventos no excluyentes
Dos o más eventos son mutuamente excluyentes o disjuntos, si no pueden ocurrir simultáneamente. Es decir, la ocurrencia de un evento impide automáticamente la ocurrencia del otro evento (o eventos).
Eventos Independientes
Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso típico de eventos independiente es el muestreo con reposición, es decir, una vez tomada la muestra se regresa de nuevo a la población donde se obtuvo.
Eventos dependientes
Dos o más eventos serán dependientes cuando la ocurrencia o no-ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso, empleamos entonces, el concepto de probabilidad condicional para denominar la probabilidad del evento relacionado.
Distribución de probabilidad normal
Es una distribución de probabilidad continua que es tanto simétrica como mesocurtica. La curva que representa la distribución de probabilidad normal se describe generalmente como en forma de campana. Esta distribución es importante en inferencia estadística por tres razones diferentes:
Se sabe que las medidas producidas en muchos procesos aleatorios siguen esta distribución.
Las probabilidades normales pueden utilizarse generalmente para aproximar otras distribuciones de probabilidad, tales como las distribuciones binomial y de Poisson.
Las distribuciones estadísticas tales como la media de la muestra y la proporción de la muestra, siguen a menudo la distribución normal, sin tener en cuenta la distribucion.
Comentario General: La probabilidad se encarga de evaluar todas aquellas actividades en donde se tiene incertidumbre acerca de los resultados que se pueden esperar, esto quiere decir que la probabilidad está presente en casi en todas las actividades que se pretenda realizar, ejemplos:
-Cualquier proyecto de Ingeniería o de otras áreas
-Competencias deportivas
-Juegos de azar, etc., etc.
Tambien existen diferentes eventos en los cuales estos se pueden clasificar al momento de determinar una probabilidad, como lo son los eventos independientes, los dependientes, mutuamente excluyentes y no excluyentes.
miércoles, 18 de junio de 2008
Correlacion
Cuando dos fenómenos sociales, físicos o biológicos crecen o decrecen de forma simultánea y proporcional debido a factores externos, se dice que los fenómenos están positivamente correlacionados. Si uno crece en la misma proporción que el otro decrece, los dos fenómenos están negativamente correlacionados. El grado de correlación se calcula aplicando un coeficiente de correlación a los datos de ambos fenómenos. Una correlación positiva perfecta tiene un coeficiente + 1, y para una correlación negativa perfecta es -1. La ausencia de correlación da como coeficiente 0.
Regresion
Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.
Regresion Lineal
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε.
La regresión es un método de análisis de los datos de la realidad económica que sirve para poner en evidencia las relaciones que existen entre diversas variables.
miércoles, 14 de mayo de 2008
Diagrama de Cajas
Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.
Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.
Procedimiento
Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:CIi = Q1 - PasoCIs = Q3 + PasoSi la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:CEi = CIi - PasoCEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.
"Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.
Considere los siguientes datos, correspondientes a
De este conjunto de datos tenemos que:
Me = 90.45Q1 = 88.25Q3 = 92.2
Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925Cercas interna inferior = 88.25 - 5.925 = 82.325Cerca interna superior = 92.20 + 5.925 = 98.125Cerca externa inferior = 82.325 - 5.925 = 76.40Cerca externa superior = 98.125 + 5.925 = 104.05
Como se observa hay dos valores que merecen especial atención: 98.8 y 100.3 que están entre las cercas interna y externa superior.
sábado, 19 de abril de 2008
PORTAFOLIO
Un portafolio es una selección deliberada de los trabajos de un alumno que en cierta forma nos cuenta la historia de sus esfuerzos, su progreso y sus logros. El concepto de Portafolio existe desde hace mucho tiempo en numeroso ámbitos fuera de la educación. Artistas, y Fotógrafos los usan para presentar sus trabajos a clientes potenciales. En educación, sin embargo, los portafolios son un fenómeno reciente y solo ahora empieza a utilizarse en todo su potencial. De acuerdo a Linda Polin (1991) a principio de los años noventa se hablaba de su uso principalmente en referencia a la evaluación; desde entonces irrumpieron en escena una amplia variedad de aplicaciones.
¿Qué son los portafolios de aula?
Un portafolio es un registro del aprendizaje que se concentra en el trabajo del alumno y su reflexión sobre esa tarea. Mediante un esfuerzo cooperativo entre el alumno y el personal docente se reúne un material que es indicativo del progreso hacia los resultados esenciales.
Un portafolio es algo más de una mera “caja llena de cosas”. Se trata de una colección sistemática y organizada de evidencias utilizadas por los maestros y alumnos para supervisar la evolución del conocimiento, las habilidades y las actitudes de estos últimos en una materia determinada.
Un portafolio desde la perspectiva educativa es un procedimiento de producción,que permiten recopilar productos de proyectos de curso, variados escritos, grabaciones y otras muestras de acciones y creaciones de los alumnos.
miércoles, 16 de abril de 2008
AREA BAJO LA CURVA
En todas las situaciones anteriores el proceso para el cálculo del área es relativamente simple, sin embargo cuando tenemos una figura como la siguiente en la cual uno o varios de sus lados que limitan la región en la cual queremos calcular el área son curvas, no tenemos un proceso claro.
La distribución continua de probabilidad más importante de toda la estadística es la distribución de probabilidad normal. Como vimos anteriormente, una variable aleatoria continua es la que puede asumir un número infinito de posibles valores dentro de un rango específico. Estos valores usualmente resultan de medir algo ( medidas de longitud, de peso, de tiempo, de temperatura etc.)
Características de la distribución de probabilidad normal
La distribución de probabilidad normal y su curva tiene las siguientes características:
1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribución son iguales y se localizan en el centro de la distribución.
2. La distribución de probabilidad normal es simétrica alrededor de su media. Por o tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.
4. La función de la curva normal es la siguiente:
F(x) =
1
e
(- ½)[(x-µ)/σ]²
√
2πσ
Donde π = 3.14159 y e = 2.71828
La familia de la distribución de probabilidad normal
Cuando se habla de la distribución normal, realmente se está hablando de una familia de curvas. Como se puede apreciar en la función de la curva normal, la curva depende de dos variables además de la variable independiente x, tales como la media (), y la desviación estándar (). Por lo tanto se tendrán curvas diferentes para funciones con desviación estándar diferente aún cuando sus medias fuesen iguales, como se muestra enseguida.
domingo, 23 de marzo de 2008
Estadigrafo
Teoria de Chebychev
En 1841 la situación económica de Chebyshev cambió drásticamente. Se declaró una hambruna en Rusia, sus padres se vieron forzados a dejar la ciudad e incapaces de seguir manteniendo a sus hijos. De todas maneras, decidió continuar sus estudios matemáticos y se preparó para los exámenes de maestría que se distribuían durante medio año. Aprobó el examen final en octubre de 1843. En 1846 defendió su tesis "Un intento de análisis elemental de la teoría probabilística". El biógrafo Prudnikov asume que Chebyshev fue dirigido a esta rama de la matemática tras conocer la publicación reciente de libros de teoría probabilística o por el crecimiento de la industria aseguradora en Rusia.
Diagrama de Puntos
Se construye marcando los diferentes valores de los datos en el eje horizontal y colocando puntos encima de éstos de acuerdo a la frecuencia del dato.
COMENTARIO: el diagrama de puntos nos sirve solamente para identificar datos por medio de puntos y de acuerdo a la frecuencia que tenga cada dato que se nos sea asignado.
Escala de Likert
Definimos una escala como una serie de ítems o frases que han sido cuidadosamente seleccionados, de forma que constituyan un criterio válido, fiable y preciso para medir de alguna forma los fenómenos sociales. En nuestro caso, este fenómeno será una actitud cuya intensidad queremos medir.
¿Qué es una actitud?
Actitud es un estado de disposición psicológica, adquirida y organizada a través de la propia experiencia que incita al individuo a reaccionar de una manera característica frente a determinadas personas, objetos o situaciones.
Las actitudes no son susceptibles de observación directa sino que han de ser inferidas de las expresiones verbales; o de la conducta observada. Esta medición indirecta se realiza por medio de unas escalas en las que partiendo de una serie de afirmaciones, proposiciones o juicios, sobre los que los individuos manifiestan su opinión, se deducen o infieren las actitudes.
¿Qué es un item?
Un ítem es una frase o proposición que expresa una idea positiva o negativa respecto a un fenómeno que nos interesa conocer. Por ejemplo, el ítem:
"Las normas sobre utilización de carretillas elevadoras dictadas por la empresa, en la práctica cotidiana, son de difícil cumplimiento."
Expresa una opinión sobre un tema: la política normativa de la empresa, y se refiere concretamente al manejo de carretillas. La posición valorativa de tal afirmación hecha por un individuo se puede considerar como un indicador de su opinión sobre dicha política normativa, sobre el uso de carretillas elevadoras, sobre la seguridad en la empresa, etc.
Tres criterios para la confección de los items de una escala
Los ítems deben facilitar respuestas relacionadas con el fenómeno medido, aunque dicha relación no tiene porqué ser necesariamente manifiesta.
Cada ítem debe declarar no sólo las dos posturas extremas, sino también graduar las intermedias. A medida que la escala gane en sensibilidad, ganará también en precisión.
Los ítems deben ser fiables y seguros. La fiabilidad con frecuencia se logra a costa de la precisión. Cuanto más refinada es una medición, más probable es que en dos medidas repetidas obtengamos puntuaciones distintas.
Area bajo la Curva
Para dar una mejor aproximación dividimos la región en 4 franjas de igual longitud.
Podemos obtener una aproximación de cada franja por medio de rectángulos cuya base sea la misma que la de la franja y cuya altura sea la misma que la del lado derecho de la propia franja (rectángulos circunscritos).
Calcular el área del k-ésimo rectángulo
Rectángulos inscritos . Como f es continua en cada subintervalo f alcanza un mínimo en algún número Uk de .En cada k se construye un rectángulo de anchura y altura igual a la distancia mínima del eje x a la gráfica de f . El área del k-ésimo rectángulo es . La frontera de la región formada por estos rectángulos es un polígono inscrito correspondiente a la subdivisión de en n subintervalos iguales.
Rectángulos circunscritos . Como f es continua en cada subintervalo f alcanza un máximo en algún número V k de .En cada k se construye un rectángulo de anchura y altura igual a la distancia máxima del eje x a la gráfica de f . El área del k-ésimo rectángulo es . La frontera de la región formada por estos rectángulos es un polígono circunscritos correspondiente a la subdivisión de en n subintervalos iguales.
Propiedades de la Notacion Sumatoria
Por lo general después de una sumatoria aparece una variable con un suscrito representado por la letra i (ΣXi). Este suscrito indica qué valores de la variable se deben sumar, Para determinar cuáles valores es necesario sustituir la i por los valores que se indican arriba y debajo de la sumatoria
Una sumatoria se define como:
La variable i es el índice de suma al que se le asigna un valor inicial llamado límite inferior, m. La variable i recorrerá los valores enteros hasta alcanzar el límite superior, n. Necesariamente ha de cumplirse.
COMENTARIO: la sumatoria expresa difrentes valores los cuales son relacionados para buscar el valor de una variable.
mod media y mediana
Es un caso especial de la media aritmética. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribución de frecuencias.
Para determinar la media ponderada multiplicamos cada observación por el número de veces que aparece.
w1X1 + w2X2 + w3X3 +...+ wnXn (wX)
Media ponderada = Xw =
w1 + w2 + w3 +...+ wn w
Mediana:
Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeños, la media aritmética puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana.
Mediana: Punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de la mediana y 50% por debajo de ella.
Las propiedades de la mediana son:
Es única, sólo existe una mediana para un conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeños.
Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo.
Puede obtenerse para datos de nivel de razón, de intervalo y ordinal(excepto para el nominal).
5. Moda:
El valor de la observación que aparece con más frecuencia.
COMENTARIO: la media moda y mediana nos ayudan a calcular datos mas claros, exactos y concisos.
martes, 18 de marzo de 2008
Distribucion de Frecuencias
No hay una sola medida de tendencia central, se consideran 5: la media aritmética, media ponderada, la mediana, la moda y la media geométrica.
Media de la población:
A partir de datos en vivo, los que no han sido agrupados en una distribución de frecuencias o en una representación de tallo y hoja, la media de una población es:
Suma de todos los valores de la población X
Media de una población = =
Número de valores en la población N
Donde:
representa la media de población
N nº total de elementos en la población
X cualquier valor en particular
sumatoria
La media de una población es un parámetro (una característica medible de una población) , así como la amplitud de variación (la diferencia entre el valor más grande y el más pequeño en un conjunto de datos).
Media de una muestra:
Para datos en vivo, no agrupados la media es:
Suma de todos los valores de una muestra X
Media de una muestra = X =
Número de valores en la muestra n
Donde:
n número total de valores de la muestra
La media de una muestra, o cualquier otra medida basada en datos muestrales, se denomina dato estadístico (una característica de una muestra).
Propiedades de media aritmética:
La tasa de interés de la media aritmética es una medida de tendencia central ampliamente utilizada. Propiedades:
Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de datos sólo tiene una media. Esta es un valor único.
La media es una medida muy útil para comparar dos o más poblaciones.
La media es la única medida de ubicación donde la suma de las desviaciones de cada valor es con respecto a la media, siempre será cero.
LAS DESVIACIONES RESPECTO DE LA MEDIA SUMAN CERO ( X - X ) = 0
La media podría no ser un promedio adecuado para representar datos. La media se ve afectada de modo notable por valores extraordinariamente grandes o pequeños.
No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor).
Media ponderada:
Es un caso especial de la media aritmética. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribución de frecuencias.
Para determinar la media ponderada multiplicamos cada observación por el número de veces que aparece.
w1X1 + w2X2 + w3X3 +...+ wnXn (wX)
Media ponderada = Xw =
w1 + w2 + w3 +...+ wn w
Mediana:
Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeños, la media aritmética puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana.
Mediana: Punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de la mediana y 50% por debajo de ella.
Las propiedades de la mediana son:
Es única, sólo existe una mediana para un conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeños.
Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo.
Puede obtenerse para datos de nivel de razón, de intervalo y ordinal(excepto para el nominal).
El valor de la observación que aparece con más frecuencia.
Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de razón. No se ve afectada por valores muy altos o muy bajos. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.
Desventajas de la moda:
Para muchos conjuntos de datos no hay valor modal porque ningún valor aparece más de una vez.
Para algunos conjuntos de datos hay más de una moda (bimodal = que tiene dos modas).
Media geométrica:
Útil para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento. Se utiliza ampliamente en los negocios y la economía porque frecuentemente interesa encontrar el cambio porcentual en ventas, sueldos o cifras económicas, como el Producto Nacional Bruto.
MEDIDA GEOMÉTRICA MG = n (x1) (x2)...(xn)
Siempre será menor o igual a (nunca mayor que) la media aritmética. Todos los valores de datos deben ser positivos.
Una segunda aplicación de la media geométrica es encontrar un aumento porcentual promedio en un intervalo de tiempo:
AUMENTO PORCENTUAL valor al final del periodo
PROMEDIO EN UN MG = n - 1
PERIODO DADO valor al principio del periodo
7. Media, mediana y moda de datos agrupados:
Con frecuencia los datos sobre ingresos, edades; etc, se agrupan y presentan en forma de una distribución de frecuencias. Resulta imposible obtener los datos originales. Para obtener un valor representativo para los datos, es necesario estimarlo con base en una distribución de frecuencias.
Media: las observaciones en cada clase son representadas por el punto medio de ésta. Se calcula con:
MEDIA ARITMÉTICA DE DATOS AGRUPADOS X =
n
Donde:
X designa la media aritmética.
X es el valor central, o punto medio, de cada clase.
f frecuencia de cada clase.
fX frecuencia en cada clase multiplicada por el punto medio de ésta.
n número total de frecuencias.
Para encontrar el punto medio de una clase específica, se suman los límites superior e inferior de la clase y el resultado lo dividimos entre dos.
Continuamos con el proceso de multiplicar el punto medio de la clase por la frecuencia para cada clase y después se suman estos productos.
La media de datos agrupados en una distribución de frecuencias puede ser diferente de la de datos reales. La agrupación resulta en alguna pérdida de información.
Mediana: una vez que los datos originales se han organizado en una distribución de frecuencias, parte de la información nos es identificable. No es posible determinar la mediana exacta, puede estimarse:
Localizando la clase en la que se encuentra la mediana, y después,
interpolando dentro de esa clase para obtener tal valor.
Los elementos de la clase en que se encuentra la mediana están espaciados de manera uniforme por toda la clase. Su fórmula es:
n _ FA
2
Mediana = L + (i)
f
Donde:
L límite inferior de la clase que contiene a la mediana
n nº total de frecuencias
f frecuencia de la clase antes mencionada
FA nº acumulativo de frecuencias en todas las clases que preceden inmediatamente a la clase en cuestión (con la mediana)
i es el ancho de la clase en que se encuentra la mediana
La mediana se basa sólo en las frecuencias y los límites de la clase que contiene la mediana, es posible determinarla si se dan frecuencias porcentuales en vez de las frecuencias absolutas. Puede determinarse para distribuciones con extremos abiertos.
Moda: el punto promedio de la clase modal es la moda estimada. Es el valor que ocurre con más frecuencia. Si el conjunto de datos tiene mas de dos modas, se llama distribución multimodal.
¿Que es Estadistica?
Comentario: la estadistica en mi opinion personal es una recoleccion de datos donde se toma de muestra a alguna poblacionm asi tambien esta ciencia nos ayuda a conocer diversos promedios, areas, etc.
Diagrama de Hojas
Comentario: el diagrama de hojas es practicamente obtener datos de una manera rapida, exclusiva y grafica.