domingo, 23 de marzo de 2008

Estadigrafo

Estadígrafo es el término utilizado para designar a la persona dedicada a las tareas propias de la estadística, aunque en ocasiones también es frecuente que se utilice para designar a la variable que define una distribución estadística, de esta forma es común escuchar el término estadígrafo de prueba.

Teoria de Chebychev

Chebyshev pasó los exámenes de admisión el verano de 1837 y en septiembre comenzó los estudios de matemática en el segundo departamento filosófico de la universidad de Moscú. Entre sus profesores se contaron N.D. Brashman, N.E. Zernov y D.M. Perevoshchikov. No hay duda que, de entre ellos, Brashman tuvo la mayor influencia sobre Chebyshev. Le instruyó en mecánica práctica y probablemente le mostró el trabajo del ingeniero francés Jean-Victor Poncelet. En 1841 se le concedió la medalla de plata por su trabajo "cálculo de las raíces de ecuaciones" que había terminado en 1838. En esta contribución Chebyshev derivó una aproximación algorítmica para la solución de ecuaciones algebraicas de n-ésimo grado basándose en el algoritmo de Newton. En ese mismo año terminó sus estudios como el "candidato más sobresaliente".
En 1841 la situación económica de Chebyshev cambió drásticamente. Se declaró una hambruna en Rusia, sus padres se vieron forzados
a dejar la ciudad e incapaces de seguir manteniendo a sus hijos. De todas maneras, decidió continuar sus estudios matemáticos y se preparó para los exámenes de maestría que se distribuían durante medio año. Aprobó el examen final en octubre de 1843. En 1846 defendió su tesis "Un intento de análisis elemental de la teoría probabilística". El biógrafo Prudnikov asume que Chebyshev fue dirigido a esta rama de la matemática tras conocer la publicación reciente de libros de teoría probabilística o por el crecimiento de la industria aseguradora en Rusia.

Diagrama de Puntos

Diagrama de puntos
Se construye marcando los diferentes valores de los datos en el eje horizontal y colocando puntos encima de éstos de acuerdo a la frecuencia del dato.
COMENTARIO: el diagrama de puntos nos sirve solamente para identificar datos por medio de puntos y de acuerdo a la frecuencia que tenga cada dato que se nos sea asignado.

Escala de Likert

¿Qué es una escala?
Definimos una escala como una serie de ítems o frases que han sido cuidadosamente seleccionados, de forma que constituyan un criterio válido, fiable y preciso para medir de alguna forma los fenómenos sociales. En nuestro caso, este fenómeno será una actitud cuya intensidad queremos medir.
¿Qué es una actitud?
Actitud es un estado de disposición psicológica, adquirida y organizada a través de la propia experiencia que incita al individuo a reaccionar de una manera característica frente a determinadas personas, objetos o situaciones.
Las actitudes no son susceptibles de observación directa sino que han de ser inferidas de las expresiones verbales; o de la conducta observada. Esta medición indirecta se realiza por medio de unas escalas en las que partiendo de una serie de afirmaciones, proposiciones o juicios, sobre los que los individuos manifiestan su opinión, se deducen o infieren las actitudes.
¿Qué es un item?
Un ítem es una frase o proposición que expresa una idea positiva o negativa respecto a un fenómeno que nos interesa conocer. Por ejemplo, el ítem:
"Las normas sobre utilización de carretillas elevadoras dictadas por la empresa, en la práctica cotidiana, son de difícil cumplimiento."
Expresa una opinión sobre un tema: la política normativa de la empresa, y se refiere concretamente al manejo de carretillas. La posición valorativa de tal afirmación hecha por un individuo se puede considerar como un indicador de su opinión sobre dicha política normativa, sobre el uso de carretillas elevadoras, sobre la seguridad en la empresa, etc.
Tres criterios para la confección de los items de una escala
Los ítems deben facilitar respuestas relacionadas con el fenómeno medido, aunque dicha relación no tiene porqué ser necesariamente manifiesta.
Cada ítem debe declarar no sólo las dos posturas extremas, sino también graduar las intermedias. A medida que la escala gane en sensibilidad, ganará también en precisión.
Los ítems deben ser fiables y seguros. La fiabilidad con frecuencia se logra a costa de la precisión. Cuanto más refinada es una medición, más probable es que en dos medidas repetidas obtengamos puntuaciones distintas.

Area bajo la Curva

El área es un valor entre 0 y 1 por que R está contenida en un cuadrado de longitud 1.
Para dar una mejor aproximación dividimos la región en 4 franjas de igual longitud.
Podemos obtener una aproximación de cada franja por medio de rectángulos cuya base sea la misma que la de la franja y cuya altura sea la misma que la del lado derecho de la propia franja (rectángulos circunscritos).
Calcular el área del k-ésimo rectángulo
Rectángulos inscritos . Como f es continua en cada subintervalo f alcanza un mínimo en algún número Uk de .En cada k se construye un rectángulo de anchura y altura igual a la distancia mínima del eje x a la gráfica de f . El área del k-ésimo rectángulo es . La frontera de la región formada por estos rectángulos es un polígono inscrito correspondiente a la subdivisión de en n subintervalos iguales.
Rectángulos circunscritos . Como f es continua en cada subintervalo f alcanza un máximo en algún número V k de .En cada k se construye un rectángulo de anchura y altura igual a la distancia máxima del eje x a la gráfica de f . El área del k-ésimo rectángulo es . La frontera de la región formada por estos rectángulos es un polígono circunscritos correspondiente a la subdivisión de en n subintervalos iguales.

Propiedades de la Notacion Sumatoria

La sumatoria es un símbolo muy utilizado en matemáticas que sirve para simplificar formulas estadísticas.Una sumatoria nos permite representar sumas muy grandes, de n sumandos o incluso sumas infinitas y se expresa con la letra griega sigma ( Σ ).
Por lo general después de una sumatoria aparece una variable con un suscrito representado por la letra i (ΣXi). Este suscrito indica qué valores de la variable se deben sumar, Para determinar cuáles valores es necesario sustituir la i por
los valores que se indican arriba y debajo de la sumatoria
Una sumatoria se define como:
La variable i es el índice de suma al que se le asigna un
valor inicial llamado límite inferior, m. La variable i recorrerá los valores enteros hasta alcanzar el límite superior, n. Necesariamente ha de cumplirse.
COMENTARIO: la sumatoria expresa difrentes valores los cuales son relacionados para buscar el valor de una variable.

mod media y mediana

Media:
Es un caso especial de la media aritmética. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribución de frecuencias.
Para determinar la media ponderada multiplicamos cada observación por el número de veces que aparece.
w1X1 + w2X2 + w3X3 +...+ wnXn  (wX)
Media ponderada = Xw =
w1 + w2 + w3 +...+ wn w
Mediana:
Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeños, la media aritmética puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana.
Mediana: Punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de la mediana y 50% por debajo de ella.
Las propiedades de la mediana son:
Es única, sólo existe una mediana para un conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeños.
Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo.
Puede obtenerse para datos de nivel de razón, de intervalo y ordinal(excepto para el nominal).
5. Moda:
El valor de la observación que aparece con más frecuencia.
COMENTARIO: la media moda y mediana nos ayudan a calcular datos mas claros, exactos y concisos.

martes, 18 de marzo de 2008

Distribucion de Frecuencias

Medidas de Tendencia Central: Un único valor que resume un conjunto de datos. Señala el centro de valores.
No hay una sola medida de tendencia central, se consideran 5: la media aritmética, media ponderada, la mediana, la moda y la media geométrica.
Media de la población:
A partir de datos en vivo, los que no han sido agrupados en una distribución de frecuencias o en una representación de tallo y hoja, la media de una población es:
Suma de todos los valores de la población  X
Media de una población =  =
Número de valores en la población N
Donde:
representa la media de población
N nº total de elementos en la población
X cualquier valor en particular
sumatoria
La media de una población es un parámetro (una característica medible de una población) , así como la amplitud de variación (la diferencia entre el valor más grande y el más pequeño en un conjunto de datos).
Media de una muestra:
Para datos en vivo, no agrupados la media es:
Suma de todos los valores de una muestra  X
Media de una muestra = X =
Número de valores en la muestra n
Donde:
n número total de valores de la muestra
La media de una muestra, o cualquier otra medida basada en datos muestrales, se denomina dato estadístico (una característica de una muestra).
Propiedades de media aritmética:
La tasa de interés de la media aritmética es una medida de tendencia central ampliamente utilizada. Propiedades:
Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de datos sólo tiene una media. Esta es un valor único.
La media es una medida muy útil para comparar dos o más poblaciones.
La media es la única medida de ubicación donde la suma de las desviaciones de cada valor es con respecto a la media, siempre será cero.
LAS DESVIACIONES RESPECTO DE LA MEDIA SUMAN CERO  ( X - X ) = 0
La media podría no ser un promedio adecuado para representar datos. La media se ve afectada de modo notable por valores extraordinariamente grandes o pequeños.
No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor).
Media ponderada:
Es un caso especial de la media aritmética. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribución de frecuencias.
Para determinar la media ponderada multiplicamos cada observación por el número de veces que aparece.
w1X1 + w2X2 + w3X3 +...+ wnXn  (wX)
Media ponderada = Xw =
w1 + w2 + w3 +...+ wn w
Mediana:
Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeños, la media aritmética puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana.
Mediana: Punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de la mediana y 50% por debajo de ella.
Las propiedades de la mediana son:
Es única, sólo existe una mediana para un conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeños.
Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo.
Puede obtenerse para datos de nivel de razón, de intervalo y ordinal(excepto para el nominal).
Moda:
El valor de la observación que aparece con más frecuencia.
Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de razón. No se ve afectada por valores muy altos o muy bajos. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.
Desventajas de la moda:
Para muchos conjuntos de datos no hay valor modal porque ningún valor aparece más de una vez.
Para algunos conjuntos de datos hay más de una moda (bimodal = que tiene dos modas).
Media geométrica:
Útil para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento. Se utiliza ampliamente en los negocios y la economía porque frecuentemente interesa encontrar el cambio porcentual en ventas, sueldos o cifras económicas, como el Producto Nacional Bruto.
MEDIDA GEOMÉTRICA MG = n (x1) (x2)...(xn)
Siempre será menor o igual a (nunca mayor que) la media aritmética. Todos los valores de datos deben ser positivos.
Una segunda aplicación de la media geométrica es encontrar un aumento porcentual promedio en un intervalo de tiempo:
AUMENTO PORCENTUAL valor al final del periodo
PROMEDIO EN UN MG = n - 1
PERIODO DADO valor al principio del periodo
7. Media, mediana y moda de datos agrupados:
Con frecuencia los datos sobre ingresos, edades; etc, se agrupan y presentan en forma de una distribución de frecuencias. Resulta imposible obtener los datos originales. Para obtener un valor representativo para los datos, es necesario estimarlo con base en una distribución de frecuencias.
Media: las observaciones en cada clase son representadas por el punto medio de ésta. Se calcula con:
MEDIA ARITMÉTICA DE DATOS AGRUPADOS X =
n
Donde:
X designa la media aritmética.
X es el valor central, o punto medio, de cada clase.
f frecuencia de cada clase.
fX frecuencia en cada clase multiplicada por el punto medio de ésta.
n número total de frecuencias.
Para encontrar el punto medio de una clase específica, se suman los límites superior e inferior de la clase y el resultado lo dividimos entre dos.
Continuamos con el proceso de multiplicar el punto medio de la clase por la frecuencia para cada clase y después se suman estos productos.
La media de datos agrupados en una distribución de frecuencias puede ser diferente de la de datos reales. La agrupación resulta en alguna pérdida de información.
Mediana: una vez que los datos originales se han organizado en una distribución de frecuencias, parte de la información nos es identificable. No es posible determinar la mediana exacta, puede estimarse:
Localizando la clase en la que se encuentra la mediana, y después,
interpolando dentro de esa clase para obtener tal valor.
Los elementos de la clase en que se encuentra la mediana están espaciados de manera uniforme por toda la clase. Su fórmula es:
n _ FA
2
Mediana = L + (i)
f
Donde:
L límite inferior de la clase que contiene a la mediana
n nº total de frecuencias
f frecuencia de la clase antes mencionada
FA nº acumulativo de frecuencias en todas las clases que preceden inmediatamente a la clase en cuestión (con la mediana)
i es el ancho de la clase en que se encuentra la mediana
La mediana se basa sólo en las frecuencias y los límites de la clase que contiene la mediana, es posible determinarla si se dan frecuencias porcentuales en vez de las frecuencias absolutas. Puede determinarse para distribuciones con extremos abiertos.
Moda: el punto promedio de la clase modal es la moda estimada. Es el valor que ocurre con más frecuencia. Si el conjunto de datos tiene mas de dos modas, se llama distribución multimodal.
Comentario: estas medidas de tendencia central son muy acertadas al momento en que una persona busca datos varios y que nos ayudan a tener una informacion casi exacta de lo que llevemos a cabo.

¿Que es Estadistica?

La estadística es una ciencia matemática que se refiere a la recolección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.

Comentario: la estadistica en mi opinion personal es una recoleccion de datos donde se toma de muestra a alguna poblacionm asi tambien esta ciencia nos ayuda a conocer diversos promedios, areas, etc.

Diagrama de Hojas

Gráficos de tallos y hojas: es una forma rápida de obtener una representación visual ilustrativa del conjunto de datos, para construir un diagrama de tallo y hoja primero se debe seleccionar uno ó más dígitos iniciales para los valores de tallo, el dígito o dígitos finales se convierten en hojas, luego se hace una lista de valores de tallo en una columna vertical. Prosiguiendo a registrar la hoja por cada observación junto al valor correspondiente de tallo, finalmente se indica las unidades de tallos y hojas en algún lugar del diagrama, este se usa para listas grandes y es un método resumido de mostrar los datos, posee la desventaja que no proporciona sino los datos, y no aparece por ningún lado información sobre frecuencias y demás datos importantes.
Comentario: el diagrama de hojas es practicamente obtener datos de una manera rapida, exclusiva y grafica.