lunes, 27 de agosto de 2012

Estadística Descriptiva 1.1.1 al 1.3.2


ESTADISTICA

1.1.1
La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la científica. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.
Población  en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones.
Muestra es un subconjunto de casos o individuos de una población estadística. Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo.

Variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores.

Censo recuento de individuos que conforman una población estadística, definida como un conjunto de elementos de referencia sobre el que se realizan las observaciones.
1.1.2
Encuesta es un estudio observacional en el cual el investigador busca recaudar datos de información por medio de un cuestionario prediseñado, y no modifica el entorno ni controla el proceso que está en observación.
Tesis es una afirmación cuya veracidad ha sido argumentada, demostrada o justificada de alguna manera. Generalmente enuncia una proposición científica, un axioma o un hecho demostrable.
Investigación  es una actividad humana orientada a la obtención de nuevos conocimientos y, por esa vía, ocasionalmente dar solución a problemas o interrogantes de carácter científico.
Revista científica es una publicación periódica en la que se intenta recoger el progreso de la ciencia, entre otras cosas incluyendo informes sobre las nuevas investigaciones. Muchas de las revistas son altamente especializadas, aunque algunas de las más antiguas publican artículos en un amplio rango de campos científicos.

1.2.1
Escalas de medición son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales.
El nivel nominal describe variables de naturaleza categórica que difieren en calidad más que en cantidad . Ante las observaciones que se realizan de la realidad, es posible asignar cada una de ellas exclusivamente a una categoría o grupo.
El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los valores. En este caso las variables no sólo se asignan a grupos sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los elementos.
El nivel de intervalo integra las variables que pueden establecer intervalos iguales entre sus valores. Las variables del nivel de intervalos permiten determinar la diferencia entre puntos a lo largo del mismo continuo. Las operaciones posibles son todas las de escalas anteriores, más la suma y la resta.
El nivel de razón integra aquellas variables con intervalos iguales pueden situar un cero absoluto. Estas variables nombran orden, presentan intervalos iguales y el cero significa ausencia de la característica.
1.2.2
Encuesta describe un método de obtener información de una muestra de individuos. Esta muestra es usualmente sólo una fracción de la población bajo estudio. Por ejemplo, antes de una elección, una muestra de electores es interrogada para determinar cómo los candidatos y los asuntos son percibidos por el público… un fabricante hace una encuesta al mercado potencial antes de introducir un nuevo producto… una entidad del gobierno comisiona una encuesta para obtener información para evaluar legislación existente o para preparar y proponer nueva legislación.
Entrevista se utilizan para recabar información en forma verbal, a través de preguntas que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o aquellos que proporcionarán datos o serán afectados por la aplicación propuesta.
OBSERVACIÓN consiste en observar a las personas cuando efectúan su trabajo. Como técnica de investigación, la observación tiene amplia aceptación científica.
Cuestionario es un documento formado por un conjunto de preguntas que deben estar redactadas de forma coherente, y organizadas, secuenciadas y estructuradas de acuerdo con una determinada planificación, con el fin de que sus respuestas nos puedan ofrecer toda la información que se precisa.
1.2.3
Selección de los procedimientos adecuados para obtener información estadística de diferentes fuentes.
Es válida al estar sustentada en información verificable, que responda lo que se pretende demostrar con la hipótesis formulada. Para ello, es imprescindible realizar un proceso de recolección de datos en forma planificada y teniendo claros objetivos sobre el nivel y profundidad de la información a recolectar. Se presenta en este artículo una serie de criterios a considerar para diseñar la herramienta de recolección de información, así como los métodos de recolección para lograr en una investigación resultados confiables.
1.3.1
Distribución de frecuencias para datos agrupados
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia en cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.
Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas generales:
• El numero de intervalos de clase se toma entre 5 y 15 dependiendo de los datos.
• Cada observación debe estar incluida en una y solo una clase o intervalo.
• El valor mas pequeño y mas grande deben entrar en la clasificación.
• No deben existir brechas o vacíos entre clases sucesivas.
• Los intervalos no se deben sobreponer.
• En la medida de lo posible, se debe utilizar la misma amplitud para todos los intervalos.

Distribución de frecuencia para datos no Agrupados
Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.


PAGINA 92
1.5.3
Cálculo de medidas de dispersión

Rango  al intervalo de menor tamaño que contiene a los datos; es igual a la diferencia entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.

Varianza es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.

Desviación estándar es una medida de centralización o dispersión para variables de razóny de intervalo, de gran utilidad en la estadística descriptiva.
1.5.4
cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
1.5.5
Distribuciones  platicúrtica
Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores , una concentración normal ó una baja concentración .
Estados de la Curtosis - Medidas de Distribucion

2.1.1
Diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes". Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes.
2.1.3
interpretación de medidas de asimetría: sesgo de una distribución, a la derecha y a la izquierda.
Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coincidan. Claramente las distribuciones de los ejemplos de los niveles de colinesterasa y del n° de hijos no son por tanto, simétricas.
Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.
Existen varias medidas de la asimetría de una distribución de frecuencias. Aquí estudiaremos dos de ellas.
  1. Coeficiente de Asimetría de Pearson
Se define como:
http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/ecuac21.gif
siendo cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.
En el ejemplo del número de hijos Ap es igual a
http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/ecuac22.gif
indicando una ligera asimetría a la izquierda en la distribución de frecuencias correspondiente.
De la misma manera, para el ejemplo de los niveles de colinesterasa también se observa una ligera asimetría a la izquierda, al ser
http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/ecuac23.gif
De la definición se observa que este coeficiente solo se podrá utilizar cuando la distribución sea unimodal. La otra medida de asimetría que veremos no presenta este inconveniente. 

No hay comentarios:

Publicar un comentario