ESTADISTICA
1.1.1
La estadística
es una ciencia formal que estudia la recolección,
análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones
regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en
forma aleatoria
o condicional.
Sin embargo, la estadística es más que eso, es decir, es el vehículo que
permite llevar a cabo el proceso relacionado con la científica. Es transversal
a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de
decisiones en áreas de negocios o instituciones gubernamentales.
Población en estadística,
también llamada universo o colectivo, es el conjunto de elementos
de referencia sobre el que se realizan unas de las observaciones.
Muestra es un subconjunto de casos o individuos de una población
estadística. Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma.
Para cumplir esta característica la inclusión de sujetos en la muestra debe
seguir una técnica de
muestreo.
Variable es
una característica que al ser medida en diferentes individuos es susceptible de
adoptar diferentes valores.
Censo recuento de individuos que conforman una población
estadística, definida como un conjunto de elementos de referencia sobre el que se
realizan las observaciones.
1.1.2
Encuesta es un estudio observacional en el cual el
investigador busca recaudar datos de información por medio de un cuestionario
prediseñado, y no modifica el entorno ni controla el proceso que está en
observación.
Tesis es una
afirmación cuya veracidad ha sido argumentada, demostrada
o justificada de alguna manera. Generalmente enuncia una proposición
científica, un axioma
o un hecho demostrable.
Investigación es una actividad humana orientada a la
obtención de nuevos conocimientos y, por esa vía, ocasionalmente dar solución a
problemas o interrogantes de carácter científico.
Revista
científica
es una publicación periódica en la que se intenta
recoger el progreso de la ciencia, entre otras cosas incluyendo informes sobre las
nuevas investigaciones. Muchas de las revistas son
altamente especializadas, aunque algunas de las más antiguas publican artículos en un amplio rango de campos
científicos.
1.2.1
Escalas de
medición
son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las
escalas de medición, pueden ser clasificadas de acuerdo a una degradación de
las características de las variables. Estas escalas son: nominales, ordinales,
intervalares o racionales.
El nivel nominal describe variables de
naturaleza categórica que difieren en calidad más que en cantidad . Ante las
observaciones que se realizan de la realidad, es posible asignar cada una de
ellas exclusivamente a una categoría o grupo.
El nivel ordinal describe las variables a
lo largo de un continuo sobre el que se pueden ordenar los valores. En este
caso las variables no sólo se asignan a grupos sino que además pueden
establecerse relaciones de mayor que, menor que o igual que, entre los
elementos.
El nivel
de intervalo integra las variables que pueden establecer
intervalos iguales entre sus valores. Las variables del nivel de intervalos
permiten determinar la diferencia entre puntos a lo largo del mismo continuo.
Las operaciones posibles son todas las de escalas anteriores, más la suma y la
resta.
El nivel
de razón integra aquellas variables con intervalos iguales
pueden situar un cero absoluto. Estas variables nombran orden, presentan
intervalos iguales y el cero significa ausencia de la característica.
1.2.2
Encuesta describe un método de obtener información de una muestra de individuos. Esta muestra es usualmente sólo una
fracción de la población bajo estudio.
Por ejemplo, antes de una elección, una muestra de electores es interrogada
para determinar cómo los candidatos y los asuntos son percibidos por el
público… un fabricante hace una encuesta al mercado potencial antes de introducir un nuevo producto… una entidad del gobierno comisiona una encuesta
para obtener información para evaluar legislación existente o para preparar y
proponer nueva legislación.
Entrevista
se utilizan para recabar información en forma verbal, a través de preguntas que
propone el analista. Quienes responden pueden ser gerentes o empleados, los
cuales son usuarios actuales del sistema
existente, usuarios potenciales del sistema propuesto o aquellos que
proporcionarán datos o serán afectados por la aplicación propuesta.
OBSERVACIÓN consiste
en observar a las personas cuando efectúan su trabajo. Como técnica de
investigación, la observación tiene amplia aceptación científica.
Cuestionario
es un documento formado por un conjunto de preguntas que deben estar redactadas
de forma coherente, y organizadas, secuenciadas y estructuradas de acuerdo con
una determinada planificación, con el fin de que sus respuestas nos puedan
ofrecer toda la información que se precisa.
1.2.3
Selección de los
procedimientos adecuados para obtener información estadística de diferentes
fuentes.
Es válida
al estar sustentada en información verificable, que responda lo que se pretende demostrar con la hipótesis
formulada. Para ello, es imprescindible
realizar un proceso de recolección de datos en forma planificada y teniendo claros objetivos sobre el nivel y
profundidad de la información a recolectar. Se presenta en este artículo una serie de criterios a considerar para diseñar la
herramienta de recolección de
información, así como los métodos de recolección para lograr en una
investigación resultados confiables.
1.3.1
Distribución de
frecuencias para datos agrupados
Es aquella distribución en la que la disposición tabular de
los datos estadísticos se encuentran ordenados en clases y con la frecuencia en
cada clase; es decir, los datos originales de varios valores adyacentes del
conjunto se combinan para formar un intervalo de clase. No existen normas
establecidas para determinar cuándo es apropiado utilizar datos agrupados o
datos no agrupados; sin embargo, se sugiere que cuando el número total de datos
(N) es igual o superior 50 y además el rango o recorrido de la serie de datos
es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos
agrupados, también se utilizará este tipo de distribución cuando se requiera
elaborar gráficos lineales como el histograma, el polígono de frecuencia o la
ojiva.
Para agrupar los datos en intervalos de clase se deben seguir las
siguientes reglas generales:
• El numero de intervalos de clase se toma entre 5 y 15 dependiendo de
los datos.
• Cada observación debe estar incluida en una y solo una clase o
intervalo.
• El valor mas pequeño y mas grande deben entrar en la clasificación.
• No deben existir brechas o vacíos entre clases sucesivas.
• Los intervalos no se deben sobreponer.
• En la medida de lo posible, se debe utilizar la misma amplitud para
todos los intervalos.
Distribución
de frecuencia para datos no Agrupados
Es aquella distribución que indica las
frecuencias con que aparecen los datos estadísticos, desde el menor de ellos
hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al
tamaño de las unidades originales. En estas distribuciones cada dato mantiene
su propia identidad después que la distribución de frecuencia se ha elaborado.
En estas distribuciones los valores de cada variable han sido solamente
reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.
PAGINA 92
1.5.3
Cálculo de
medidas de dispersión
Rango al intervalo de menor tamaño que contiene a los datos; es igual a la diferencia entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos.
Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de
un conjunto.
Varianza es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
Desviación estándar es una medida de centralización o dispersión para
variables de razóny de intervalo, de gran utilidad en la estadística descriptiva.
1.5.4
cuartiles son los
tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales.
deciles son los
nueve valores que dividen
la serie de datos en
diez partes iguales. Los deciles
dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
percentiles son los 99 valores
que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al
1%, al 2%... y al 99% de los datos.
1.5.5
Distribuciones platicúrtica
Esta
medida determina el grado de concentración que presentan los valores en la
región central de la distribución. Por medio del Coeficiente de
Curtosis, podemos identificar si existe una gran concentración de
valores , una concentración normal ó una baja concentración .
2.1.1
Diagrama de caja es
un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de
datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los
"bigotes". Es un gráfico que suministra información sobre los valores
mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de
la distribución. Primero es necesario encontrar la mediana para luego encontrar
los 2 cuartiles restantes.
2.1.3
interpretación de medidas de asimetría: sesgo de
una distribución, a la derecha y a la izquierda.
Diremos que una distribución es simétrica cuando su
mediana, su moda y su media aritmética coincidan. Claramente las distribuciones
de los ejemplos de los niveles de
colinesterasa y del n° de hijos
no son por tanto, simétricas.
Si las frecuencias descienden más lentamente por la
izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.
Existen varias medidas de la asimetría de una
distribución de frecuencias. Aquí estudiaremos dos de ellas.
- Coeficiente de Asimetría de Pearson
Se define como:
siendo cero cuando la distribución es simétrica,
positivo cuando existe asimetría a la derecha y negativo cuando existe
asimetría a la izquierda.
En el ejemplo del número de hijos Ap es igual a
indicando una ligera asimetría a la izquierda en la
distribución de frecuencias correspondiente.
De la misma manera, para el ejemplo de los niveles de colinesterasa también se
observa una ligera asimetría a la izquierda, al ser
De la definición se observa que este coeficiente
solo se podrá utilizar cuando la distribución sea unimodal. La otra medida de
asimetría que veremos no presenta este inconveniente.
No hay comentarios:
Publicar un comentario