Es la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría, es el primer paso para sintetizar la información es tabular los datos. Consideraremos distintos tipos de agrupaciones de datos.
Como resultado del estudio
estadístico se posee una serie de estadillos o cuestionarios, uno por cada
individuo considerado en el que se recogen todas las medidas realizadas a cada
individuo. La tabla siguiente es un ejemplo de uno de estos estadillos , en él
se han anotado seis características de árboles de un vivero después de un año
de haber sido plantadas, la tabla recoge las medidas correspondientes a los
diez primeros.
Árbol nº
|
Replantado
|
Grado de afección
|
Nº de ramas primarias
|
Diámetro (cm)
|
Altura (cm)
|
1
|
N
|
MG
|
1
|
3,9
|
160,4
|
2
|
S
|
NA
|
0
|
4,3
|
203,7
|
3
|
N
|
M
|
2
|
3,9
|
160,5
|
4
|
N
|
G
|
1
|
2,5
|
146,3
|
5
|
N
|
M
|
3
|
3,9
|
123,0
|
6
|
S
|
NA
|
4
|
4,2
|
184,4
|
7
|
N
|
L
|
2
|
4,5
|
153,0
|
8
|
N
|
L
|
1
|
5,3
|
186,0
|
9
|
S
|
MG
|
0
|
2,5
|
169,8
|
10
|
S
|
M
|
2
|
2,9
|
168,8
|
Códigos:
|
S: Si
N: No
|
NA: No Afectado
L: Leve
M: Medio
G: Grave
MG: Muy Grave
|
el primer paso para sintetizar la información es tabular los datos.
Consideraremos distintos tipos de agrupaciones de datos:
Tablas de
frecuencias de datos en agrupamiento discreto:
Realizamos este tipo de
agrupamiento cuando el número de posibles respuestas a la variable en estudio
es reducido. Las variables cualitativas se prestan muy bien a este sistema de
agrupamiento
Para
construir una tabla de frecuencias de agrupamiento discreto se anotan en una
columna cada uno de los distintos valores que tome la variable y en la columna
siguiente su frecuencia o número de veces que se repite.
La tabla de
frecuencia de la variable Replantado es:
Replantado
|
frecuencia
|
S
|
4
|
N
|
6
|
Total:
|
10
|
La tabla de
frecuencia de la variable X = Grado de afección es:
Grado de afección
|
frecuencia
ni
|
Frecuencia relativa
Fi
|
NA
|
2
|
0.2
|
L
|
2
|
0.2
|
M
|
3
|
0.3
|
G
|
1
|
0.1
|
MG
|
2
|
0.1
|
Total
|
10
|
1.0
|
La frecuencia relativa es la frecuencia absoluta dividida entre el
número de observaciones, indica la proporción de datos que muestran un
determinado valor de la variable. Se puede expresar también en %.
La tabla de
frecuencia de la variable X=Número de ramas primarias es.
Nº ramas primarias
xi
|
frecuencia
ni
|
frecuencia relativa
fi
|
Frecuencia acumulada
Ni
|
Frecuencia acumulada
relativa
Fi
|
0
|
2
|
0.2
|
2
|
0.2
|
1
|
3
|
0.3
|
5
|
0.5
|
2
|
3
|
0.3
|
8
|
0.8
|
3
|
1
|
0.1
|
9
|
0.9
|
4
|
1
|
0.1
|
10
|
1.0
|
Total
|
10
|
1.0
|
La frecuencia
acumulada es el número de datos que presentan un valor menor o igual que uno
dado de la variable. La frecuencia acumulada relativa es la proporción de datos
menores o iguales a uno dado.
Tablas de
frecuencias de datos agrupados en clases:
Cuando
tenemos una variable continua, o cuando, siendo discreta, el número de valores
diferentes es muy grande, se agrupan los datos en clases o intervalos.
El número de intervalos o clases I a considerar es una
cuestión importante y no hay un criterio fijo para establecerlo. la fórmula de Sturges es
una de las que se pueden utilizar para determinarlo, según ella, I es
el exponente de la primera potencia de dos cuyo resultado supera al número de
datos, con un mínimo de 4 clases.
Para el
ejemplo que estamos comentando, con 10 datos, como 24>10,
se toma I=4.
Para
determinar la amplitud de cada clase se divide el rango o diferencia entre el
mayor y el menor de los valores observados entre el número de clases I.
Para la
variable diámetro, la amplitud es: 0,7
Si el
cociente no es exacto se puede redondear por exceso, aunque eso hará que la
última clase termine en un valor superior al máximo observado.
Para evitar
dudas, se consideran todos los intervalos cerrados por la derecha y abiertos
por la izquierda, salvo el primero que se considera cerrado por ambos extremos.
Cada clase o
intervalo se identifica con una cifra llamada marca de clase, que es la media
entre ambos extremos.
La tabla de
frecuencias de la variable diámetro es:
Clases
|
Marcas
de clase
xi
|
frecuencia
ni
|
frecuencia relativa
fi
|
frecuencia acumulada
Ni
|
frecuencia acumulada
relativa
Fi
|
[2.5 ; 3.2]
|
2.85
|
3
|
0.3
|
3
|
0.3
|
(3.2 ; 3.9]
|
3.55
|
3
|
0.3
|
6
|
0.6
|
(3.9 ; 4.6]
|
4.25
|
3
|
0.3
|
9
|
0.9
|
(4.6 ; 5.3]
|
4.95
|
1
|
0.1
|
10
|
1.0
|
4) Resuelve los siguientes ejercicios e incorpórelos a su cuenta
slideshare de aprendizaje:
1. Explique la diferencia entre datos de agrupamiento discreto y de agrupamientos en clases. De ejemplos.
2. Explique que es la frecuencias absoluta,frecuencia relativa y la frecuencias acumuladas.
3. Busque en
la página Web del INDEC la evolución de
la población argentina a través de los censos.
Tome el gráfico correspondiente y elabore una tabla
de distribución de frecuencia ( ni, fi, Ni y Fi)
4. Considere la variable altura (cm) y organice la información en tablas de frecuencias (xi,ni, fi, Ni y Fi)
Hola!! me encantoo!! las imagines animadas... hermoso. Beso
ResponderEliminar