1. Ricercate il significato dei termini media, deviazione standard, varianza di un insieme di dati.
Scrivete 10 numeri a caso, che potete riguardare come eventi equiprobabili x1, x2, ..., x10 ; indicando con mx la media, con var(x) la varianza e con σx la deviazione standard dei dati suddetti, calcolate i tre parametri statistici utilizzando una calcolatrice:
mx = ...
var (x) = ...
σx = ...
II calcolo può essere abbreviato con un foglio elettronico o con una TIV.
Inseriti i dati nella colonna A, per esempio nelle prime
dieci righe, con Excel
o
StarOffice
la media mx è calcolata
tramite l'istruzione MEDIA(A1:A10),
la deviazione standard con DEV.ST.POP(A1:A10),
mentre la varianza VAR(X) con =VAR.POP(A1:A10).
La radice quadrata è indicata con RADQ.
Con la TIV, scritta la matrice v (10 x 1) dei dati, l'istruzione
variance (v) · (n-1)/n,
con n = 10, restituisce la varianza,
mentre mean(v) il valore
atteso (media).
Oppure, scritti i dati nella prima colonna in ambiente Stats/List Editor,
attivando F4 Calc 1 e indicando la lista in colonna si ottiene la
media
e la deviazione standard
, che è la radice quadrata della
varianza.
La media è anche indicata con E(X), valore atteso di X (dall'inglese expected), specialmente quando i valori della variabile X non sono equiprobabili.
2. A ciascuno dei numeri precedenti associate a piacere un'altro
numero, in modo da ottenere dieci coppie di numeri casuali; ad esempio, due
colonne,
ciascuna di dieci numeri, affiancate.
Un modo per misurare la relazione fra i dati delle due colonne si ottiene
attraverso il calcolo della somma seguente:
ovvero, brevemente
dove le xi rappresentano i numeri della prima colonna, le yi i corrispondenti della seconda, mx è la media dei valori xi , my quella dei valori yi e n è il numero delle coppie dei dati (nel nostro caso n = 10).
La somma in questione si dice covarianza delle due variabili x e y e si indica con cov(x,y).
Calcolate la covarianza dei numeri di cui sopra utilizzando una calcolatrice.
II calcolo può essere abbreviato col foglio elettronico:
per esempio, in Excel, poste le 10 coppie di dati
nelle colonne A e B, l'istruzione =covarianza(A1:A10;B1:B10)
fornisce
subito la covarianza.
Se ora dividete la covarianza per il prodotto delle due deviazioni standard:
ottenete un indice di correlazione fra le due colonne di dati, variabile fra -1 e 1.
Verificate le seguenti congetture, utilizzando un foglio elettronico:
a) considerando dati casuali l'indice è prossimo allo zero
b) considerando dati dipendenti, in modo che al crescere dell'uno cresca anche l'altro, l'indice è prossimo a 1 (proprio uguale a 1 se, per esempio, raddoppiamo i valori dei dati nella seconda colonna)
c) considerando dati dipendenti, in modo che al crescere dell'uno diminuisca l'altro, l'indice è prossimo a -1 (proprio uguale a -1 se, per esempio, raddoppiamo i valori dei dati nella seconda colonna)