1. Ricercate il significato dei termini media, deviazione standard, varianza di un insieme di dati.

Scrivete 10 numeri a caso, che potete riguardare come eventi equiprobabili x1, x2, ..., x10 ; indicando con mx la media, con var(x) la varianza e con σx la deviazione standard dei dati suddetti, calcolate i tre parametri statistici utilizzando una calcolatrice:

mx = ...

var (x) = ...

σx = ...

II calcolo può essere abbreviato con un foglio elettronico o con una TIV.

Inseriti i dati nella colonna A, per esempio nelle prime dieci righe, con Excel o StarOffice la media mx è calcolata tramite l'istruzione MEDIA(A1:A10), la deviazione standard con DEV.ST.POP(A1:A10), mentre la varianza VAR(X) con =VAR.POP(A1:A10).

La radice quadrata è indicata con RADQ.


Con la TIV, scritta la matrice v (10 x 1) dei dati, l'istruzione
variance (v) · (n-1)/n,  con n = 10, restituisce la varianza, mentre mean(v) il valore atteso (media).
Oppure, scritti i dati nella prima colonna in ambiente Stats/List Editor, attivando F4 Calc 1 e indicando la lista in colonna si ottiene la media   e  la deviazione standard  , che è la radice quadrata della varianza.

La media è anche indicata con E(X), valore atteso di X (dall'inglese expected), specialmente quando i  valori della variabile X non sono equiprobabili.

 

2. A ciascuno dei numeri precedenti associate a piacere un'altro numero, in modo da ottenere dieci coppie di numeri casuali; ad esempio, due colonne, ciascuna di dieci numeri,  affiancate.
Un modo per misurare la relazione fra i dati delle due colonne si ottiene attraverso il calcolo della somma seguente:

                                 

ovvero, brevemente

                                         

dove  le  xi rappresentano i numeri della prima colonna, le yi i corrispondenti della seconda, mx è la media dei valori xi , my quella dei valori yi e n è il numero delle coppie dei dati (nel nostro caso n = 10).

La somma in questione si dice covarianza delle due variabili x e y e si indica con   cov(x,y).

Calcolate la covarianza dei numeri di cui sopra utilizzando una calcolatrice.

II calcolo può essere abbreviato col foglio elettronico:
per esempio, in Excel, poste le 10 coppie di dati nelle colonne A e B, l'istruzione =covarianza(A1:A10;B1:B10) fornisce subito la covarianza.

Se ora dividete la covarianza per il prodotto delle due deviazioni standard:

                               

ottenete un indice di correlazione fra le due colonne di dati, variabile fra -1 e 1.

Verificate le seguenti congetture, utilizzando un foglio elettronico:

a) considerando dati casuali l'indice è prossimo allo zero

b) considerando dati dipendenti, in modo che al crescere dell'uno cresca anche l'altro, l'indice è prossimo a 1 (proprio uguale a 1 se, per esempio, raddoppiamo i valori dei dati nella seconda colonna)

c) considerando dati dipendenti, in modo che al crescere dell'uno diminuisca l'altro, l'indice è prossimo a -1 (proprio uguale a -1 se, per esempio, raddoppiamo i valori dei dati nella seconda colonna)