Cos'é lo Scarto Quadratico Medio? PDF Print E-mail
User Rating: / 66
PoorBest 
Written by Riccardo Carlesso   

 

Tux o pal?!?
Tux
Cerco di spiegarvela in modo semplice.

 

Voi avete un insieme di numeri, di valori, di campioni, ad esempio il vostro peso nell'ultimo mese, il vostro conto in banca, o i 100 tiri che avete fatto con un dado facendovi male al polso... Di un sacco di valori ci si fa poco, allora i matematici hanno inventato dei parametri che sono significativi dell'andamento dei campioni.

Il valore + semplice, interessante e importante di tutti questi numeri è la media (fate la somma di 90 numeri e dividete per 90, con i dadi dovrebbe venirvi sempre circa 3.5, provare per credere). Tutti sanno cos'è la media.

La varianza, questa sconosciuta, la sanno in pochi. Noi del Comitato della Promozione della Varianza nel Mondo ve la vogliamo spiegare.

Lo scarto quadratico medio è la somma dei quadrati delle differenze tra N valori e il loro valor medio...  che dovete dividere per il numero di campioni e mettere sotto radice. E' un po' come il momento d'inerzia, è proporzionale alla somma dei quadrati dello scostamento dalla media di un andamento.... ti dà idea di quanto i dati sono 'dispersi'.

Queste parole son difficili da capire, per capirle meglio vi conviene 'normalizzare i vostriu valori rendendo la media nulla. Un dado da sei avrebbe media nulla se anzichè avere i numeri da 1 a 6 li avesse da -2.5 a 2.5 con passo 1. Il bello di sta cosa è che il valore medio è e sarebbe impossibile da verificare (ovvio, se avete un dado che fa sempre 0 o 1 il valore medio è 0.5 che ovviamente non può mai avvenire! Non fatevi confindere dalle numerose facce di un dado da risiko!). Nel caso semplificato di una distribuzione a media nulla, la varianza è simillima alla media: quest'ultima è la somma dei valori divisi per quanti ne sono (per dirla alla abruzzese: se avessi detto "diviso per la loro caridnalità" vi sareste appisolati); la varianza è invece la somma dei quadrati divisa infine per la cardinalità dei valori. Il bello dei quadrati è che cresconoin fretta, e spostano il peso in fretta se qualche pecora nera si separa dal gregge.

Ad esempio, se la media è 0 e i valori sono:
1, 1, 1, 1, 1, -9, 1, 1, 1, 1
vedi da te che lo scostamento è 90 (poi fai la radice, ma cambia poco il concetto!); se sempre a media nulla hai:
1, -1, 1, -1, 1, -1, 1, -1, 1, -1
lo scostamento è 10 (quindi 9 volte + piccolo).

In altre parole lo s.q.m. impenna quando anche uno solo dei valori è alto, ed è basso se TUTTI i valori son bassini. Tant'è che esso è una norma.

L'isomorfismo fisico è quello di un volano che gira intorno a un asse paragonato all'asse stesso: entrambi ruotano bene, ma l'asse ha poca inerzia poerchè (a parità di massa!) la massa dista poco dall'asse (è l'asse stesso!) mentre nel volano hai masse ben lontane, ed è ciò che fa avanzare la macchina se l'hai trovata nell'uovo kinder (anche x molto tempo dopo che hai finito di spingerla).

NB. Io ho messo media nulla perchè si può dimostrare in modo semplice che lo sqm (che io chiamo σ2) è indipendente dalla media, ovvero se trasli tutti i tuoi valori di M, la media aumenta di M ma lo sqm non cambia. E se hai media zero fare i quadrati a mente è + facile. Cool

Esempio pratico

Nella mia vita ho sempre capito molto piùù gli esempi della teoria. Se siete come me, questo potrebbe chiarificarvi. Supponiamo che siate indecisi su che macchina comprare e andate a vedere in un sito in cui  ci sono per tre macchine che avete visto i voti dati da chi la macchina l'ha comprata. Supponiamo assurdamente che nel sito ci sia la lista dei voti. Supponiamo che alla Bmw 318 molti abbiano dato 8, pochi 9 e pochi 7. In questo caso avremo:

  • Media=8.2. Evidentemente la macchina piace, e ha avuto qualche 9 in più dei 7.
  • Moda 8. La moda è il valore più dato, è una misura a mio parere inutile, dice che la gente ama cliccare più su 8 che su 7 o su 9, ma non dàidea del valore della macchina.
  • Sigma=0,53. Queso è un valore molto interessante. Il significato è che chi ha votato la macchina ha dato sì mediamente 8,2 e non 5,3 (il che è la cosa che più ci interessa, e ce lo dice la media), ma sappiamo molto di più, ovvero che chi ha votato è stato mediamente abbastanza vicino a quel valore, ovvero ci si è poco dissociato.

Se ad esempio sapessimo che le macchine che abbiamo visto hanno i seguenti voti:

  • Bmw 318. m=8,2   s=0,53
  • Audi A4 nuova. m=8,1    s=0,2
  • Volkswagen Eos. m=7  s=2,0

Questi dati ci dicono ad esempio che alla gente la A4 e la 318 piacciono quasi allo stesso modo, ma che la A4 ha voti molto più stabili (ovvero è più raro che uno dia un votone o un votaccio, a parità di media, ricordatelo, e quindi per ogni votone dev'esserci anche un votaccio!). Potete anche notare che la mitica Eos (che io eprsonalmente adoro) piace molto meno delle altre due, eppure ha voti molto più altilenanti. Il significato prettamente fisico è che a qualcuno la cabrio fa impazzire, a tal altri sembra una ciofeca, il che spiega l'alta variabilità del voto.

Dispersione

Capire lo scarto quadratico medio e il momento d'inerzia è la stessa cosa: il punto è sempre la dispersione. Se uno vi chiede  cosa potete dire di sensato sul vostro peso la prima risposta sensata è: 'peso 80 kg'. Ma se vi chiede com'è dislocato il vostro peso gli risponderete: il mio baricentro è all'incirca sopra al mio ombelico. Ma se uno è più pignolo e vuol chiedervi educatamente quanto siete grassi, gli darete il vostro momento d'inerzia. Questo non è altro che un numerello che dice quanto tutti i vostri millimetri cubi di peso (dai piedi ai capelli) distino dal vostro baricentro, è ciò che discrimina una biglia pesantissima nel vostro baricentro, da voi stessi, da un voi stessi di cartapesta con un peso da 40kg nell'unghia del piede e un altro da 40kg nei capelli (tali che il punto medio sia il vostro ombelico). Il peso è lo stesso, il baricentro pure, ma cambia la distribuzione del vostro peso. Che cosa ve ne frega? Mah, niente... se uno ha una macchina che vi deve sollevare non cambia una fava, se uno deve farvi roteare rispetto a qualche asse invece la cosa lo interesserà molto.

Linux

Se volete calcolare media e varianza di alcuni valori, ho sviluppato uno scriptino scemo che ho chiamato avg. Esso calcola media e varianza di una serie di valori dati in standard input separati da invio.

#!/usr/bin/perl

        # $Id: avg 673 2008-01-18 10:23:18Z riccardo $
        # $URL$
        # Author: Riccardo Carlesso
        # License: GPL
        # calcola somma e media di una fila di numeri

use List::Util qw[min max];

$version="1.3";

my $n=0; # contatore
my $t=0; # somma
my $V=0; # somma quadrati
my $max; # massimo

while () {
 $n++;
 $t += $_;
 $V += $_ * $_;
 $max=max($max,$_);
}

my $mu=sprintf("%.9f",$t/$n);
my $sigma;
if ($V/$n-$mu*$mu < 0) { # impossibile matematicamente ma computazionalmente ahime'...
        $sigma=0;
} else {
        $sigma=sprintf("%.9f",sqrt($V/$n-$mu*$mu));
}
chomp $max;
print "sum: $t\navg: $mu\nsig: $sigma\nmax: $max\nTOT: $n\n";
 

Se avete messo questo script in un file chiamato 'avg' e messo nel vostro path (ad esempio in /usr/local/bin) potete divertirvi a provare:

2210 Admin@masagno:~$ echo 8 8 8 8 8 8 8 9 9 7  |xargs -n 1| avg
sum: 81
avg: 8.100000000
sig: 0.538516481
max: 9
TOT: 10

Se volete sapere la media e varianza della dimensione dei file in una directory (quinto campo di ls -al) basta fare:

Admin@masagno:~$ ls -al | awk {'print $5'} | avg

Semplice, no? 

Conclusioni 

Ecco a cosa serve lo scarto quadratico medio: non solo a sapere quanto una cosa vale, ma anche che trend ha, che dispersione ha, quanto è ballerino/stabile. La cosa più divertente è che spesso lo s.q.m. è ancor più importante del valor medio. Scusate il confucianesimo di quanto sto per dire, ma ad esempio il discorso vale per tutte le cose che han media nulla ;-)

(this is dedicated to Maiogaio)

 
Make Text Bigger Make Text Smaller Reset Text Size

Menu Utente

Phoca Gallery Menu Module