Media (statistica) – wikipedia duke electric orlando

####

La media aritmetica è il tipo di media impiegato più comunemente e quello al quale, con il termine "media", si fa in genere riferimento nel parlare comune. Viene usata per riassumere con un solo numero un insieme di dati su un fenomeno misurabile (per esempio, l’altezza media di una popolazione).

dove K {\displaystyle K} è il numero di modalità assunte dal carattere x, x j {\displaystyle x_{j}} rappresenta la j-esima modalità di x e n j {\displaystyle n_{j}} la corrispondente frequenza assoluta. Essendo poi n j / n = f j {\displaystyle n_{j}/n=f_{j}} , ne deriva che:

La media aritmetica ponderata (o media pesata) viene calcolata sommando i valori in analisi, ognuno moltiplicato per un coefficiente (detto anche peso) che ne definisce l’"importanza", e dividendo tutto per la somma dei pesi (quindi è una combinazione lineare convessa dei dati in analisi). Alla luce di questa definizione, la media aritmetica semplice è un caso particolare di media aritmetica pesata nella quale tutti i valori hanno peso unitario.

Si dimostra facilmente che la media aritmetica è un indice di posizione, in quanto aggiungendo o moltiplicando tutti i valori per una stessa quantità la media stessa aumenta o è moltiplicata per quella stessa quantità. Come tutti gli indici di posizione, la media aritmetica fornisce l’ ordine di grandezza dei valori esistenti e permette di conoscerne la somma dei valori (moltiplicando la media per il numero n {\displaystyle n} di elementi).

Nonostante la media aritmetica sia spesso usata per fare riferimento alle tendenze, non fornisce un dato statistico robusto in quanto risente notevolmente dei valori anomali ( outlier). Per questo si considerano spesso anche altri indici, come la mediana, che sono più robusti rispetto ai valori anomali e si fa un’analisi comparata. Un tentativo di ridurre l’effetto dei valori estremi nel calcolo della media aritmetica è costituito dalla trimmed mean, ovvero un particolare calcolo della media nel quale si considera solo una certa percentuale dei valori più centrali, tralasciando i valori agli estremi di questi. È comune, per esempio, il calcolo della trimmed mean al 50%, che consiste nella media aritmetica del 50% dei valori più centrali, tralasciando dunque il 25% dei valori più piccoli e il 25% di quelli più grandi.

Per calcolare la media ponderata di una serie di dati di cui ogni elemento x i {\displaystyle x_{i}} proviene da una differente distribuzione di probabilità con una varianza σ i 2 {\displaystyle {\sigma _{i}}^{2}} nota, una possibile scelta per i pesi è data da:

Dalla precedente scrittura si ricava anche una proprietà della media geometrica: il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi. Infatti, svolgendo il logaritmo su entrambi i lati dell’uguaglianza e ricordando che l n ( e ) = 1 {\displaystyle ln(e)=1} , si ottiene:

dove K {\displaystyle K} è il numero delle modalità assunte dalla variabile x, x j {\displaystyle x_{j}} rappresenta la j-esima modalità di x e n j {\displaystyle n_{j}} la corrispondente frequenza assoluta. Dalla precedente si ottiene anche:

a i h i = a i + h i a i + h i h i a i = a i + h i 1 a i + 1 h i = a i + 1 h i + 1 {\displaystyle {\sqrt {a_{i}h_{i}}}={\sqrt {\frac {a_{i}+h_{i}}{\frac {a_{i}+h_{i}}{h_{i}a_{i}}}}}={\sqrt {\frac {a_{i}+h_{i}}{{\frac {1}{a_{i}}}+{\frac {1}{h_{i}}}}}}={\sqrt {a_{i+1}h_{i+1}}}}

La media geometrica si applica a valori positivi. Ha un chiaro significato geometrico: ad esempio la media geometrica di due numeri è la lunghezza del lato di un quadrato equivalente ad un rettangolo che abbia i lati di modulo pari ai due numeri. Lo stesso vale in un numero di dimensioni superiore. La media geometrica trova impiego soprattutto dove i valori considerati vengono per loro natura moltiplicati tra di loro e non sommati. Esempio tipico sono i tassi di crescita, come i tassi d’interesse o i tassi d’inflazione.

M g = ∏ i = 1 5 x i 5 = 10 ⋅ 13 ⋅ 9 ⋅ 7 ⋅ 12 5 = 98 280 5 ≈ 9 , 97 {\displaystyle M_{g}={\sqrt[{5}]{\prod _{i=1}^{5}x_{i}}}={\sqrt[{5}]{10\cdot 13\cdot 9\cdot 7\cdot 12}}={\sqrt[{5}]{98\,280}}\approx 9{,}97} Media armonica [ modifica | modifica wikitesto ]

La media di potenza (o media generalizzata o media di Hölder o media p {\displaystyle p} -esima) rappresenta una generalizzazione delle medie pitagoriche. È definita come la radice p {\displaystyle p} -esima della media aritmetica delle potenze di esponente p {\displaystyle p} degli n {\displaystyle n} valori considerati:

Ad ogni termine può essere associato un coefficiente detto peso, in genere rappresentato dalla frequenza oppure da un valore il quale descrive l’importanza (oggettiva o soggettiva) che il singolo elemento riveste nella distribuzione. Se ai dati in esame si assegna un insieme di pesi w i {\displaystyle w_{i}} , tali che w = ∑ w i {\displaystyle w=\sum w_{i}} , è possibile definire la media pesata:

Si determinano la media aritmetica a 1 {\displaystyle a_{1}} e la media geometrica g 1 {\displaystyle g_{1}} di x {\displaystyle x} e y {\displaystyle y} a 1 = 1 2 ( x + y ) {\displaystyle a_{1}={\frac {1}{2}}(x+y)} g 1 = x y {\displaystyle g_{1}={\sqrt {xy}}} .

Le due successioni sono convergenti e hanno limite comune, detto media aritmetico-geometrica di x {\displaystyle x} e y {\displaystyle y} , indicata come M ( x , y ) {\displaystyle \mathrm {M} (x,y)} o talvolta come a g m ( x , y ) {\displaystyle \mathrm {agm} (x,y)} .

La media geometrica di due numeri è sempre minore della media aritmetica, di conseguenza g n {\displaystyle g_{n}} è una successione crescente, a n {\displaystyle a_{n}} è decrescente e si ha g n ≤ M ( x , y ) ≤ a n {\displaystyle g_{n}\leq \mathrm {M} (x,y)\leq a_{n}} (le disuguaglianze sono strette se x ≠ y {\displaystyle x\neq y} ).

Dato un campione ( x 1 , x 2 , … , x n ) {\displaystyle (x_{1},x_{2},\dots ,x_{n})} di numerosità n {\displaystyle n} e una funzione f {\displaystyle f} in n {\displaystyle n} variabili, la media delle x i {\displaystyle x_{i}} rispetto a f {\displaystyle f} è definita come quell’unico numero M {\displaystyle M} , se esiste, tale che sostituendolo a tutte le variabili il valore della funzione rimane inalterato: