SU LA DEFINIZIONE DI STATISTICA
GONZALO SÁNCHEZ-CRESPO BENITEZ
Delegato dell'Istituto Nazionale di Statistica in Cantabria
gsanchez@ine.es
VICENTE MANZANO ARRONDO
Professore titolare dell'Università di Siviglia
vmanzano@us.es
Riassunto
In questa prova si proporsi una definizione di Statistica che fa appoggio nella rappresentatività risaltando la differenza tra Statistica e Matematica. La definizione di Statistica è una delle questioni chiave nella formazione dei propria Statistici e degli investigatori in generale, paradossalmente negli studi su didattica di questa materia si fanno pochi riferimenti a questa definizione. Nei manuali e nei dizionari il concetto di Statistica normalmente si risolve con alcuno appuntamento normalmente descrittivo sull'oggetto ed i metodi che l'occupano, realizzandosi una classificazione in distinte categorie in funzione degli strumenti utilizzati. Ma normalmente non si fa riferimento ad una definizione previa, propriamente detta che stabilisca i limiti della materia di una forma chiara e che possa essere utilizzata per migliorare la comprensione sulla stessa.
In questo modo si definisce la Statistica come:
Scienza che si occupa dello studio di fenomeni di tipo generico, normalmente complessi ed incorniciati in un universo variabile, mediante l'impiego di modelli di riduzione dell'informazione e di analisi di convalida dei risultati in termini di rappresentatività.
Parole chiave: Definizione di Statistica. Formazione. Didattica. Rappresentatività. Validità. Affidabilità.
INTRODUZIONE
Raccogliendo un appuntamento di C. Batanero ed altri il fattore più importante che ha influenza sull'apprendistato è quello che l'alunno sa già. Verifichi Lei questo ed insegni Lei conseguentemente, Ausubel e cols. È chiaro che tutto il mondo ha un concetto di Statistica. M. Cordero presenta un'inchiesta sul concetto di Statistica in alunni di liceo coi risultati facilmente prevedibili. La statistica, nel meglio dei casi, si riferisce più con numeri e percentuali che con un strumento di investigazione scientifico con caratteristiche proprie.
Come stabilisce M.G. Kendall, definire in che consiste o che cosa la Statistica è è stato una materia che ha diviso durante la storia ai propria statistici. Da Quetelet che la considerava la regina delle scienze fino ad autori che la definiscono come una tecnica più, al servizio di altri rami della conoscenza. La caratteristica comune è stata la molteplicità di definizioni che si sono iscritti su statistica. W.F. Willcox, in 1935, riunisce 115 definizioni ed apporta un più per sostituirli, senza riuscirlo. Il numero di definizioni di statistica ha continuato ad aumentare.
DEFINIZIONI UMORISTICHE
Nonostante gli sforzi realizzati attraverso la storia per trovare una definizione accettabile di Statistica, e sicuramente come conseguenza precisamente della sua difficoltà, è stato un fatto rimarcato il successo, in quanto a divulgazione, delle definizioni umoristiche. Se poche sono le persone che hanno una definizione appropriata di Statistica, sono molte quelle che conoscono o intuiscono alcuna di queste definizioni che A. Piatier definì come umoristiche.
Quasi tutte le definizioni, più che umoristiche, sarcastiche, hanno per nucleo centrale stabilire una relazione tra statistica e bugia, pretendono di svisare la conoscenza ottenuta per la statistica. Un'analisi dettagliata di queste definizioni può avere un effetto positivo per avvicinarci al concetto di Statistica. Il rischio è aiutare a diffondere opinioni di persone che non hanno nessuna conoscenza del metodo né delle sue applicazioni e successi, A. Piatier.
Si dice, per esempio, che se una persona guadagna un milione ed un altro niente la statistica stabilisce che le due hanno guadagnato mezzo milione. Questo argomento sembra sufficiente per svisare una disciplina, dato che: se non sa fare qualcosa di tanto semplice come è possibile che sia capace di risolvere problemi più complessi?. Esempi simili hanno proliferato: La statistica dice che se una persona mette la testa nel congelatore ed i piedi nel forno la sua temperatura mezza sarà corretta. La statistica pronostica una riuscita per il caso di un soldato che spara su un bersaglio una volta mezzo metro alla destra ed un altro mezzo metro alla sinistra. Se sgraniamo questi, in apparenza, semplici esempi troveremo alcune delle caratteristiche che distingue alla Matematica dalla Statistica e che permettono di definire a questa ultima.
STATISTICA E MATEMATICA
Possiamo comprovare che il calcolo della calza è un'operazione strettamente matematica e che in un senso stretto quella che cede nell'esempio è l'interpretazione di un risultato aritmetico. Una delle caratteristiche della Statistica è precisamente analizzare la validità dei risultati. Affinché questo esempio possa abbandonare l'ambito della matematica e passare al terreno della Statistica è necessario che si stabilisca alcuno misura della rappresentatività, della validità, del risultato che si presenta. È evidente che la calza aritmetica in questo esempio questa affettata per una scarsa rappresentatività, ed un'analisi realmente statistica non avrebbe difficoltà in apportare varie misure della sua rappresentatività.
In questo punto conviene osservare la differenza con la quale si usa nel linguaggio quotidiano l'espressione dato e l'espressione statistica. In occasioni quando l'interlocutore vuole esprimere la sua fiducia o la sua sfiducia in un dato normalmente dice ho una statistica o quella è solo una statistica. il concetto di dato normalmente è tuttavia influenzato di una certa infallibilità. Avere un dato che mira qualcosa normalmente si considera con serietà, una statistica al contrario, è qualcosa in principio individuo a discussione. È paradossale che se la statistica è un dato vidimato per un'analisi della sua validità, abbia meno valore, nell'inconscio collettivo, che un dato isolato.
Fenomeni complessi
Orbene questo tipo di definizioni ed esempi umoristici, contro quello che sembra, di semplice obiezione all'uso indiscriminato della matematica per la risoluzione di problemi statistici, presenta aspetti che permettono di approfondire nel concetto di Statistica. La Statistica si può definire come un strumento del metodo scientifico e pertanto orientato allo studio. Studiare fenomeni semplici, come quelli degli esempi, non precisa l'utilizzo di un metodo statistico, malgrado se può applicarsi, non sia necessario. Dove appare la necessità di determinare statisticamente leggi che dirigono e permettono di spiegare fenomeni ed aumentare la conoscenza dell'essere umano è quando si presentano situazioni complesse colpite per l'incertezza. È in questo terreno, in quello dell'incertezza misurabile, dove la Statistica trova il suo principale campo di azione.
Come esempio di questo tipo di situazioni possiamo mettere qualunque esperimento biologico dove si desidera conoscere l'effetto isolato da distinti trattamenti e le sue interazioni. Situazioni dove la confluenza di un gran numero di circostanze hanno effetti che mascherano e fanno difficile determinare la verità, verità che esiste e che ricusa mostrarsi.
Metodo generale
Un altro punto della definizione di Statistica è, seguendo a M.G. Kendall, stabilire che la Statistica è un metodo generale, un linguaggio comune, riferito ad insiemi e le sue relazioni, serve per ottenere imperfettamente conclusioni probabili di popolazioni conosciute. Il suo carattere generico, oltrepassa le frontiere tra le differenti scienze. Studi particolari in determinati campi della conoscenza hanno dato luogo a metodi che incorporati al corpo della Statistica sono stati, posteriormente, traspuestos, in occasioni con decadi di distanza, a distinti rami della scienza. Un problema originalmente relazionato con dispersione delle nuvole di zanzare in una regione infettata per la malaria ha dato luogo a metodi per determinare la struttura molecolare del caucciù. Lo studio delle macchie solari e la sua relazione coi raccolti permise di ottenere modelli applicabili a questioni tanto differenti come analizzare movimenti borsistici o la preparazione di superfici metallica levigate. Un altro esempio che permette di comprendere che si tratta di un metodo generale viene dato osservando che il modello ottenuto studiando a caso la longitudine di un bastone rotto si applicò a risolvere problemi di reti di comunicazione o allo studio dei cicli economici.
Questo senso generico unito alla preoccupazione per formalizzare la validità dei risultati è quello che situa alla Statistica nell'intersezione del resto delle scienze e gli dà il carattere di strumento del metodo scientifico.
Statistica ed incertezza
Un punto centrale della discussione è, come fa M.G. Kendall, distinguere la Matematica della Statistica come scienza della certezza e dell'incertezza. Caratterizzando alla Statistica come una scienza che cerca stabilire i limiti dell'incertezza, e non mangio un ramo della matematica. Questa ultima messa a fuoco, vigente ancora, ha penoso conseguenze nei piani di studio del liceo relegando lo studio della statistica ad un comma, molte volte eliminato o alleggerito per scaricare il programma, reddito tra il calcolo integrale e lo studio delle coniche. Queste materie si spiegano con un'orientazione esclusivamente diretta a superare il problemi tipo di convalida o di selettività. Con menzione inappropriata del concetto di calcolo di probabilità, nozioni di combinatoria e problemi del teorema di Bayes che, seguendo a C.F. Harrington, sono difficile per imparare statistica. Menzione inappropriata dal punto di vista didattico dato che creda più avversione che vera motivazione per lo studio.
Un esempio divulgativo su questo carattere differenziato con la matematica possiamo metterlo nella seguente situazione: la matematica lascia chiaramente, e senza genero di dubbio, stabilito che sommare due due proporziona come risultato quattro. La statistica parte di una situazione più complessa, espone il problema di sommare due quantità ed analizzare la validità del risultato. Il risultato di questa somma sarà affettato per un errore dovuto all'incertezza. La statistica mette a fuoco la sua attenzione a procedimenti di convalida e fenomeni soggetti a fattori esterni multipli ed incontrollabili. Questi sono i limiti che vuole stabilire la statistica. Il suo obiettivo è sapere tra che stimi si trova il vero valore.
Questo tipo di problema, sotto condizioni di incertezza, si presenta in moltitudine di occasioni. Possiamo pensare alla difficoltà di proporzionare una stima del reddito di un paese come aggregazione del reddito ottenuto per ognuno dei suoi abitanti. Ancora nel caso in cui potesse domandare ad ogni individuo, avremmo effetti aleatori e perfino sbiechi per errori commessi in chiunque delle fasi dell'investigazione, per effetto degli strumenti di raccolta di dati, per effetto della memoria degli informatori, per la propria variabilità dei dati o per qualunque altro tipo.
Universo e magnifiche variabili
Autori come S. Cabria risalta che la Statistica studia il comportamento dei fenomeni relativi a collettivi. I collettivi, l'universo, è dove si districano o stanno i fenomeni, i fatti. In Statistica il riferimento al collettivo è importante, per due questioni, perché incornicia benissimo il, come nel resto delle scienze, e, inoltre, perché condiziona i metodi ed i risultati. In questo punto può risaltarsi l'affermazione di D.S. Moore di mettere i dati in contesto.
La statistica ha il suo oggetto nell'incertezza. E quella è conseguenza di abbordare una questione centrale e è che tanto la cornice, il contesto o con più ampiezza l'universo, come i fenomeni, stanno in movimento, individui a variabilità. L'universo ed i fenomeni sono variabili e l'osservazione che si può fare di essi è limitata, per quel motivo è necessaria la Statistica.
La Statistica col fine di studiare un fenomeno presente in un universo eccessivamente ampio e variabile, quello che pretende è ottenere un modello che lo spieghi, mediante una riduzione nei dati originali, e stabilire la misura di fino a che punto questa nuova informazione, o modello ridotto, è valido e rappresenta bene all'originale
Validità, rappresentatività ed affidabilità
Uno dei concetti più utilizzati in Statistica è quella di affidabilità. Per affidabilità si capisce ottenere un'informazione valida, senza errori, e rappresentativa. Per ottenere questo fine si usa, da un lato l'analisi della validità dei risultati e, per un'altra, stabilire questi risultati in termini di rappresentatività. L'analisi della validità, in un senso ampio, si riferisce allo studio di tutti i possibili errori che possono apparire in chiunque delle fasi del processo statistico, dalla raccolta di dati fino all'interpretazione dei risultati, passando per le ipotesi nelle quali si basa il ragionamento. In questo è necessario prestare speciale attenzione alle deviazioni delle ipotesi per le quali si è ideato il metodo che Lei questo applicando. Questa analisi di validità è il motivo per il quale normalmente si fa riferimento ad una tipologia molto ampia di errori negli studi statistici. Si tenta di quantificare l'errore totale commesso per l'investigazione distinguendo, secondo i casi, errori dovuti al campionamento, errori altrui allo stesso, come possono essere errori di copertura, di codificazione… eccetera. Pertanto per validità si capisce senza errori o almeno con errori misurabili.
La relazione tra validità e rappresentatività possiamo stabilirla della seguente forma: la validità si occupa di applicare modelli statistici in ordine a determinare gli errori di un'investigazione. Questa fase comprende i calcoli necessari per decidere l'ordine di grandezza dell'errore commesso sostituendo da un lato l'universo. Per esempio può ottenersi che un estimador ha un errore totale che comprende gli errori dosati in ogni fase del processo, uguale al 2.5 percento. Questo permette di calcolare le stime per intervallo ed esprimere in termini misurabili l'incertezza. Il concetto di rappresentatività, in Statistica, può capirsi come l'interpretazione che fa l'investigatore della validità. Ha un componente soggettivo. Nell'esempio anteriore, di stima per intervalli, interpretare in termini di rappresentatività l'errore ottenuto del 2.5 percento può portare all'investigatore ad accettare o respingere determinata ipotesi in funzione della regione critica che stabilisca. E la regione critica è una decisione personale basata in una valutazione delle conseguenze che avrà il suo stabilimento.
Unire l'analisi di validità con la sua interpretazione in termini di rappresentatività è quello che configura l'affidabilità finale dei risultati di un'investigazione statistica.
Definizione di statistica
Facendo un sforzo di riduzione ed in formato di dizionario, possiamo concludere riassumendo le considerazioni anteriori con una definizione di Statistica che consideriamo mette l'accento nella rappresentatività. Questa non è una novità dato che è facile trovare definizioni di Statistica che raccolgono l'interesse di questa scienza per la validità dei suoi risultati. Il vantaggio che suppone accentuare quello carattere è che permette di delimitare con precisione la differenza tra un dato ed un dato statistico insieme a separa, crediamo anche con chiarezza, la statistica della matematica.
Statistica
1. scienza che si occupa dello studio di fenomeni di tipo generico, normalmente complessi ed incorniciati in un universo variabile, mediante l'impiego di modelli di riduzione dell'informazione e di analisi di convalida dei risultati in termini di rappresentatività. L'informazione può essere numerica, alfabetica o simbolica. Consta delle fasi di raccolta di informazione, di analisi e di presentazione ed interpretazione dei risultati ed elaborazione di metodi.
2. il termine si impiega per riferirsi a chiunque di queste fasi.
3. statistico: Espressione matematica di una funzione dei valori di una dimostrazione.
4. statistico: Persona che sviluppa o applica questa scienza.
Definita così la Statistica si evita di fare menzione a sé è o non unisca ramo della matematica, visione che consideriamo superfluamente limitata, al tempo che si stabilisce il suo carattere generico ed il suo campo di azione nello studio di fenomeni complessi ubicati in un universo ampio e variabile. Con questa affermazione, di complessità, si introdursi il fattore di incertezza che accompagna ai fenomeni aleatori ma senza limitare il campo della Statistica in modo che può applicarsi anche a magnifico determinísticos. Col riferimento all'universo si esprime la relazione descritta per D.S. Moore circa che i dati statistici lo sono in un contesto. La definizione continua stabilendo i procedimenti che utilizza che hanno in comune di ridurre l'informazione. Modelli di questo tipo comprendono dal calcolo della calza aritmetica fino alla determinazione di complicati modelli di correlazione canonica. L'ultimo aspetto che consideriamo importante è quello del riferimento alle analisi di validità dei risultati in termini di rappresentatività. Con questa specificazione possiamo differenziare quello che è una semplice operazione aritmetica di quello che è una cifra o un studio statistico. Come regola generale potremmo stabilire che un studio sarà statistico quando ai modelli di riduzione usati l'accompagni, cioè possibile realizzare, un'analisi di validità dei risultati ottenuti in termini di rappresentatività. In quanto al tipo di informazione i dati possono essere quantitativi, qualitativi o perfino esiste un ramo della Statistica che si occupa di quello che si denomina dati simbolici (per esempio negli incidenti di automobile determinare l'ambiente mediante valutazioni: visibilità, esistenza di albera nell'ambiente, curve, pioggia, velocità... eccetera). Il resto della definizione abborda questioni relazionate con l'uso della parola statistica nel linguaggio.
CONCLUSÍON
Dato l'uso generalizzato che ha la parola statistica è essenziale che questo definita adeguatamente. Se la parola statistica si associa di forma chiara con lo strumento destinato a verificare la verità che è in realtà, allora è probabile che l'avversione che produce nella gente in generale e molto specialmente negli alunni di liceo e perfino di Università decadrà. Allo stesso tempo maneggiare un concetto di Statistica ambiguo o perfino sbagliato può avere effetti negativi nello sviluppo scientifico degli studenti di qualunque disciplina. Pensiamo che la definizione proposta può aiutare gli studenti ed interessati in generale ad introdurssi in questa scienza con una visione più regolata di quello che si trovano in lei.
RIFERIMENTI
Follatore, C. altri. (1994). Errors and difficulties in understanding elementary statistical concepts. Journal of mathematics education in science and technology, 25(4), 527-547
Capra, S. (1994). Filosofia della statistica. Servizio di Pubblicazioni dell'Università di Valencia
Agnello, M.; Garcia, R. (1990). Commenti sull'insegnamento della statistica nel liceo. Statistica Spagnola 143. p.2-32.
Moore, D. S. (1992). Teaching statistics asse a respectable subject. In F. Gordon & S. Gordon (Eds.), Statistics for the twenty-first century (pp. 14-25). Washington, D.C.: Mathematical Association of America.
Harrington, C.F. Schibik, T.J. (2002). Facilitating student engagement in the introductory business statistics course. Proceedings of the Midwest Business Economics Association. Chicago, Illinois.
KENDAL, M.G. (1950). THE STATISCAL APROACH. Economica.
Piatier, A. (1962). Statistique, I, Parigi.
Ros Jimeno, J. (1945). Il concetto di Statistica. Madrid: Successori di Rivadeneyra, 18 p.
WILLCOX, W.F. (1935). DEFINITIONS OF STATISTICS. J.Soc.Stat., Parigi.