Il metodo statistico consente anche di analizzare i dati. Metodi statistici di analisi delle informazioni

💖 Ti piace? Condividi il collegamento con i tuoi amici

Sono descritti in modo sufficientemente dettagliato nella letteratura nazionale. Nella pratica delle imprese russe, tuttavia, ne vengono utilizzate solo alcune. Esaminiamone ulteriormente alcuni metodi di elaborazione statistica.

informazioni generali

Nella pratica delle imprese nazionali, sono prevalentemente diffusi metodi di controllo statistico. Se parliamo di regolamentazione del processo tecnologico, si osserva estremamente raramente. Applicazione di metodi statistici prevede che l'impresa formi un gruppo di specialisti dotati delle qualifiche adeguate.

Senso

Secondo i requisiti della norma ISO ser. 9000, il fornitore deve determinare la necessità di metodi statistici utilizzati nello sviluppo, nella regolamentazione e nel test delle capacità del processo di produzione e delle prestazioni del prodotto. Le tecniche utilizzate si basano sulla teoria della probabilità e su calcoli matematici. Metodi statistici di analisi dei dati può essere implementato in qualsiasi fase del ciclo di vita del prodotto. Forniscono valutazione e contabilità del grado di eterogeneità del prodotto o di variabilità delle sue proprietà rispetto alle denominazioni stabilite o ai valori richiesti, nonché della variabilità nel processo della sua creazione. I metodi statistici sono tecniche mediante le quali si può giudicare con una certa accuratezza e affidabilità lo stato dei fenomeni studiati. Permettono di prevedere determinati problemi e sviluppare soluzioni ottimali sulla base delle informazioni fattuali, delle tendenze e dei modelli studiati.

Istruzioni per l'uso

Principali aree in cui sono diffusi i metodi statistici lo sono:


Pratica dei paesi sviluppati

I metodi statistici sono una base che garantisce la realizzazione di prodotti con elevate caratteristiche di consumo. Queste tecniche sono ampiamente utilizzate nei paesi industrializzati. I metodi statistici sono, in sostanza, garanzie che i consumatori ricevano prodotti che soddisfano i requisiti stabiliti. L'effetto del loro utilizzo è stato dimostrato dalla pratica delle imprese industriali in Giappone. Sono stati loro a contribuire al raggiungimento del più alto livello di produzione in questo paese. Molti anni di esperienza all’estero dimostrano quanto siano efficaci queste tecniche. In particolare, è noto che la società Hewlelt Packard, utilizzando metodi statistici, è riuscita a ridurre in un caso il numero di difetti al mese da 9.000 a 45 unità.

Difficoltà di implementazione

Nella pratica domestica, ci sono una serie di ostacoli che ne impediscono l'uso metodi statistici di studio indicatori. Le difficoltà sorgono a causa di:


Sviluppo del programma

Va detto che determinare la necessità di determinati metodi statistici nel campo della qualità, scegliere e padroneggiare tecniche specifiche è un lavoro piuttosto complesso e lungo per qualsiasi impresa nazionale. Per la sua efficace attuazione, è consigliabile sviluppare uno speciale programma a lungo termine. Dovrebbe prevedere la creazione di un servizio i cui compiti comprenderanno l'organizzazione e l'orientamento metodologico dell'applicazione dei metodi statistici. Nell'ambito del programma, è necessario provvedere all'equipaggiamento di mezzi tecnici adeguati, alla formazione di specialisti e alla determinazione della composizione dei compiti di produzione che devono essere risolti utilizzando le tecniche selezionate. Si consiglia di iniziare a padroneggiare utilizzando gli approcci più semplici. Ad esempio, puoi utilizzare la famosa produzione elementare. Successivamente è consigliabile passare ad altre tecniche. Ad esempio, potrebbe trattarsi di analisi della varianza, elaborazione selettiva di informazioni, regolamentazione dei processi, pianificazione di ricerche ed esperimenti fattoriali, ecc.

Classificazione

I metodi statistici di analisi economica includono tecniche diverse. Vale la pena dire che ce ne sono molti. Tuttavia, uno dei massimi esperti nel campo della gestione della qualità in Giappone, K. Ishikawa, consiglia di utilizzare sette metodi principali:

  1. Grafici di Pareto.
  2. Raggruppare le informazioni in base a caratteristiche comuni.
  3. Carte di controllo.
  4. Diagrammi di causa ed effetto.
  5. Istogrammi.
  6. Liste di controllo.
  7. Grafici a dispersione.

Sulla base della propria esperienza gestionale, Ishikawa afferma che il 95% di tutti i problemi e le problematiche di un'impresa possono essere risolti utilizzando questi sette approcci.

diagramma di Pareto

Questo si basa su un certo rapporto. Si chiamava "principio di Pareto". Secondo lui, l'80% degli effetti deriva dal 20% delle cause. mostra in forma chiara e comprensibile l'influenza relativa di ciascuna circostanza sul problema complessivo in ordine decrescente. Questo impatto può essere studiato in base al numero di perdite e difetti causati da ciascuna causa. L'influenza relativa è illustrata utilizzando barre, l'impatto accumulato dei fattori utilizzando una linea retta cumulativa.

Diagramma causa-effetto

Su di esso, il problema in studio è convenzionalmente rappresentato sotto forma di una freccia diritta orizzontale, e le condizioni e i fattori che lo influenzano indirettamente o direttamente sono sotto forma di frecce inclinate. Durante la costruzione, è necessario tenere conto anche delle circostanze apparentemente insignificanti. Ciò è dovuto al fatto che nella pratica si verificano molto spesso casi in cui la soluzione di un problema si ottiene eliminando diversi fattori, apparentemente poco importanti. Le ragioni che influenzano le circostanze principali (del primo e del successivo ordine) sono rappresentate sul diagramma con brevi frecce orizzontali. Il diagramma dettagliato avrà la forma di uno scheletro di pesce.

Informazioni sul raggruppamento

Questo metodo economico-statistico utilizzato per organizzare una varietà di indicatori ottenuti valutando e misurando uno o più parametri di un oggetto. Tipicamente, tali informazioni vengono presentate sotto forma di una sequenza non ordinata di valori. Queste possono essere le dimensioni lineari del pezzo, la temperatura di fusione, la durezza del materiale, il numero di difetti e così via. Sulla base di un tale sistema, è difficile trarre conclusioni sulle proprietà del prodotto o sui processi della sua creazione. L'ordinamento viene effettuato utilizzando grafici a linee. Mostrano chiaramente i cambiamenti nei parametri osservati in un certo periodo.

Lista di controllo

Di norma, viene presentato sotto forma di una tabella della distribuzione della frequenza di occorrenza dei valori misurati dei parametri dell'oggetto negli intervalli corrispondenti. Le liste di controllo vengono compilate in base allo scopo dello studio. L'intervallo dei valori dell'indicatore è diviso in intervalli uguali. Il loro numero viene solitamente scelto uguale alla radice quadrata del numero di misurazioni eseguite. Il modulo deve essere semplice per evitare problemi durante la compilazione, la lettura o il controllo.

grafico a barre

Si presenta sotto forma di un poligono a gradini. Illustra chiaramente la distribuzione degli indicatori di misurazione. L'intervallo dei valori stabiliti è diviso in intervalli uguali, tracciati lungo l'asse delle ascisse. Per ogni intervallo viene costruito un rettangolo. La sua altezza è uguale alla frequenza con cui si verifica una quantità in un dato intervallo.

Grafici a dispersione

Sono utilizzati per testare un'ipotesi sulla relazione tra due variabili. Il modello è costruito come segue. Il valore di un parametro è riportato sull'asse delle ascisse, mentre il valore di un altro parametro è riportato sull'asse delle ordinate. Di conseguenza, sul grafico viene visualizzato un punto. Questi passaggi vengono ripetuti per tutti i valori delle variabili. Se esiste una relazione, il campo di correlazione è allungato e la direzione non coinciderà con la direzione dell'asse y. Se non ci sono vincoli, sarà parallelo a uno degli assi o avrà la forma di un cerchio.

Carte di controllo

Vengono utilizzati quando si valuta un processo in un periodo specifico. La formazione delle carte di controllo si basa sulle seguenti disposizioni:

  1. Tutti i processi si discostano nel tempo dai parametri specificati.
  2. Il corso instabile dei fenomeni non cambia per caso. Le deviazioni che vanno oltre i limiti previsti non sono casuali.
  3. È possibile prevedere i cambiamenti individuali.
  4. Un processo stabile può deviare casualmente entro i limiti previsti.

Utilizzo nella pratica delle imprese russe

Va detto che l'esperienza nazionale ed estera mostra che il metodo statistico più efficace per valutare la stabilità e l'accuratezza delle apparecchiature e dei processi tecnologici è la compilazione di carte di controllo. Questo metodo viene utilizzato anche per regolare le capacità potenziali di produzione. Quando si costruiscono mappe, è necessario selezionare correttamente il parametro da studiare. Si raccomanda di dare la preferenza a quegli indicatori che sono direttamente correlati allo scopo del prodotto, possono essere facilmente misurati e possono essere influenzati dal controllo del processo. Se tale scelta risulta difficile o non giustificata, si possono valutare le grandezze correlate (interrelate) con il parametro controllato.

Sfumature

Se misurare gli indicatori con la precisione richiesta per la compilazione di mappe basate su criteri quantitativi è economicamente o tecnicamente impossibile, viene utilizzato un indicatore alternativo. Ad esso sono associati termini come “difetto” e “difetto”. Per quest'ultima si intende ogni singola non conformità del prodotto ai requisiti stabiliti. I difetti sono prodotti che non possono essere forniti ai consumatori a causa della presenza di difetti in essi.

Peculiarità

Ogni tipo di carta ha le sue specifiche. Deve essere preso in considerazione quando li si sceglie per un caso particolare. Le mappe basate su un criterio quantitativo sono considerate più sensibili ai cambiamenti di processo rispetto a quelle che utilizzano una caratteristica alternativa. Tuttavia, i primi richiedono più manodopera. Sono utilizzati per:

  1. Debug del processo.
  2. Valutazione delle opportunità di implementazione della tecnologia.
  3. Verifica dell'accuratezza del funzionamento dell'apparecchiatura.
  4. Definizioni di tolleranza.
  5. Confronto di diversi modi accettabili per creare un prodotto.

Inoltre

Se il disturbo del processo è caratterizzato da uno spostamento del parametro controllato, è necessario utilizzare le X-card. Se c'è un aumento nella dispersione dei valori, è necessario scegliere i modelli R o S. Tuttavia, è necessario tenere conto di una serie di caratteristiche. In particolare, l'uso delle mappe S consentirà di stabilire allo stesso tempo il disordine del processo in modo più accurato e rapido rispetto ai modelli R. Tuttavia, la costruzione di questi ultimi non richiede calcoli complessi.

Conclusione

In economia è possibile studiare i fattori che vengono scoperti durante una valutazione qualitativa, nello spazio e nella dinamica. Con il loro aiuto, puoi eseguire calcoli predittivi. I metodi statistici di analisi economica non includono metodi per valutare le relazioni di causa-effetto di processi ed eventi economici, identificando riserve promettenti e inutilizzate per aumentare le prestazioni aziendali. In altre parole, gli approcci considerati non includono tecniche fattoriali.

metodi statistici

metodi statistici- metodi di analisi statistica dei dati. Esistono metodi di statistica applicata, che possono essere utilizzati in tutte le aree della ricerca scientifica e in qualsiasi settore dell'economia nazionale, e altri metodi statistici, la cui applicabilità è limitata all'una o all'altra area. Ciò si riferisce a metodi come il controllo statistico dell'accettazione, il controllo statistico dei processi tecnologici, l'affidabilità e i test e la pianificazione degli esperimenti.

Classificazione dei metodi statistici

I metodi statistici di analisi dei dati sono utilizzati in quasi tutte le aree dell'attività umana. Vengono utilizzati ogni volta che è necessario ottenere e giustificare eventuali giudizi su un gruppo (oggetti o soggetti) con una certa eterogeneità interna.

Si consiglia di distinguere tre tipologie di attività scientifiche e applicate nel campo dei metodi statistici di analisi dei dati (in base al grado di specificità dei metodi associati all'immersione in problemi specifici):

a) sviluppo e ricerca di metodi di uso generale, senza tener conto delle specificità del campo di applicazione;

b) sviluppo e ricerca di modelli statistici di fenomeni e processi reali in conformità con le esigenze di una particolare area di attività;

c) applicazione di metodi e modelli statistici per l'analisi statistica di dati specifici.

Statistica applicata

Una descrizione del tipo di dati e del meccanismo per la loro generazione è l'inizio di qualsiasi studio statistico. Per descrivere i dati vengono utilizzati sia metodi deterministici che probabilistici. Utilizzando metodi deterministici, è possibile analizzare solo i dati a disposizione del ricercatore. Ad esempio, con il loro aiuto sono state ottenute tabelle che sono state calcolate dagli organi statistici statali ufficiali sulla base dei rapporti statistici presentati da imprese e organizzazioni. I risultati ottenuti possono essere trasferiti ad una popolazione più ampia e utilizzati per la previsione e il controllo solo sulla base di modelli probabilistico-statistici. Pertanto, nella statistica matematica sono spesso inclusi solo metodi basati sulla teoria della probabilità.

Non riteniamo possibile contrapporre metodi deterministici e probabilistico-statistici. Li consideriamo come passaggi sequenziali dell'analisi statistica. Nella prima fase è necessario analizzare i dati disponibili e presentarli in una forma di facile lettura utilizzando tabelle e grafici. Successivamente è opportuno analizzare i dati statistici sulla base di alcuni modelli probabilistici e statistici. Si noti che la possibilità di una visione più approfondita dell'essenza di un fenomeno o processo reale è assicurata dallo sviluppo di un modello matematico adeguato.

Nella situazione più semplice, i dati statistici sono i valori di alcune caratteristiche degli oggetti studiati. I valori possono essere quantitativi o fornire un'indicazione della categoria in cui può essere classificato l'oggetto. Nel secondo caso si parla di segno qualitativo.

Quando misuriamo in base a diverse caratteristiche quantitative o qualitative, otteniamo un vettore come dati statistici su un oggetto. Può essere pensato come un nuovo tipo di dati. In questo caso il campione è costituito da un insieme di vettori. Ci sono parte delle coordinate - numeri e parte - dati qualitativi (categorizzati), quindi stiamo parlando di un vettore di diversi tipi di dati.

Un elemento del campione, ovvero una dimensione, può essere la funzione nel suo insieme. Ad esempio, a descrivere la dinamica dell'indicatore, cioè il suo cambiamento nel tempo, è l'elettrocardiogramma del paziente o l'ampiezza del battito dell'albero motore. Oppure una serie temporale che descrive le dinamiche della performance di una particolare azienda. Quindi l'esempio è costituito da un insieme di funzionalità.

Gli elementi campione possono anche essere altri oggetti matematici. Ad esempio, relazioni binarie. Pertanto, quando esaminano gli esperti, spesso utilizzano l'ordinamento (classifica) degli oggetti di esame: campioni di prodotti, progetti di investimento, opzioni per decisioni di gestione. A seconda delle prescrizioni dello studio esperto, gli elementi di campionamento possono essere vari tipi di relazioni binarie (ordinamento, partizionamento, tolleranza), insiemi, insiemi fuzzy, ecc.

Pertanto, la natura matematica degli elementi campione in vari problemi di statistica applicata può essere molto diversa. Tuttavia, si possono distinguere due classi di dati statistici: numerici e non numerici. Di conseguenza, la statistica applicata è divisa in due parti: statistica numerica e statistica non numerica.

Le statistiche numeriche sono numeri, vettori, funzioni. Possono essere sommati e moltiplicati per coefficienti. Pertanto, nelle statistiche numeriche, varie somme sono di grande importanza. L'apparato matematico per analizzare le somme degli elementi casuali di un campione sono le leggi (classiche) dei grandi numeri e i teoremi limite centrale.

I dati statistici non numerici sono dati categorizzati, vettori di diversi tipi di caratteristiche, relazioni binarie, insiemi, insiemi fuzzy, ecc. Non possono essere sommati e moltiplicati per coefficienti. Pertanto non ha senso parlare di somme di statistiche non numeriche. Sono elementi di spazi matematici (insiemi) non numerici. L'apparato matematico per l'analisi dei dati statistici non numerici si basa sull'uso delle distanze tra gli elementi (nonché misure di prossimità, indicatori di differenza) in tali spazi. Con l'aiuto delle distanze si determinano le medie empiriche e teoriche, si dimostrano le leggi dei grandi numeri, si costruiscono stime non parametriche della densità di distribuzione di probabilità, si risolvono problemi diagnostici e analisi di cluster, ecc. (vedi).

La ricerca applicata utilizza vari tipi di dati statistici. Ciò è dovuto, in particolare, alle modalità per ottenerli. Ad esempio, se i test su alcuni dispositivi tecnici continuano fino a un certo punto nel tempo, otteniamo il cosiddetto. dati censurati costituiti da una serie di numeri: la durata di funzionamento di un numero di dispositivi prima del guasto e le informazioni che i restanti dispositivi hanno continuato a funzionare alla fine del test. I dati censurati vengono spesso utilizzati per valutare e monitorare l'affidabilità dei dispositivi tecnici.

In genere, i metodi statistici per l'analisi dei dati dei primi tre tipi vengono considerati separatamente. Questa limitazione è causata dal fatto sopra notato che l'apparato matematico per l'analisi dei dati di natura non numerica è significativamente diverso da quello per i dati sotto forma di numeri, vettori e funzioni.

Modellazione probabilistico-statistica

Quando si applicano metodi statistici in specifici campi della conoscenza e settori dell'economia nazionale, si ottengono discipline scientifiche e pratiche come "metodi statistici nell'industria", "metodi statistici in medicina", ecc. Da questo punto di vista, l'econometria è "metodi statistici metodi in economia”. Tali discipline del gruppo b) si basano solitamente su modelli probabilistico-statistici costruiti in funzione delle caratteristiche del campo di applicazione. È molto istruttivo confrontare modelli probabilistico-statistici utilizzati in vari ambiti, per scoprirne le somiglianze e allo stesso tempo notare alcune differenze. Pertanto, si può vedere la somiglianza tra le affermazioni dei problemi e i metodi statistici utilizzati per risolverli in settori come la ricerca medico-scientifica, la ricerca sociologica specifica e la ricerca di mercato, o, in breve, nella medicina, nella sociologia e nel marketing. Questi sono spesso raggruppati sotto il nome di "studi campione".

La differenza tra studi campionari e studi esperti si manifesta, prima di tutto, nel numero di oggetti o soggetti censiti - negli studi campione si parla solitamente di centinaia, e negli studi esperti - circa decine. Ma la tecnologia della ricerca esperta è molto più sofisticata. La specificità è ancora più pronunciata nei modelli demografici o logistici, quando si elaborano informazioni narrative (testo, cronaca) o quando si studia l'influenza reciproca dei fattori.

Le questioni di affidabilità e sicurezza dei dispositivi e delle tecnologie tecniche, la teoria delle code sono discusse in dettaglio in un gran numero di lavori scientifici.

Analisi statistica di dati specifici

L'applicazione di metodi e modelli statistici per l'analisi statistica di dati specifici è strettamente legata alle problematiche del settore di riferimento. I risultati del terzo dei tipi identificati di attività scientifiche e applicate si trovano all'intersezione delle discipline. Possono essere considerati come esempi di applicazione pratica dei metodi statistici. Ma non ci sono meno ragioni per attribuirli al corrispondente campo dell'attività umana.

Ad esempio, i risultati di un sondaggio sui consumatori di caffè solubile sono naturalmente attribuiti al marketing (che è quello che fanno quando tengono conferenze sulle ricerche di mercato). Lo studio della dinamica della crescita dei prezzi utilizzando gli indici di inflazione calcolati da informazioni raccolte in modo indipendente è interessante principalmente dal punto di vista dell'economia e della gestione dell'economia nazionale (sia a livello macro che a livello delle singole organizzazioni).

Prospettive di sviluppo

La teoria dei metodi statistici è finalizzata alla risoluzione di problemi reali. Pertanto, in esso sorgono costantemente nuove formulazioni di problemi matematici per l'analisi dei dati statistici e vengono sviluppati e giustificati nuovi metodi. La giustificazione viene spesso effettuata con mezzi matematici, cioè dimostrando teoremi. Un ruolo importante è svolto dalla componente metodologica: come impostare esattamente i problemi, quali ipotesi accettare ai fini di ulteriori studi matematici. Il ruolo delle moderne tecnologie informatiche, in particolare degli esperimenti informatici, è eccezionale.

Un compito urgente è quello di analizzare la storia dei metodi statistici al fine di identificare le tendenze di sviluppo e applicarle per le previsioni.

Letteratura

2. Naylor T. Esperimenti di simulazione macchina con modelli di sistemi economici. - M.: Mir, 1975. - 500 p.

3. Kramer G. Metodi matematici della statistica. - M.: Mir, 1948 (1a ed.), 1975 (2a ed.). - 648 pag.

4. Bolshev L. N., Smirnov N. V. Tabelle di statistica matematica. - M.: Nauka, 1965 (1a ed.), 1968 (2a ed.), 1983 (3a ed.).

5. Smirnov N. V., Dunin-Barkovsky I. V. Corso di teoria della probabilità e statistica matematica per applicazioni tecniche. Ed. 3°, stereotipato. - M.: Nauka, 1969. - 512 pag.

6. Norman Draper, Harry Smith Analisi di regressione applicata. Regressione multipla = Analisi di regressione applicata. - 3a ed. - M.: “Dialettica”, 2007. - P. 912. - ISBN 0-471-17082-8

Guarda anche

Fondazione Wikimedia. 2010.

  • Yat-Kha
  • Amalgama (disambiguazione)

Scopri cosa sono i "metodi statistici" in altri dizionari:

    METODI STATISTICI- METODI STATISTICI metodi scientifici per la descrizione e lo studio dei fenomeni di massa che consentono un'espressione quantitativa (numerica). La parola “statistica” (da Igal. stato stato) ha una radice comune con la parola “stato”. Inizialmente... ... Enciclopedia filosofica

    METODI STATISTICI -- metodi scientifici di descrizione e studio dei fenomeni di massa che consentono l'espressione quantitativa (numerica). La parola “statistica” (dall’italiano stato) ha una radice comune con la parola “stato”. Inizialmente si riferiva alla scienza del management e... Enciclopedia filosofica

    metodi statistici- (in ecologia e biocenologia) metodi di statistica delle variazioni, che consentono di studiare il tutto (ad esempio fitocenosi, popolazione, produttività) secondo i suoi aggregati parziali (ad esempio, secondo i dati ottenuti nei siti di registrazione) e valutare la grado di precisione... ... Dizionario ecologico

    metodi statistici- (in psicologia) (dal latino status state) alcuni metodi di statistica matematica applicata, utilizzati in psicologia principalmente per l'elaborazione dei risultati sperimentali. Lo scopo principale dell'utilizzo di S. m. è aumentare la validità delle conclusioni in ... ... Grande enciclopedia psicologica

    metodi statistici- 20.2. Metodi statistici I metodi statistici specifici utilizzati per organizzare, regolare e testare le attività includono, ma non sono limitati a quanto segue: a) progettazione di esperimenti e analisi fattoriale; b) analisi della varianza e... Dizionario-libro di consultazione dei termini della documentazione normativa e tecnica

    METODI STATISTICI- metodi per lo studio delle quantità. aspetti delle società di massa. fenomeni e processi. S. m. permettono di caratterizzare in termini digitali i cambiamenti in atto nelle società. processi, studiare vari. forme di socio-economico. modelli, cambiamento... ... Dizionario enciclopedico agricolo

    METODI STATISTICI- alcuni metodi di statistica matematica applicata utilizzati per l'elaborazione dei risultati sperimentali. Sono stati sviluppati numerosi metodi statistici appositamente per testare la qualità dei test psicologici, da utilizzare in ambito professionale... ... Educazione professionale. Dizionario

    METODI STATISTICI- (in psicologia dell'ingegneria) (dal latino status state) alcuni metodi di statistica applicata utilizzati in psicologia dell'ingegneria per elaborare i risultati sperimentali. Lo scopo principale dell'utilizzo di S. m. è aumentare la validità delle conclusioni in ... ... Dizionario enciclopedico di psicologia e pedagogia

Inviare il tuo buon lavoro nella knowledge base è semplice. Utilizza il modulo sottostante

Studenti, dottorandi, giovani scienziati che utilizzano la base di conoscenze nei loro studi e nel loro lavoro ti saranno molto grati.

Pubblicato su http://www.allbest.ru/

  • 3. Serie dinamiche
  • Letteratura

1. Valori assoluti e relativi

Come risultato della sintesi e del raggruppamento del materiale statistico, il ricercatore si trova nelle mani di un'ampia varietà di informazioni sui fenomeni e sui processi studiati. Sarebbe però un grosso errore soffermarsi sui risultati ottenuti, perché anche raggruppati per determinate caratteristiche e rappresentati in forma tabellare o grafica, questi dati sono pur sempre solo una sorta di illustrazione, un risultato intermedio che deve essere analizzato - in questo caso , statistico. Statisticoanalisi - Questo prestazione studiato oggetto V qualità smembrato sistemi, quelli. complesso elementi E connessioni, formando V il suo interazione biologico Totale.

Come risultato di tale analisi, dovrebbe essere costruito un modello dell'oggetto studiato e, poiché stiamo parlando di statistica, durante la costruzione del modello dovrebbero essere utilizzati elementi e connessioni statisticamente significativi.

L’analisi statistica, infatti, è finalizzata all’individuazione di tali elementi e connessioni significative.

Assolutoindicatori(valori) - valori totali, calcolati o ricavati da report statistici riepilogativi senza alcuna trasformazione. Gli indicatori assoluti sono sempre nominali e si riflettono nelle unità di misura specificate in sede di elaborazione del programma di osservazione statistica (numero di procedimenti penali avviati, numero di reati commessi, numero di divorzi, ecc.).

Gli indicatori assoluti costituiscono la base per qualsiasi ulteriore operazione statistica, ma essi stessi sono di scarsa utilità per l'analisi. Utilizzando indicatori assoluti, ad esempio, è difficile giudicare il livello di criminalità in diverse città o regioni ed è praticamente impossibile rispondere alla domanda dove la criminalità è più alta e dove più bassa, poiché le città o le regioni possono differire significativamente in termini di popolazione, territorio e altri parametri importanti.

Parentele quantità in statistica sono indicatori generalizzati che rivelano la forma numerica della relazione tra due quantità statistiche confrontate. Quando si calcolano i valori relativi, vengono spesso confrontati due valori assoluti, ma è possibile confrontare sia i valori medi che quelli relativi, ottenendo nuovi indicatori relativi. L'esempio più semplice per calcolare un valore relativo è la risposta alla domanda: quante volte un numero è maggiore di un altro?

Quando si inizia a considerare i valori relativi, è necessario considerare quanto segue. In linea di principio puoi confrontare tutto ciò che desideri, anche le dimensioni lineari di un foglio di carta A4, con la quantità di prodotti fabbricati dalla Manifattura di porcellana Lomonosov. Tuttavia, un simile confronto non ci darà nulla. La condizione più importante per il calcolo fruttuoso delle quantità relative può essere formulata come segue:

1. Le unità di misura delle grandezze confrontate devono essere uguali o del tutto comparabili. Il numero di crimini, procedimenti penali e condanne sono indicatori correlati, vale a dire correlati, ma non comparabili in unità di misura. In un procedimento penale possono essere processati diversi reati e un gruppo di persone condannato; Diversi condannati possono commettere un reato e, viceversa, un condannato può commettere molti atti. Il numero di crimini, casi e condanne è paragonabile alla popolazione, al numero del personale nel sistema di giustizia penale, al tenore di vita delle persone e ad altri dati per lo stesso anno. Inoltre, nel corso di un anno, gli indicatori considerati sono abbastanza comparabili tra loro.

2. I dati confrontati devono necessariamente corrispondere tra loro in termini di tempo o territorio di ricezione, o di entrambi i parametri insieme.

Assoluto misurare, Con Quale vengono confrontati altro Vetravestimenti, chiamato base O base confronti, UN confrontareEscolpito indice - misurare confronti. Ad esempio, quando si calcola il rapporto tra le dinamiche della criminalità in Russia nel periodo 2000-2010. I dati del 2000 costituiranno la base di riferimento. Possono essere presi come uno (quindi il valore relativo sarà espresso sotto forma di coefficiente), oppure come 100 (in percentuale). A seconda della dimensione dei valori confrontati viene scelta la forma più comoda, indicativa e visiva per esprimere il relativo valore.

Se il valore da confrontare è molto maggiore della base, il rapporto risultante è meglio espresso in coefficienti. Ad esempio, la criminalità in un certo periodo (in anni) è aumentata di 2,6 volte. L'espressione in tempi in questo caso sarà più indicativa che in percentuale. I valori relativi sono espressi in percentuale quando il valore di confronto non differisce molto dalla base.

Le quantità relative utilizzate nelle statistiche, comprese le statistiche legali, sono di diversi tipi. I seguenti tipi di quantità relative vengono utilizzati nelle statistiche legali:

1. relazioni che caratterizzano la struttura della popolazione, o relazioni distributive;

2. il rapporto della parte con il tutto, o il rapporto di intensità;

3. relazioni caratterizzanti la dinamica;

4. Relazioni di grado e comparazione.

Parentegrandezzadistribuzione - Questo parente misurare, espresso V per cento individuale parti totalità studiato fenomeni(reati, penali, cause civili, cause legali, cause, misure di prevenzione, ecc.) A loro generale di conseguenza, accettato dietro 100% . Questo è il tipo più comune (e più semplice) di dati relativi utilizzati nelle statistiche. Si tratta, ad esempio, della struttura del reato (per tipologia di reato), della struttura del casellario giudiziale (per tipologia di reato, per età dei condannati), ecc.

valore assoluto dell'analisi statistica

Atteggiamentointensità(rapporto tra parte e tutto) - un valore relativo generalizzante che riflette la prevalenza di una certa caratteristica nell'osservato totalità.

L’indicatore di intensità più comune utilizzato nelle statistiche giuridiche è l’intensità della criminalità . L’intensità della criminalità si riflette solitamente nel tasso di criminalità , quelli. numero di reati ogni 100 o 10mila abitanti.

KP= (P*100000)/N

dove P è il numero assoluto di crimini registrati, N è la dimensione assoluta della popolazione.

Un prerequisito che determina la possibilità stessa di calcolare tali indicatori, come menzionato sopra, è che tutti gli indicatori assoluti utilizzati siano presi in un territorio e per un periodo di tempo.

Relazione,caratterizzantedinamica, rappresentare generalizzando parente le quantità, mostrando modifica In tempo quelli O altro indicatori legale statistiche. L'intervallo di tempo viene solitamente considerato un anno.

La base (base) pari a 1, o 100%, è considerata un'informazione sulla caratteristica studiata per un certo anno, che era in qualche modo caratteristica del fenomeno studiato. I dati dell'anno base fungono da base fissa rispetto alla quale vengono percentualizzati gli indicatori degli anni successivi.

Le attività di analisi statistica spesso richiedono confronti annuali (o di altro periodo) quando base accettato dati tutti precedente dell'anno(mese o altro periodo). Tale base si chiama mobile. Questo viene solitamente utilizzato nell'analisi delle serie temporali (serie temporali).

RelazionegradiEconfronti consentire di confrontare diversi indicatori al fine di identificare quale valore è maggiore dell'altro, quanto un fenomeno si differenzia o è simile a un altro, cosa è comune e distintivo nei processi statistici osservati, ecc.

Un indice è un indicatore relativo di confronto creato appositamente (nel tempo, nello spazio, rispetto a una previsione, ecc.), che mostra quante volte il livello del fenomeno studiato in una condizione differisce dal livello dello stesso fenomeno in altre condizioni. Gli indici più comuni si trovano nelle statistiche economiche, sebbene svolgano un certo ruolo anche nell'analisi dei fenomeni giuridici.

Non si può fare a meno degli indici nei casi in cui è necessario confrontare indicatori incommensurabili, la cui semplice somma è impossibile. Pertanto, gli indici sono generalmente definiti come numeri-indicatoriPermisurazionimediaAltoparlantitotalitàeterogeneoelementi.

Nelle statistiche, gli indici sono solitamente indicati con la lettera I (i). Lettera maiuscola o lettera maiuscola: dipende se si tratta di un indice individuale (privato) o generale.

Individualeindici(i) riflettere il rapporto tra l'indicatore del periodo corrente e il corrispondente indicatore del periodo comparato.

Riepilogoindici vengono utilizzati per analizzare la relazione tra fenomeni socioeconomici complessi e sono costituiti da due parti: il valore effettivamente indicizzato e il commisuratore (“peso”).

2. Valori medi e loro applicazione nella statistica giuridica

Il risultato dell'elaborazione degli indicatori assoluti e relativi è la costruzione delle serie distributive. Riga distribuzione - QuestoordinatoDialta qualitàOquantitativosegnidistribuzioneunitàtotalità. L'analisi di queste serie è la base di qualsiasi analisi statistica, non importa quanto complessa possa rivelarsi in seguito.

Le serie di distribuzione possono essere costruite in base a caratteristiche qualitative o quantitative. Nel primo caso si chiama attributivo, nel secondo - variazionale. In questo caso, vengono chiamate differenze nelle caratteristiche quantitative variazione, e questo segno stesso - opzione. È con le serie di variazioni che la statistica giuridica ha più spesso a che fare.

La serie di variazioni è sempre composta da due colonne (grafico). Si indica il valore di una caratteristica quantitativa in ordine crescente, che, appunto, si chiamano opzioni, che vengono designate X. L'altra colonna (grafico) indica il numero di unità caratteristiche dell'una o dell'altra opzione. Si chiamano frequenze e sono designate da una lettera latina F.

Tabella 2.1

Opzione X

Frequenza F

La frequenza con cui si verifica una particolare caratteristica è molto importante quando si calcolano altri indicatori statistici significativi, vale a dire medie e indicatori di variazione.

Le serie di variazioni, a loro volta, possono esserlo discreto O intervallo. Le serie discrete, come suggerisce il nome, sono costruite sulla base di caratteristiche che variano discretamente e le serie di intervalli - sulla base di variazioni continue. Ad esempio, la distribuzione degli autori di reato per età può essere discreta (18, 19, 20 anni, ecc.) o continua (fino a 18 anni, 18-25 anni, 25-30 anni, ecc.). Inoltre, le serie di intervalli stesse possono essere costruite su base discreta o continua. Nel primo caso i confini degli intervalli adiacenti non si ripetono; nel nostro esempio, gli intervalli saranno così: fino a 18 anni, 18-25, 26-30, 31-35, ecc. Tale serie si chiama continuodiscretoriga. IntervallorigaConcontinuovariazione presuppone che il limite superiore dell'intervallo precedente coincida con il limite inferiore di quello successivo.

Il primo indicatore che descrive le serie di variazioni è media le quantità. Svolgono un ruolo importante nella statistica giuridica, poiché solo con il loro aiuto le popolazioni possono essere caratterizzate da un attributo variabile quantitativo con cui possono essere confrontate. Utilizzando i valori medi possiamo confrontare insiemi di fenomeni giuridicamente rilevanti che ci interessano secondo determinate caratteristiche quantitative e trarre da questi confronti le conclusioni necessarie.

Mediale quantità riflettere più generale tendenza (modello), inerente all'intera massa di fenomeni studiati. Si manifesta nel tipico caratteristiche quantitative, ad es. nel valore medio di tutti gli indicatori (variabili) disponibili.

La statistica ha sviluppato molti tipi di medie: media aritmetica, media geometrica, media cubica, media armonica, ecc. Tuttavia, non sono praticamente utilizzati nelle statistiche legali, quindi considereremo solo due tipi di medie: la media aritmetica e la media geometrica.

La media più comune e conosciuta è mediaaritmetica. Per calcolarlo, la somma degli indicatori viene calcolata e divisa per il numero totale di indicatori. Ad esempio, una famiglia di 4 persone è composta da genitori di 38 e 40 anni e due figli di 7 e 10 anni. Sommiamo l'età: 38+40+7+10 e dividiamo la somma risultante di 95 per 4. L'età media della famiglia risultante è di 23,75 anni. Oppure calcoliamo il carico di lavoro medio mensile degli investigatori se un dipartimento di 8 persone risolve 25 casi in un mese. Dividendo 25 per 8 otteniamo 3.125 casi al mese per investigatore.

Nelle statistiche giuridiche, la media aritmetica viene utilizzata per calcolare il carico di lavoro dei dipendenti (investigatori, pubblici ministeri, giudici, ecc.), per calcolare l'aumento assoluto della criminalità, per calcolare il campione, ecc.

Tuttavia, nell’esempio fornito, il carico di lavoro medio mensile per investigatore viene calcolato in modo errato. Il fatto è che la media aritmetica semplice non tiene conto frequenza il tratto studiato. Nel nostro esempio, il carico di lavoro medio mensile dell'investigatore è corretto e informativo quanto la “temperatura media in ospedale” della famosa battuta, che, come sappiamo, è la temperatura ambiente. Per tenere conto della frequenza delle manifestazioni della caratteristica studiata nel calcolo della media aritmetica, viene utilizzata come segue: mediaaritmeticaponderato o media per serie a variazioni discrete. (Serie di variazioni discrete - la sequenza di cambiamenti in una caratteristica secondo indicatori discreti (discontinui)).

Media aritmetica ponderata ( media ponderata) non presenta differenze fondamentali rispetto alla media aritmetica semplice. In esso, la somma dello stesso valore viene sostituita moltiplicando questo valore per la sua frequenza, ad es. in questo caso ogni valore (variante) viene ponderato in base alla frequenza di occorrenza.

Pertanto, quando si calcola il carico di lavoro medio degli investigatori, dobbiamo moltiplicare il numero di casi per il numero di investigatori che hanno indagato esattamente su quel numero di casi. Di solito è conveniente presentare tali calcoli sotto forma di tabelle:

Tabella 2.2

Numero di casi

(opzione X)

Numero di investigatori (frequenza F)

Opzione prodotto

alle frequenze ( XF)

2. Calcoliamo la media ponderata effettiva utilizzando la formula:

Dove X- il numero di procedimenti penali, e F- numero di investigatori.

Pertanto, la media ponderata non è 3.125, ma 4.375. Se ci pensate, dovrebbe essere così: il carico di lavoro di ogni singolo investigatore aumenta perché un investigatore del nostro ipotetico dipartimento si è rivelato un fannullone - o, al contrario, stava indagando su un caso particolarmente importante e complesso . Ma la questione dell'interpretazione dei risultati della ricerca statistica sarà discussa nel prossimo argomento. In alcuni casi, cioè nel caso di frequenze raggruppate con distribuzione discreta, il calcolo della media, a prima vista, non è ovvio. Supponiamo di dover calcolare la media aritmetica della distribuzione delle persone condannate per teppismo per età. La distribuzione è simile a questa:

Tabella 2.3

(opzione X)

Numero di condannati (frequenza F)

Metà dell'intervallo

Opzione prodotto

alle frequenze ( XF)

(21-18) /2+18=19,5

Successivamente, la media viene calcolata secondo la regola generale e ammonta a 23,6 anni per questa serie discreta. Nel caso del cosiddetto serie aperte, cioè in situazioni in cui gli intervalli estremi sono determinati da “minore di X" o più X", la dimensione degli intervalli estremi viene impostata in modo simile agli altri intervalli.

3. Serie dinamiche

I fenomeni sociali studiati dalle statistiche sono in costante sviluppo e cambiamento. Gli indicatori sociali e giuridici possono essere presentati non solo in forma statica, riflettendo un determinato fenomeno, ma anche come un processo che si verifica nel tempo e nello spazio, nonché sotto forma di interazione delle caratteristiche studiate. In altre parole, le serie temporali mostrano lo sviluppo di un tratto, ad es. il suo cambiamento nel tempo, nello spazio o in base alle condizioni ambientali.

Questa serie è una sequenza di valori medi durante periodi di tempo specificati (per ciascun anno solare).

Per uno studio più approfondito dei fenomeni sociali e della loro analisi non è sufficiente un semplice confronto dei livelli di una serie di dinamiche; è necessario calcolare gli indicatori derivati ​​di una serie di dinamiche: crescita assoluta, tasso di crescita, crescita tasso, crescita media e tassi di crescita, il contenuto assoluto dell'1% della crescita.

Il calcolo degli indicatori delle serie dinamiche viene effettuato sulla base del confronto dei loro livelli. In questo caso, ci sono due modi possibili per confrontare i livelli di una serie temporale:

indicatori di base, quando tutti i livelli successivi vengono confrontati con un livello iniziale preso come base;

indicatori a catena, quando ogni livello successivo di una serie di dinamiche viene confrontato con quello precedente.

La crescita assoluta mostra di quante unità il livello del periodo corrente è maggiore o minore del livello del periodo base o precedente per un periodo di tempo specifico.

L'aumento assoluto (P) è calcolato come differenza tra i livelli confrontati.

Aumento assoluto di base:

P b = io - basi . (f.1).

Aumento assoluto della catena:

P ts = io - io -1 (f.2).

Il tasso di crescita (Tr) mostra quante volte (in quale percentuale) il livello del periodo corrente è maggiore o minore del livello del periodo base o precedente:

Tasso di crescita di base:

(f.3)

Tasso di crescita della catena:

(f.4)

Il tasso di crescita (Tpr) mostra di quale percentuale il livello del periodo corrente è maggiore o minore del livello del periodo base o precedente preso come base di confronto, ed è calcolato come rapporto tra la crescita assoluta e il livello assoluto preso come base.

Il tasso di crescita può anche essere calcolato sottraendo il 100% dal tasso di crescita.

Tasso di crescita di base:

o (f.5)

Tasso di crescita della catena:

o (f.6)

Il tasso di crescita medio è calcolato utilizzando la formula della media geometrica dei tassi di crescita della serie dinamica:

(f.7)

dov'è il tasso di crescita medio;

- tassi di crescita per singoli periodi;

N- numero di tassi di crescita.

Problemi simili con esponente radice maggiore di tre vengono solitamente risolti utilizzando i logaritmi. Dall'algebra sappiamo che il logaritmo della radice è uguale al logaritmo del radicando diviso per l'esponente della radice, e che il logaritmo del prodotto di più fattori è uguale alla somma dei logaritmi di questi fattori.

Pertanto, il tasso di crescita medio viene calcolato estraendo la radice N gradi dalle opere dei singoli N- tassi di crescita della catena. Il tasso di crescita medio è la differenza tra il tasso di crescita medio e uno (), o il 100% quando il tasso di crescita è espresso in percentuale:

O

In assenza di livelli intermedi nella serie dinamica, i tassi medi di crescita e incremento sono determinati dalla seguente formula:

(f.8)

dov'è il livello finale della serie dinamica;

- livello iniziale delle serie dinamiche;

N - numero di livelli (date).

È ovvio che gli indicatori dei tassi di crescita medi e degli incrementi, calcolati utilizzando le formule (modulo 7 e modulo 8), hanno gli stessi valori numerici.

Il contenuto assoluto della crescita dell'1% mostra quale valore assoluto contiene l'1% della crescita ed è calcolato come il rapporto tra la crescita assoluta e il tasso di crescita.

Contenuto assoluto dell'1% in più:

base: (modulo 9)

catena: (f.10)

Il calcolo e l'analisi del valore assoluto di ciascun aumento percentuale contribuiscono a una comprensione più profonda della natura dello sviluppo del fenomeno oggetto di studio. I dati del nostro esempio mostrano che, nonostante le fluttuazioni nei tassi di crescita e nei guadagni per i singoli anni, gli indicatori di base del contenuto assoluto dell’1% della crescita rimangono invariati, mentre gli indicatori a catena che caratterizzano i cambiamenti nel valore assoluto dell’1% della crescita in ciascun anno successivo rispetto al precedente, sono in continuo aumento.

Nella costruzione, elaborazione e analisi di serie temporali si presenta spesso la necessità di determinare i livelli medi dei fenomeni studiati in determinati periodi di tempo. La media cronologica di una serie di intervalli viene calcolata a intervalli uguali utilizzando la formula della media aritmetica semplice e a intervalli disuguali utilizzando la media aritmetica ponderata:

dove è il livello medio della serie di intervalli;

- livelli iniziali della serie;

N- numero di livelli.

Per una serie temporale di dinamiche, a condizione che gli intervalli di tempo tra le date siano uguali, il livello medio viene calcolato utilizzando la formula cronologica media:

(f.11)

dov'è il valore cronologico medio;

1 ,., N- livello assoluto della serie;

N - numero di livelli assoluti della serie dinamica.

Il livello cronologico medio della serie momento della dinamica è pari alla somma degli indicatori di tale serie, divisa per il numero degli indicatori meno uno; in questo caso, i livelli iniziale e finale dovrebbero essere presi a metà, poiché il numero di date (momenti) è solitamente maggiore di uno rispetto al numero di periodi.

A seconda del contenuto e della forma di presentazione dei dati di origine (intervallo o serie temporale di dinamiche, intervalli di tempo uguali o meno) per il calcolo di vari indicatori sociali, ad esempio, il numero medio annuo di crimini e delitti (per tipologia), il numero medio dimensione dei saldi del capitale circolante, numero medio di delinquenti, ecc., utilizzare le espressioni analitiche appropriate.

4. Metodi statistici per lo studio delle relazioni

Nelle domande precedenti abbiamo considerato, per così dire, l'analisi delle distribuzioni “unidimensionali” - serie di variazioni. Questo è un tipo di analisi statistica molto importante, ma lungi dall'essere l'unico. L'analisi delle serie di variazioni costituisce la base per tipi di analisi statistica più "avanzati", principalmente per studiandointerrelazioni. Come risultato di tale studio, vengono rivelate le relazioni di causa-effetto tra i fenomeni, che consentono di determinare quali cambiamenti nelle caratteristiche influenzano le variazioni dei fenomeni e dei processi studiati. In questo caso, le caratteristiche che causano cambiamenti negli altri sono chiamate fattoriali (fattori) e le caratteristiche che cambiano sotto la loro influenza sono chiamate efficaci.

Nella scienza statistica, esistono due tipi di connessioni tra varie caratteristiche e le loro informazioni: connessione funzionale (hard-deterministica) e statistica (stocastica).

Per funzionaleconnessioni Esiste una corrispondenza completa tra la variazione della caratteristica del fattore e la variazione del valore risultante. Questa relazione è ugualmente manifesta in tutte le unità di qualsiasi popolazione. L'esempio più semplice: un aumento della temperatura si riflette nel volume di mercurio nel termometro. In questo caso, la temperatura ambiente funge da fattore e il volume del mercurio funge da caratteristica effettiva.

Le relazioni funzionali sono caratteristiche dei fenomeni studiati da scienze come la chimica, la fisica, la meccanica, in cui è possibile condurre esperimenti “puri” in cui viene eliminata l'influenza di fattori estranei. Il fatto è che una connessione funzionale tra due è possibile solo se dipende il secondo valore (caratteristica risultante). soltanto E esclusivamente dal primo. Ciò è osservato estremamente raramente nei fenomeni sociali.

I processi sociali e giuridici, che sono il risultato dell'influenza simultanea di un gran numero di fattori, sono descritti attraverso connessioni statistiche, cioè connessioni stocasticamente (accidentalmente) deterministico, quando valori diversi di una variabile corrispondono a valori diversi di un'altra variabile.

Il caso più importante (e comune) di dipendenza stocastica è correlazionedipendenza. Con una tale dipendenza la causa non determina l'effetto in modo inequivocabile, ma solo con un certo grado di probabilità. Un tipo separato di analisi statistica è dedicato all'identificazione di tali connessioni: l'analisi di correlazione.

Principale compito analisi di correlazione - basata su tecniche strettamente matematiche, stabilire un'espressione quantitativa della relazione che esiste tra le caratteristiche oggetto di studio. Esistono diversi approcci su come viene calcolata esattamente la correlazione e, di conseguenza, diversi tipi di coefficienti di correlazione: coefficiente di contingenza A.A. Chuprov (per misurare la relazione tra caratteristiche qualitative), coefficiente di associazione di K. Pearson, nonché coefficienti di correlazione dei ranghi di Spearman e Kendall. In generale, tali coefficienti mostrano la probabilità con cui compaiono le relazioni studiate. Di conseguenza, quanto più alto è il coefficiente, tanto più pronunciata è la relazione tra le caratteristiche.

Possono esistere sia correlazioni dirette che inverse tra i fattori studiati. Drittocorrelazionedipendenza osservato nei casi in cui alle variazioni dei valori di un fattore corrispondono le stesse variazioni del valore dell'attributo risultante, cioè quando aumenta il valore dell'attributo fattore, aumenta anche il valore dell'attributo risultante, e viceversa . Ad esempio, esiste una correlazione diretta tra fattori criminogeni e criminalità ( con il segno "+"). Se un aumento dei valori di una caratteristica provoca cambiamenti inversi nei valori di un'altra, viene chiamata tale relazione inversione. Ad esempio, maggiore è il controllo sociale nella società, minore è la criminalità (rapporto con il segno “-”).

Sia i collegamenti in avanti che quelli all'indietro possono essere lineari o curvilinei.

Retta ( Le relazioni lineari) compaiono quando, all'aumento dei valori dell'attributo fattore, si verifica un aumento (diretto) o una diminuzione (inversa) del valore dell'attributo conseguenza. Matematicamente, questa relazione è espressa dall’equazione di regressione: A = UN + BX, Dove A - segno-conseguenza; UN E B - corrispondenti coefficienti di accoppiamento; X - fattore di segno.

Curvilineo i collegamenti sono di natura diversa. Un aumento del valore di una caratteristica del fattore ha un impatto non uniforme sul valore della caratteristica risultante. All'inizio questa connessione può essere diretta e poi inversa. Un esempio ben noto è il collegamento tra i crimini e l’età dei delinquenti. Inizialmente, l'attività criminale degli individui aumenta in modo direttamente proporzionale all'aumento dell'età degli autori del reato (fino a circa 30 anni), quindi, con l'aumentare dell'età, l'attività criminale diminuisce. Inoltre, il vertice della curva di distribuzione degli autori di reato per età è spostato dalla media a sinistra (verso un’età più giovane) ed è asimmetrico.

Le connessioni lineari di correlazione possono essere unoOfattoriale, quando viene studiata la connessione tra un segno-fattore e un segno-conseguenza (correlazione a coppie). Potrebbero anche esserlo multifattoriale, quando viene studiata l'influenza di molti fattori-segni interagenti su una conseguenza-segno (correlazione multipla).

Ma qualunque sia il coefficiente di correlazione utilizzato, qualunque sia la correlazione studiata, è impossibile stabilire una connessione tra caratteristiche basata solo su indicatori statistici. L’analisi iniziale degli indicatori è sempre un’analisi qualitativo, nel corso del quale viene studiata e chiarita la natura socio-giuridica del fenomeno. In questo caso vengono utilizzati metodi e approcci scientifici caratteristici del ramo della scienza che studia questo fenomeno (sociologia, diritto, psicologia, ecc.). Quindi l'analisi dei raggruppamenti e delle medie ci consente di avanzare ipotesi, costruire modelli e determinare il tipo di connessione e dipendenza. Solo dopo viene determinata la caratteristica quantitativa della dipendenza, in effetti il ​​coefficiente di correlazione.

Letteratura

1. Avanesov G.A. Fondamenti di previsione criminologica. Esercitazione. M.: Scuola superiore del Ministero degli affari interni dell'URSS, 1970.

2. Avrutin K.E., Gilinsky Ya.I. Analisi criminologica della criminalità nella regione: metodologia, tecnica, tecnica. L., 1991.

3. Adamov E. e altri Economia e statistica delle imprese: libro di testo / ed. SD Ilyenkova. M.: Finanza e Statistica, 2008.

4. Balakina N.N. Statistica: libro di testo. - metodo. complesso. Khabarovsk: IVESEP, filiale a Khabarovsk, 2008.

5. Bluvshtein Yu.D., Volkov G.I. Serie temporali del crimine: libro di testo. Minsk, 1984.

6. Borovikov V.P., Borovikov I.P. STATISTICA - Analisi statistica ed elaborazione dati in ambiente Windows. M.: Casa editrice e d'informazione "Filin", 1997.

7. Borodin S.V. Controllo della criminalità: un modello teorico per un programma completo. M.: Nauka, 1990.

8. Questioni di statistica // Rivista mensile scientifica e informativa del Comitato statistico statale della Federazione Russa, 2002-2009.

9. Gusarov V.M. Statistica: libro di testo. manuale per le università. M.: UNITY-DANA, 2009.

10. Dobrynina N.V., Nimenya I.N. Statistica: libro di testo. - metodo. indennità. San Pietroburgo: SPbGIEU, 2009.

11. Eliseeva I.I., Yuzbashev M.M. Teoria generale della statistica: Libro di testo per le università / A cura di I. I. Eliseeva.4a ed. M.: Finanza e Statistica, 1999.

12. Eliseeva I.I., Yuzbashev M.M. Teoria generale della statistica: libro di testo. - M.: Finanza e Statistica, 1995.

13. Eremina T., Matyatina V., Pluschevskaya Yu.Problemi di sviluppo dei settori dell'economia russa // Questioni di economia. 2009. N. 7.

14. Efimova M.R., Ganchenko O.I., Petrova E.V. Workshop sulla teoria generale della statistica: libro di testo. manuale 2a ed., riveduta. e aggiuntivi M.: Finanza e Statistica, 2009.

15. Efimova M.R., Petrova E.V., Rumyantsev V.N. Teoria generale della statistica: libro di testo. - M.: INFRA-M, 1998.

16. Kirillov L.A. Studio criminologico e prevenzione della criminalità da parte degli organi degli affari interni M., 1992.

17. Kosoplechev N.P., Metodi di ricerca criminologica. M., 1984.

18. Lee D.A. Criminalità in Russia: analisi del sistema. M., 1997.

19. Lee D.A. Contabilità statistica penale: modelli strutturali e funzionali. M.: Agenzia di informazione ed editoria "Russian World", 1998.

20. Makarova N.V., Trofimets V.Ya. Statistiche in Excel: libro di testo. indennità. M.: Finanza e Statistica, 2009.

21. Nesterov L.I. Nuove tendenze nelle statistiche sulla ricchezza nazionale // Questioni di statistica. 2008. N. 11.

22. Petrova E.V. e altri Workshop sulle statistiche dei trasporti: Proc. indennità. M.: Finanza e Statistica, 2008.

23. La criminalità in Russia negli anni Novanta e alcuni aspetti dello Stato di diritto e il contrasto ad esso. M., 1995.

24. Criminalità, statistica, diritto // Ed. prof. A.I. Debito. M.: Associazione Criminologica, 1997.

25. Rostov K.T. La criminalità nelle regioni della Russia (analisi socio-criminologica). San Pietroburgo: Accademia di San Pietroburgo del Ministero degli affari interni della Russia, 1998.

26. Linee guida per i partecipanti al censimento sulla procedura per condurre il censimento della popolazione tutta russa del 2002 e compilare i documenti del censimento. M.: PIK "Offset", 2003.

27. Savyuk L.K. Statistica giuridica: libro di testo. M.: Yurista, 1999.

28. Salin V.N., Shpakovskaya E.P. Statistiche socioeconomiche: libro di testo per le università. M.: Gardanika Avvocato, 2008.

29. Sidenko A.V., Popov G.Yu., Matveeva V.M. Statistica: libro di testo. M.: Imprese e servizi, 2008.

30. Prevenzione della criminalità sociale: consigli, raccomandazioni // Ed. SÌ. Kerimova. M., 1989.

31. Statistica sociale: libro di testo per le università // Ed. I.I. Eliseeva. 3a ed. M.: Finanza e Statistica, 2009.

Pubblicato su Allbest.ru

Documenti simili

    Considerazione dei principali metodi di analisi statistica. Studio del distretto municipale di Kungur. Esecuzione di calcoli basati sugli indicatori dell'annuario. Analisi della demografia e dello sviluppo socio-economico dell'area sulla base dei risultati della domanda.

    lavoro del corso, aggiunto il 24/06/2015

    Il valore medio è una caratteristica libera delle leggi del processo nelle condizioni in cui si verifica. Forme e metodi per il calcolo dei valori medi. Applicazione delle medie nella pratica: calcolo della differenziazione salariale per settori economici.

    lavoro del corso, aggiunto il 04/12/2007

    Metodi statistici per l'analisi dei divorzi. Analisi statistica dei divorzi nella regione dell'Amur. Analisi della dinamica e della struttura dei divorzi. Raggruppamento di città e distretti della regione dell'Amur in base al numero di divorzi all'anno. Calcolo dei valori medi e degli indicatori di variazione.

    lavoro del corso, aggiunto il 04/12/2014

    Aspetti di analisi statistica dell'offerta abitativa. Applicazione di metodi statistici per l'analisi dell'offerta abitativa della popolazione. Analisi dell'omogeneità della popolazione dei distretti in base al rapporto di dipendenza. Analisi di correlazione e regressione.

    lavoro del corso, aggiunto il 18/01/2009

    Organizzazione delle statistiche statali in Russia. Requisiti per i dati raccolti. Forme, tipi e metodi di osservazione statistica. Preparazione dell'osservazione statistica. Errori nell'osservazione statistica. Metodi per il monitoraggio delle statistiche.

    abstract, aggiunto il 02/12/2007

    Sviluppo di un programma per il monitoraggio delle statistiche del diritto penale, delle sue fasi principali e dei requisiti, dei metodi e della procedura di attuazione. Determinazione dello stato di criminalità nell'area di studio. Regole per la registrazione dei risultati dell'osservazione statistica.

    test, aggiunto il 18/05/2010

    Classificazione della documentazione statistica. Tipologie di documenti: scritti, iconografici, statistici e fonetici. Metodi e metodi per l'analisi dei materiali: non formalizzati (tradizionali) e formalizzati. La procedura per eseguire l'analisi del contenuto.

    presentazione, aggiunta il 16/02/2014

    Il concetto di valore medio. Il metodo delle medie nello studio dei fenomeni sociali. L'importanza dell'utilizzo del metodo delle medie nello studio dei fenomeni sociali è assicurata dalla possibilità di passare dall'individuale al generale, dall'aleatorio al naturale.

    lavoro del corso, aggiunto il 13/01/2009

    Il concetto di osservazione statistica. Analisi delle correlazioni lineari e curvilinee. Familiarità con le formule e le quantità dell'osservazione statistica. Analisi dei calcoli della relazione degli indici, costruzione di un istogramma, elementi delle serie di distribuzione.

    test, aggiunto il 27/03/2012

    Caratteristiche dei principali indicatori dell'analisi statistica della condizionalità sociale della sanità pubblica nella Federazione Russa. Livelli di valutazione sanitaria dal punto di vista della medicina sociale. Classificazione della popolazione infantile per gruppi sanitari.


Non perderlo. Iscriviti e ricevi un collegamento all'articolo nella tua email.

Le attività delle persone in molti casi implicano il lavoro con i dati e questo, a sua volta, può implicare non solo operare con essi, ma anche studiarli, elaborarli e analizzarli. Ad esempio, quando è necessario condensare informazioni, trovare alcune relazioni o definire strutture. E proprio per l'analisi in questo caso è molto conveniente utilizzare non solo, ma anche applicare metodi statistici.

Una caratteristica dei metodi di analisi statistica è la loro complessità, dovuta alla varietà di forme di modelli statistici, nonché alla complessità del processo di ricerca statistica. Vogliamo però parlare di metodi che tutti possono utilizzare, e di farlo in modo efficace e con piacere.

La ricerca statistica può essere effettuata utilizzando i seguenti metodi:

  • Osservazione statistica;
  • Riepilogo e raggruppamento dei materiali di osservazione statistica;
  • Valori statistici assoluti e relativi;
  • Serie di variazioni;
  • Campione;
  • Analisi di correlazione e regressione;
  • Serie dinamica.

Osservazione statistica

L'osservazione statistica è una raccolta di informazioni pianificata, organizzata e, nella maggior parte dei casi, sistematica, mirata principalmente a fenomeni della vita sociale. Questo metodo viene attuato attraverso la registrazione di predeterminate caratteristiche più evidenti, il cui scopo è quello di ottenere successivamente le caratteristiche dei fenomeni oggetto di studio.

L’osservazione statistica deve essere effettuata tenendo conto di alcuni importanti requisiti:

  • Deve coprire integralmente i fenomeni oggetto di studio;
  • I dati ottenuti devono essere accurati e affidabili;
  • I dati ottenuti dovrebbero essere uniformi e facilmente confrontabili.

Inoltre, l’osservazione statistica può assumere due forme:

  • Il reporting è una forma di osservazione statistica in cui le informazioni vengono fornite a specifiche divisioni statistiche di organizzazioni, istituzioni o imprese. In questo caso i dati vengono inseriti in appositi report.
  • L'osservazione appositamente organizzata è un'osservazione organizzata per uno scopo specifico, al fine di ottenere informazioni che non sono disponibili nei rapporti o per chiarire e stabilire l'affidabilità delle informazioni contenute nei rapporti. In questo modulo rientrano le indagini (ad esempio sondaggi d'opinione), i censimenti, ecc.

Inoltre, le osservazioni statistiche possono essere classificate in base a due caratteristiche: o in base alla natura della registrazione dei dati oppure in base alla copertura delle unità di osservazione. La prima categoria comprende indagini, documentazione e osservazione diretta, mentre la seconda categoria comprende l'osservazione continua e incompleta, vale a dire selettivo.

Per ottenere dati utilizzando l'osservazione statistica, è possibile utilizzare metodi come questionari, attività corrispondenti, autocalcolo (quando l'osservato, ad esempio, compila da solo i documenti pertinenti), spedizioni e reporting.

Riepilogo e raggruppamento dei materiali di osservazione statistica

Parlando del secondo metodo, dovremmo prima parlare del riassunto. Una sintesi è il processo di elaborazione di alcuni fatti individuali che formano l'insieme complessivo dei dati raccolti durante l'osservazione. Se il riepilogo viene eseguito correttamente, un'enorme quantità di dati individuali sui singoli oggetti di osservazione può trasformarsi in un intero complesso di tabelle e risultati statistici. Inoltre, tale ricerca aiuta a determinare le caratteristiche generali e i modelli dei fenomeni studiati.

Tenendo conto degli indicatori di accuratezza e profondità di studio, si può distinguere un riassunto semplice da uno complesso, ma ognuno di essi dovrebbe basarsi su fasi specifiche:

  • Viene selezionata una caratteristica di raggruppamento;
  • Viene determinato l'ordine di formazione del gruppo;
  • È in fase di sviluppo un sistema di indicatori per caratterizzare il gruppo e l'oggetto o fenomeno nel suo insieme;
  • Sono in fase di elaborazione le tavole in cui verranno presentati i risultati di sintesi.

È importante notare che esistono diverse forme di sintesi:

  • Riepilogo centralizzato, che prevede il trasferimento della materia prima ricevuta ad un centro superiore per le successive lavorazioni;
  • Riepilogo decentralizzato, dove lo studio dei dati avviene in più fasi in modo ascendente.

Il riepilogo può essere eseguito utilizzando apparecchiature specializzate, ad esempio utilizzando software per computer o manualmente.

Per quanto riguarda il raggruppamento, questo processo si distingue dividendo i dati oggetto di studio in gruppi in base alle caratteristiche. Le caratteristiche dei compiti posti dall'analisi statistica influenzano il tipo di raggruppamento che sarà: tipologico, strutturale o analitico. Ecco perché, per riassumere e raggruppare, ricorrono ai servizi di specialisti altamente specializzati o utilizzano.

Grandezze statistiche assolute e relative

I valori assoluti sono considerati la primissima forma di presentazione dei dati statistici. Con il suo aiuto è possibile attribuire caratteristiche dimensionali ai fenomeni, ad esempio in tempo, lunghezza, volume, area, massa, ecc.

Se vuoi conoscere i singoli valori statistici assoluti, puoi ricorrere alla misurazione, alla stima, al conteggio o alla pesatura. E se hai bisogno di ottenere indicatori di volume totale, dovresti utilizzare il riepilogo e il raggruppamento. Bisogna tenere presente che i valori statistici assoluti differiscono in presenza di unità di misura. Tali unità includono costo, manodopera e naturale.

E le quantità relative esprimono rapporti quantitativi relativi ai fenomeni della vita sociale. Per ottenerli si dividono sempre alcune quantità per altre. L'indicatore con cui viene confrontato (questo è il denominatore) è chiamato base di confronto, e l'indicatore con cui viene confrontato (questo è il numeratore) è chiamato valore di segnalazione.

I valori relativi possono essere diversi, a seconda del loro contenuto. Ad esempio, ci sono valori di confronto, valori del livello di sviluppo, valori dell'intensità di un particolare processo, valori di coordinazione, struttura, dinamica, ecc. e così via.

Per studiare una popolazione basata su caratteristiche differenzianti, l'analisi statistica utilizza valori medi, che sintetizzano le caratteristiche qualitative di un insieme di fenomeni omogenei basati su alcune caratteristiche differenzianti.

Una proprietà estremamente importante dei valori medi è che parlano dei valori di caratteristiche specifiche nel loro intero complesso come un unico numero. Nonostante il fatto che le singole unità possano presentare differenze quantitative, i valori medi esprimono valori generali caratteristici di tutte le unità del complesso in esame. Si scopre che utilizzando le caratteristiche di una cosa, è possibile ottenere le caratteristiche dell'insieme.

Va tenuto presente che una delle condizioni più importanti per l'utilizzo dei valori medi, se viene effettuata un'analisi statistica dei fenomeni sociali, è considerata l'omogeneità del loro complesso, per la quale è necessario scoprire il valore medio. E la formula per determinarlo dipenderà esattamente da come verranno presentati i dati iniziali per il calcolo del valore medio.

Serie di variazioni

In alcuni casi, i dati sugli indicatori medi di alcune grandezze studiate potrebbero non essere sufficienti per elaborare, valutare e analizzare in modo approfondito un fenomeno o un processo. Poi, si dovrebbe tener conto della variazione o dispersione degli indicatori delle singole unità, che rappresenta anche una caratteristica importante della popolazione oggetto di studio.

I valori individuali delle quantità possono essere influenzati da molti fattori e gli stessi fenomeni o processi studiati possono essere molto diversi, ad es. avere variazione (questa varietà è una serie di variazioni), le cui ragioni dovrebbero essere ricercate nell'essenza di ciò che si sta studiando.

I suddetti valori assoluti dipendono direttamente dalle unità di misura delle caratteristiche, e pertanto rendono più complesso il processo di studio, valutazione e confronto di due o più serie di variazioni. E gli indicatori relativi devono essere calcolati come il rapporto tra indicatori assoluti e medi.

Campione

Il significato del metodo di campionamento (o più semplicemente campionamento) è che le proprietà di una parte vengono utilizzate per determinare le caratteristiche numeriche dell'intero (questa è chiamata popolazione generale). Il principale metodo di campionamento è la connessione interna che unisce le parti e il tutto, l'individuale e il generale.

Il metodo di campionamento presenta una serie di vantaggi significativi rispetto ad altri, perché Grazie alla riduzione del numero di osservazioni, consente di ridurre la quantità di lavoro, denaro e impegno spesi, nonché di ottenere con successo dati su processi e fenomeni in cui è poco pratico o semplicemente impossibile studiarli completamente.

La corrispondenza delle caratteristiche del campione con le caratteristiche del fenomeno o del processo studiato dipenderà da un insieme di condizioni e principalmente da come verrà implementato nella pratica il metodo di campionamento. Questa può essere una selezione sistematica, seguendo uno schema preparato, o non pianificata, quando il campione è costituito dalla popolazione generale.

Ma in tutti i casi, il metodo di campionamento deve essere tipico e soddisfare criteri di obiettività. Questi requisiti devono essere sempre soddisfatti, perché da essi dipenderà la corrispondenza tra le caratteristiche del metodo e le caratteristiche di quanto si sta analizzando statisticamente.

Pertanto, prima di elaborare il materiale campione, è necessario controllarlo attentamente, eliminando così tutto ciò che non è necessario e non importante. Allo stesso tempo, quando si compila un campione, è imperativo evitare qualsiasi attività amatoriale. Ciò significa che in nessun caso dovresti selezionare solo quelle opzioni che sembrano tipiche e scartare tutte le altre.

Un campione efficace e di alta qualità deve essere selezionato in modo obiettivo, vale a dire deve essere effettuato in modo tale da escludere influenze soggettive e motivazioni parziali. E affinché questa condizione sia adeguatamente soddisfatta, è necessario ricorrere al principio della randomizzazione o, più semplicemente, al principio della selezione casuale delle opzioni dall'intera popolazione.

Il principio presentato serve come base per la teoria del metodo di campionamento e deve essere seguito ogni volta che è necessario creare una popolazione campione efficace, e i casi di selezione sistematica non fanno eccezione qui.

Analisi di correlazione e regressione

L'analisi di correlazione e l'analisi di regressione sono due metodi molto efficaci che consentono di analizzare grandi quantità di dati per studiare la possibile relazione tra due o più indicatori.

Nel caso dell’analisi di correlazione, gli obiettivi sono:

  • Misurare la vicinanza della connessione esistente tra caratteristiche differenzianti;
  • Identificare relazioni causali sconosciute;
  • Valutare i fattori che maggiormente influenzano la caratteristica finale.

E nel caso dell'analisi di regressione, i compiti sono i seguenti:

  • Determinare la forma di comunicazione;
  • Stabilire il grado di influenza degli indicatori indipendenti su quello dipendente;
  • Determinare i valori calcolati dell'indicatore dipendente.

Per risolvere tutti i problemi di cui sopra, è quasi sempre necessario utilizzare in combinazione sia l'analisi di correlazione che quella di regressione.

Serie dinamica

Utilizzando questo metodo di analisi statistica, è molto conveniente determinare l'intensità o la velocità con cui si sviluppano i fenomeni, trovare la tendenza del loro sviluppo, evidenziare le fluttuazioni, confrontare le dinamiche di sviluppo e trovare la relazione tra i fenomeni che si sviluppano nel tempo.

Una serie dinamica è una serie in cui gli indicatori statistici sono sequenzialmente posizionati nel tempo, i cui cambiamenti caratterizzano il processo di sviluppo dell'oggetto o del fenomeno oggetto di studio.

La serie dinamica comprende due componenti:

  • Il periodo o il momento associato ai dati disponibili;
  • Indicatore di livello o statistico.

Presi insieme, questi componenti rappresentano due termini di una serie temporale, dove il primo termine (periodo di tempo) è indicato con la lettera “t” e il secondo (livello) con la lettera “y”.

In base alla durata degli intervalli temporali con cui i livelli sono interconnessi, le serie dinamiche possono essere momentanee e intervallate. Le serie di intervalli consentono di aggiungere livelli per ottenere il valore totale dei periodi successivi, ma nelle serie di momenti non esiste tale possibilità, ma ciò non è richiesto.

Esistono anche serie temporali a intervalli uguali e diversi. L'essenza degli intervalli nelle serie di momenti e di intervalli è sempre diversa. Nel primo caso, l'intervallo è l'intervallo di tempo tra le date a cui sono collegati i dati per l'analisi (è conveniente utilizzare tale serie, ad esempio, per determinare il numero di azioni per mese, anno, ecc.). E nel secondo caso, un periodo di tempo a cui è allegata una serie di dati generalizzati (tale serie può essere utilizzata per determinare la qualità delle stesse azioni per un mese, un anno, ecc.). Gli intervalli possono essere uguali o diversi, indipendentemente dal tipo di riga.

Naturalmente, per imparare ad applicare con competenza ciascuno dei metodi di analisi statistica, non è sufficiente conoscerli, perché, in effetti, la statistica è un'intera scienza che richiede anche determinate competenze e abilità. Ma per renderlo più semplice, puoi e dovresti allenare il tuo pensiero e...

Altrimenti, la ricerca, la valutazione, l'elaborazione e l'analisi delle informazioni sono processi molto interessanti. E anche nei casi in cui non si ottiene alcun risultato concreto, durante la ricerca si possono apprendere molte cose interessanti. L'analisi statistica ha trovato la sua applicazione in un numero enorme di aree dell'attività umana e può essere utilizzata a scuola, al lavoro, negli affari e in altre aree, compreso lo sviluppo del bambino e l'autoeducazione.

Nozioni di base sull'analisi statistica dei dati

statistiche"biostatistica".

1. nominale;
2. ordinale;
3. intervallo;

campioni

rappresentante

quadro selettivo campionamento casuale semplice campionamento ad intervallo

campione stratificato

grappolo E campionamento per quote

ipotesi nulla

ipotesi alternativa energia

probabilità di confidenza”.


Titolo: Fondamenti di analisi statistica dei dati
Descrizione dettagliata:

Dopo il completamento di qualsiasi ricerca scientifica, fondamentale o sperimentale, viene eseguita un'analisi statistica dei dati ottenuti. Affinché l'analisi statistica possa essere eseguita con successo e risolvere i problemi assegnati, lo studio deve essere adeguatamente pianificato. Di conseguenza, senza comprendere le basi della statistica, è impossibile pianificare ed elaborare i risultati di un esperimento scientifico. Tuttavia, l'educazione medica non fornisce non solo la conoscenza della statistica, ma anche le basi della matematica superiore. Pertanto, molto spesso si può imbattersi nell'opinione che solo uno statistico dovrebbe occuparsi di questioni di elaborazione statistica nella ricerca biomedica e un medico-ricercatore dovrebbe concentrarsi sulle questioni mediche del suo lavoro scientifico. Questa divisione del lavoro, che comporta l'assistenza nell'analisi dei dati, è completamente giustificata. Tuttavia, è necessaria la comprensione dei principi della statistica, almeno per evitare un'errata formulazione del problema davanti a uno specialista, la comunicazione con il quale prima dell'inizio dello studio è altrettanto importante quanto nella fase di elaborazione dei dati.

Prima di parlare dei fondamenti dell’analisi statistica è necessario chiarire il significato del termine “ statistiche". Esistono molte definizioni, ma la più completa e concisa è, a nostro avviso, la definizione di statistica come “la scienza della raccolta, presentazione e analisi dei dati”. A sua volta, l’uso della statistica applicata al mondo vivente è chiamato “biometria” o “ biostatistica".

Va notato che molto spesso le statistiche si riducono solo all'elaborazione dei dati sperimentali, senza prestare attenzione alla fase della loro acquisizione. Tuttavia, la conoscenza statistica è necessaria già durante la pianificazione dell'esperimento, affinché gli indicatori ottenuti durante lo stesso possano fornire al ricercatore informazioni attendibili. Pertanto, possiamo dire che l'analisi statistica dei risultati sperimentali inizia ancor prima dell'inizio dello studio.

Già nella fase di sviluppo del piano, il ricercatore deve comprendere chiaramente quale tipo di variabili saranno presenti nel suo lavoro. Tutte le variabili possono essere divise in due classi: qualitative e quantitative. L'intervallo che una variabile può assumere dipende dalla scala di misurazione. Si possono distinguere quattro scale principali:

1. nominale;
2. ordinale;
3. intervallo;
4. razionale (scala delle relazioni).

La scala nominale (scala dei "nomi") contiene solo designazioni convenzionali per descrivere determinate classi di oggetti, ad esempio "genere" o "professione del paziente". Una scala nominale implica che la variabile assumerà valori le cui relazioni quantitative non possono essere determinate. Pertanto, è impossibile stabilire relazioni matematiche tra i sessi maschile e femminile. Le designazioni numeriche convenzionali (donne - 0, uomini - 1 o viceversa) sono fornite in modo assolutamente arbitrario e sono destinate esclusivamente all'elaborazione informatica. La scala nominale è qualitativa nella sua forma pura; le singole categorie in questa scala sono espresse da frequenze (numero o proporzione di osservazioni, percentuali).

La scala ordinale (ordinale) prevede che le singole categorie in essa contenute possano essere disposte in ordine ascendente o discendente. Nelle statistiche mediche, un classico esempio di scala ordinale è la gradazione dei gradi di gravità della malattia. In questo caso possiamo disporre la gravità in ordine crescente, ma non abbiamo ancora la possibilità di specificare relazioni quantitative, cioè la distanza tra i valori misurati sulla scala ordinale è sconosciuta o non ha importanza. È facile stabilire l’ordine dei valori della variabile “gravità”, ma è impossibile determinare quante volte una condizione grave differisce da una condizione moderata.

La scala ordinale si riferisce a tipi di dati semiquantitativi e le sue gradazioni possono essere descritte sia da frequenze (come in una scala qualitativa) sia da misure di valori centrali, di cui parleremo di seguito.

Le scale intervallari e razionali sono tipi di dati puramente quantitativi. In una scala a intervalli possiamo già determinare quanto un valore di una variabile differisce da un altro. Pertanto, un aumento della temperatura corporea di 1 grado Celsius significa sempre un aumento del calore generato da un numero fisso di unità. Tuttavia, la scala degli intervalli ha valori sia positivi che negativi (non esiste lo zero assoluto). A questo proposito è impossibile dire che 20 gradi Celsius siano due volte più caldi di 10. Possiamo solo affermare che 20 gradi sono più caldi di 10 quanto 30 sono più caldi di 20.

La scala razionale (scala delle relazioni) ha un punto di riferimento e solo valori positivi. In medicina, le scale più razionali sono le concentrazioni. Ad esempio, un livello di glucosio di 10 mmol/L è il doppio della concentrazione rispetto a 5 mmol/L. Per la temperatura, la scala razionale è la scala Kelvin, dove c'è lo zero assoluto (nessun calore).

Va aggiunto che qualsiasi variabile quantitativa può essere continua, come nel caso della misurazione della temperatura corporea (si tratta di una scala ad intervallo continuo), oppure discreta, se contiamo il numero delle cellule del sangue o della prole di animali da laboratorio (si tratta di una scala ad intervallo continuo) scala razionale discreta).

Queste differenze sono cruciali per la scelta dei metodi per l'analisi statistica dei risultati sperimentali. Pertanto, per i dati nominali applichiamo il test del chi quadrato, e il noto test di Student richiede che la variabile (intervallo o razionale) sia continua.

Dopo aver deciso la domanda sul tipo di variabile, dovresti iniziare a creare campioni. Un campione è un piccolo gruppo di oggetti di una certa classe (in medicina - una popolazione). Per ottenere dati assolutamente accurati, è necessario studiare tutti gli oggetti di una determinata classe, tuttavia, per ragioni pratiche (spesso finanziarie), viene studiata solo una parte della popolazione, chiamata campione. Successivamente, l'analisi statistica consente al ricercatore di estendere i modelli ottenuti all'intera popolazione con un certo grado di accuratezza. Tutte le statistiche biomediche, infatti, mirano a ottenere risultati quanto più accurati dal minor numero possibile di osservazioni, perché le considerazioni etiche sono importanti anche quando si effettuano ricerche sugli esseri umani. Non possiamo permetterci di mettere a rischio più pazienti del necessario.

La creazione di un campione è regolata da una serie di requisiti obbligatori, la cui violazione può portare a conclusioni errate dai risultati della ricerca. Innanzitutto, la dimensione del campione è importante. L'accuratezza della stima dei parametri studiati dipende dalla dimensione del campione. Qui dovresti prestare attenzione alla parola "precisione". Maggiore è la dimensione dei gruppi studiati, più accurati (ma non necessariamente corretti) i risultati ottenuti dallo scienziato. Affinché i risultati degli studi campione siano trasferibili all'intera popolazione nel suo insieme, il campione deve esserlo rappresentante. La rappresentatività del campione presuppone che esso rifletta tutte le proprietà essenziali della popolazione. In altre parole, nei gruppi studiati si trovano persone di diverso genere, età, professione, status sociale, ecc. con la stessa frequenza che nell'intera popolazione.

Tuttavia, prima di iniziare a selezionare un gruppo di studio, dovresti determinare la necessità di studiare una popolazione specifica. Un esempio di popolazione potrebbe essere tutti i pazienti con una certa nosologia o persone in età lavorativa, ecc. Pertanto, è improbabile che i risultati ottenuti per una popolazione di giovani in età militare possano essere estrapolati alle donne in postmenopausa. L’insieme delle caratteristiche che avrà la popolazione in studio determina la “generalizzabilità” dei dati dello studio.

I campioni possono essere formati in vari modi. Il più semplice è selezionare, utilizzando un generatore di numeri casuali, il numero richiesto di oggetti dalla popolazione o quadro selettivo(quadro di campionamento). Questo metodo si chiama " campionamento casuale semplice" Se selezioni casualmente un punto iniziale nel quadro di campionamento e poi prendi ogni secondo, quinto o decimo oggetto (a seconda delle dimensioni del gruppo richieste nello studio), otterrai campionamento ad intervallo. Il campionamento ad intervalli non è casuale, poiché non si esclude mai la possibilità di ripetizioni periodiche dei dati all'interno del quadro di campionamento.

È possibile creare i cosiddetti “ campione stratificato”, che presuppone che la popolazione sia composta da diversi gruppi diversi e che questa struttura debba essere riprodotta nel gruppo sperimentale. Ad esempio, se il rapporto tra uomini e donne in una popolazione è 30:70, in un campione stratificato il rapporto dovrebbe essere lo stesso. Con questo approccio è fondamentale non sbilanciare il campione, cioè evitare l'omogeneità delle sue caratteristiche, altrimenti il ​​ricercatore potrebbe perdere l'occasione di trovare differenze o relazioni nei dati.

Oltre ai metodi descritti per formare gruppi, esistono anche grappolo E campionamento per quote. Il primo viene utilizzato nel caso in cui sia difficile ottenere informazioni complete sul fotogramma campione a causa delle sue dimensioni. Quindi il campione è formato da diversi gruppi compresi nella popolazione. Il secondo - la quota - è simile al campionamento stratificato, ma qui la distribuzione degli oggetti non corrisponde a quella della popolazione.

Tornando alla numerosità del campione, va detto che essa è strettamente correlata alla probabilità di errori statistici della prima e della seconda tipologia. Gli errori statistici possono essere dovuti al fatto che lo studio non studia l'intera popolazione, ma una parte di essa. Un errore del primo tipo è una deviazione errata ipotesi nulla. A sua volta, l’ipotesi nulla è l’ipotesi che tutti i gruppi studiati provengano dalla stessa popolazione generale, il che significa che le differenze o le relazioni tra loro sono casuali. Se tracciamo un'analogia con i test diagnostici, un errore di tipo I è un risultato falso positivo.

Un errore del secondo tipo è una deviazione errata. ipotesi alternativa, il cui significato è che le differenze o le connessioni tra i gruppi non sono dovute a coincidenze casuali, ma all'influenza dei fattori studiati. E ancora, un'analogia con la diagnostica: un errore di tipo II è un risultato falso negativo. Associato a questo errore è il concetto energia, che ci dice quanto sia efficace un determinato metodo statistico in determinate condizioni e la sua sensibilità. La potenza si calcola utilizzando la formula: 1-β, dove β è la probabilità di un errore di tipo II. Questo indicatore dipende principalmente dalla dimensione del campione. Maggiore è la dimensione del gruppo, minore è la probabilità di un errore di tipo II e maggiore è la potenza dei test statistici. Questa dipendenza è almeno quadratica, ovvero ridurre della metà la dimensione del campione porterà a un calo di potenza di almeno quattro volte. La potenza minima accettabile è considerata pari all'80% e il livello massimo accettabile di errore di tipo I è considerato pari al 5%. Tuttavia, va sempre ricordato che questi limiti sono fissati arbitrariamente e possono cambiare a seconda della natura e degli obiettivi dello studio. Di norma, la comunità scientifica riconosce un cambiamento arbitrario di potere, ma nella stragrande maggioranza dei casi il livello di errore di tipo I non può superare il 5%.

Tutto quanto sopra è direttamente correlato alla fase di pianificazione dello studio. Tuttavia, molti ricercatori vedono erroneamente l'elaborazione dei dati statistici solo come una sorta di manipolazione eseguita dopo il completamento della parte principale del lavoro. Spesso, dopo aver completato un esperimento non pianificato, appare un desiderio irresistibile di ordinare un'analisi dei dati statistici a parte. Ma dal “mucchio di spazzatura”, anche uno statistico farà molta fatica a estrarre il risultato atteso dal ricercatore. Pertanto, se non hai una conoscenza sufficiente della biostatistica, dovresti cercare aiuto nell'analisi statistica prima di iniziare l'esperimento.

Passando alla procedura di analisi stessa, dobbiamo evidenziare due tipi principali di tecniche statistiche: descrittive e dimostrative (analitiche). Le tecniche descrittive includono metodi che consentono di presentare i dati in una forma compatta e di facile comprensione. Questi includono tabelle, grafici, frequenze (assolute e relative), misure di tendenza centrale (media, mediana, moda) e misure di dispersione dei dati (varianza, deviazione standard, intervallo interquartile, ecc.). In altre parole, i metodi descrittivi caratterizzano i campioni studiati.

Il modo più popolare (sebbene spesso errato) di descrivere i dati quantitativi disponibili è definire i seguenti indicatori:

  • il numero di osservazioni nel campione o la sua dimensione;
  • valore medio (media aritmetica);
  • la deviazione standard è una misura di quanto variano i valori di una variabile.

È importante ricordare che la media aritmetica e la deviazione standard sono misure della tendenza centrale e della dispersione in un numero abbastanza piccolo di campioni. In tali campioni, i valori della maggior parte degli oggetti si discostano dalla media con uguale probabilità e la loro distribuzione forma una “campana” simmetrica (curva gaussiana o di Gauss-Laplace). Questa distribuzione è anche chiamata “normale”, ma nella pratica degli esperimenti medici si verifica solo nel 30% dei casi. Se i valori di una variabile sono distribuiti asimmetricamente rispetto al centro, allora è meglio descrivere i gruppi utilizzando la mediana e i quantili (percentili, quartili, decili).

Completata la descrizione dei gruppi, è necessario rispondere alla domanda sulle loro relazioni e sulla possibilità di generalizzare i risultati dello studio all'intera popolazione. A questo scopo vengono utilizzati metodi biostatistici basati sull’evidenza. Questi sono quelli che i ricercatori ricordano per primi quando si tratta di elaborazione di dati statistici. Questa fase del lavoro è solitamente chiamata “verifica di ipotesi statistiche”.

Le attività di verifica delle ipotesi possono essere divise in due grandi gruppi. Il primo gruppo risponde alla domanda se ci sono differenze tra i gruppi nel livello di qualche indicatore, ad esempio differenze nel livello delle transaminasi epatiche nei pazienti con epatite e nelle persone sane. Il secondo gruppo consente di dimostrare l'esistenza di una relazione tra due o più indicatori, ad esempio la funzionalità epatica e il sistema immunitario.

In termini pratici, i compiti del primo gruppo possono essere suddivisi in due sottotipi:

  • confronto dell'indicatore solo in due gruppi (sani e malati, uomini e donne);
  • confronto di tre o più gruppi (studio di diverse dosi del farmaco).

Va tenuto presente che i metodi statistici differiscono significativamente per i dati qualitativi e quantitativi.

In una situazione in cui la variabile studiata è qualitativa e vengono confrontati solo due gruppi, è possibile utilizzare il test del chi quadrato. Questo è un criterio abbastanza potente e ampiamente conosciuto, tuttavia non è abbastanza efficace se il numero di osservazioni è piccolo. Esistono diversi metodi per risolvere questo problema, come la correzione di continuità di Yates e il metodo esatto di Fisher.

Se la variabile studiata è quantitativa, è possibile utilizzare uno dei due tipi di test statistici. I criteri del primo tipo si basano su un tipo specifico di distribuzione della popolazione e operano con i parametri di questa popolazione. Tali test sono detti “parametrici” e di solito si basano sul presupposto di una distribuzione normale di valori. I test non parametrici non si basano su un'ipotesi sul tipo di distribuzione della popolazione e non utilizzano i suoi parametri. A volte tali criteri sono chiamati “test senza distribuzione”. In una certa misura, questo è errato, poiché qualsiasi criterio non parametrico presuppone che le distribuzioni in tutti i gruppi confrontati siano le stesse, altrimenti si potrebbero ottenere risultati falsi positivi.

Esistono due test parametrici applicati ai dati estratti da una popolazione distribuita normalmente: il test t di Student per confrontare due gruppi e il test F di Fisher per verificare l'uguaglianza delle varianze (noto anche come analisi della varianza). Esistono molti più criteri non parametrici. Diversi test differiscono tra loro per le ipotesi su cui si basano, per la complessità dei calcoli, per la potenza statistica, ecc. Tuttavia, i più accettabili nella maggior parte dei casi sono il test di Wilcoxon (per gruppi correlati) e il test di Mann-Whitney , noto anche come test Wilcoxon per campioni indipendenti. Questi test sono convenienti perché non richiedono ipotesi sulla natura della distribuzione dei dati. Ma se si scopre che i campioni sono presi da una popolazione distribuita normalmente, il loro potere statistico non differirà in modo significativo da quello del test di Student.

Una descrizione completa dei metodi statistici può essere trovata nella letteratura specializzata, tuttavia, il punto chiave è che ogni test statistico richiede una serie di regole (ipotesi) e condizioni per il suo utilizzo, e una ricerca meccanica di diversi metodi per trovare il "giusto" Il risultato è assolutamente inaccettabile dal punto di vista scientifico. In questo senso, i test statistici sono simili ai farmaci: ognuno ha indicazioni e controindicazioni, effetti collaterali e probabilità di inefficacia. E altrettanto pericoloso è l’uso incontrollato di test statistici, perché su di essi si basano ipotesi e conclusioni.

Per comprendere più a fondo la questione dell’accuratezza dell’analisi statistica, è necessario definire e analizzare il concetto “ probabilità di confidenza”. La probabilità di confidenza è un valore preso come confine tra eventi probabili e improbabili. Tradizionalmente viene indicato con la lettera “p”. Per molti ricercatori, l’unico scopo dell’esecuzione di analisi statistiche è calcolare l’ambito valore p, che sembra mettere virgole nella famosa frase “l’esecuzione non può essere perdonata”. Il livello di confidenza massimo accettabile è considerato pari a 0,05. Va ricordato che la probabilità di fiducia non è la probabilità di qualche evento, ma una questione di fiducia. Impostando una probabilità di confidenza prima di iniziare l'analisi, determiniamo in tal modo il grado di confidenza nei risultati della nostra ricerca. E, come sai, l'eccessiva creduloneria e l'eccessivo sospetto influiscono ugualmente negativamente sui risultati di qualsiasi lavoro.

Il livello di confidenza mostra quale è la probabilità massima che si verifichi un errore di tipo I considerata accettabile dal ricercatore. Ridurre il livello di fiducia, in altre parole, restringendo le condizioni per verificare le ipotesi, aumenta la probabilità di errori del secondo tipo. Di conseguenza, la scelta del livello di probabilità di confidenza dovrebbe essere effettuata tenendo conto del possibile danno derivante dal verificarsi di errori del primo e del secondo tipo. Ad esempio, il rigido quadro adottato nelle statistiche biomediche, che definisce la percentuale di risultati falsi positivi non superiore al 5%, è una grave necessità, perché sulla base dei risultati della ricerca medica, viene introdotto o rifiutato un nuovo trattamento, e questo è una questione di vita per molte migliaia di persone.

Bisogna tenere presente che il valore p in sé non è molto informativo per il medico, poiché indica solo la probabilità di rifiutare erroneamente l'ipotesi nulla. Questo indicatore non dice nulla, ad esempio, sull'entità dell'effetto terapeutico quando si utilizza il farmaco in studio nella popolazione generale. Pertanto, si ritiene che invece del livello di probabilità di confidenza, sarebbe meglio valutare i risultati dello studio in base alla dimensione dell'intervallo di confidenza. Un intervallo di confidenza è un intervallo di valori all'interno del quale, con una certa probabilità, si trova il vero valore della popolazione (per la media, la mediana o la frequenza). In pratica è più conveniente avere entrambi questi valori, il che consente di giudicare con maggiore sicurezza l'applicabilità dei risultati ottenuti all'intera popolazione.

In conclusione, occorre spendere qualche parola sugli strumenti utilizzati da uno statistico o da un ricercatore che conduce autonomamente l'analisi dei dati. I calcoli manuali sono ormai lontani. Gli attuali programmi informatici statistici consentono di effettuare analisi statistiche senza una seria formazione matematica. Sistemi potenti come SPSS, SAS, R, ecc. consentono al ricercatore di utilizzare metodi statistici complessi e potenti. Tuttavia, questa non è sempre una buona cosa. Senza conoscere il grado di applicabilità dei test statistici utilizzati a specifici dati sperimentali, il ricercatore può effettuare calcoli e persino ottenere dei numeri in uscita, ma il risultato sarà molto dubbio. Pertanto, un prerequisito per effettuare l'elaborazione statistica dei risultati sperimentali deve essere una buona conoscenza dei fondamenti matematici della statistica.




dillo agli amici