Statistická metoda také umožňuje analyzovat data. Statistické metody analýzy informací

💖 Líbí se vám? Sdílejte odkaz se svými přáteli

Jsou dostatečně podrobně popsány v domácí literatuře. V praxi ruských podniků se však používají jen některé z nich. Podívejme se na některé dále metody statistického zpracování.

Obecná informace

V praxi tuzemských podniků jsou převážně rozšířené statistické metody kontroly. Pokud mluvíme o regulaci technologického procesu, je dodržována extrémně zřídka. Aplikace statistických metod stanoví, že podnik tvoří skupinu odborníků, kteří mají odpovídající kvalifikaci.

Význam

Podle požadavků ISO ser. 9000, musí dodavatel určit potřebu statistických metod, které se používají při vývoji, regulaci a testování schopností výrobního procesu a výkonnosti produktu. Použité techniky jsou založeny na teorii pravděpodobnosti a matematických výpočtech. Statistické metody analýzy dat lze implementovat v jakékoli fázi životního cyklu produktu. Zajišťují posouzení a zúčtování míry heterogenity produktu nebo variability jeho vlastností vzhledem ke stanoveným nominálním hodnotám nebo požadovaným hodnotám a také variability v procesu jeho tvorby. Statistické metody jsou techniky, pomocí kterých lze s danou přesností a spolehlivostí posuzovat stav studovaných jevů. Umožňují předvídat určité problémy a vyvíjet optimální řešení na základě studovaných faktických informací, trendů a vzorců.

Návod k použití

Hlavní oblasti, ve kterých jsou rozšířeny statistické metody jsou:


Praxe vyspělých zemí

Statistické metody jsou základ, který zajišťuje tvorbu produktů s vysokými spotřebitelskými vlastnostmi. Tyto techniky jsou široce používány v průmyslových zemích. Statistické metody jsou v podstatě zárukou, že spotřebitelé obdrží produkty, které splňují stanovené požadavky. Efekt jejich použití prokázala praxe průmyslových podniků v Japonsku. Právě oni přispěli k dosažení nejvyšší úrovně produkce v této zemi. Dlouholeté zkušenosti v zahraničí ukazují, jak účinné jsou tyto techniky. Zejména je známo, že společnost Hewlelt Packard pomocí statistických metod dokázala v jednom případě snížit počet závad za měsíc z 9 000 na 45 kusů.

Potíže s implementací

V tuzemské praxi existuje řada překážek, které brání použití statistické metody studia indikátory. Potíže vznikají kvůli:


Vývoj programu

Je třeba říci, že určení potřeby určitých statistických metod v oblasti kvality, výběr a zvládnutí konkrétních technik je pro každý tuzemský podnik poměrně složitá a zdlouhavá práce. Pro jeho efektivní realizaci je vhodné vypracovat speciální dlouhodobý program. Měl by zajistit vytvoření služby, mezi jejíž úkoly bude patřit organizace a metodické vedení aplikace statistických metod. V rámci programu je nutné zajistit vybavení vhodnými technickými prostředky, proškolit specialisty a stanovit skladbu výrobních úkolů, které je třeba řešit zvolenou technikou. Doporučuje se začít ovládat pomocí nejjednodušších přístupů. Můžete například použít známou elementární produkci. Následně je vhodné přejít k dalším technikám. Může to být například analýza rozptylu, selektivní zpracování informací, regulace procesů, plánování faktoriálního výzkumu a experimentů atd.

Klasifikace

Statistické metody ekonomické analýzy zahrnují různé techniky. Sluší se říci, že jich je poměrně hodně. Přední odborník v oblasti managementu kvality v Japonsku K. Ishikawa však doporučuje používat sedm hlavních metod:

  1. Paretovy diagramy.
  2. Seskupování informací podle společných charakteristik.
  3. Kontrolní karty.
  4. Diagramy příčin a následků.
  5. Histogramy.
  6. Kontrolní seznamy.
  7. Bodové zápletky.

Na základě svých vlastních manažerských zkušeností Ishikawa tvrdí, že 95 % všech problémů a problémů v podniku lze vyřešit pomocí těchto sedmi přístupů.

Paretův diagram

Tento je založen na určitém poměru. Říkalo se tomu „Paretův princip“. Podle něj se 80 % následků objevuje z 20 % příčin. ukazuje jasnou a srozumitelnou formou relativní vliv každé okolnosti na celkový problém v sestupném pořadí. Tento dopad lze studovat podle počtu ztrát a závad způsobených každou příčinou. Relativní vliv je znázorněn pomocí sloupců, kumulovaný dopad faktorů pomocí kumulativní přímky.

Diagram příčin a následků

Na něm je studovaný problém konvenčně znázorněn ve formě vodorovné přímé šipky a podmínky a faktory, které jej nepřímo nebo přímo ovlivňují, jsou ve formě nakloněných. Při stavbě je třeba vzít v úvahu i zdánlivě nepodstatné okolnosti. Je to dáno tím, že v praxi se poměrně často vyskytují případy, kdy je řešení problému dosaženo eliminací několika zdánlivě nedůležitých faktorů. Důvody, které ovlivňují hlavní okolnosti (prvního a dalšího řádu), jsou na diagramu znázorněny vodorovnými krátkými šipkami. Detailní schéma bude ve tvaru rybí kostry.

Informace o seskupování

Tento ekonomicko-statistická metoda slouží k uspořádání různých indikátorů, které byly získány posouzením a měřením jednoho nebo více parametrů objektu. Obvykle jsou takové informace prezentovány ve formě neuspořádané sekvence hodnot. Mohou to být lineární rozměry obrobku, teplota tavení, tvrdost materiálu, počet defektů a tak dále. Na základě takového systému je těžké dělat závěry o vlastnostech produktu nebo procesech jeho vzniku. Řazení se provádí pomocí spojnicových grafů. Jasně ukazují změny sledovaných parametrů za určité období.

Kontrolní seznam

Zpravidla je prezentován ve formě tabulky frekvenčního rozložení výskytu naměřených hodnot parametrů objektu v odpovídajících intervalech. Kontrolní seznamy jsou sestavovány v závislosti na účelu studie. Rozsah hodnot indikátoru je rozdělen do stejných intervalů. Jejich počet se obvykle volí rovný druhé odmocnině z počtu provedených měření. Formulář by měl být jednoduchý, aby se předešlo problémům při vyplňování, čtení nebo kontrole.

sloupcový graf

Je prezentován ve formě stupňovitého mnohoúhelníku. Jasně ilustruje rozložení ukazatelů měření. Rozsah stanovených hodnot je rozdělen do stejných intervalů, které jsou vyneseny podél osy x. Pro každý interval je vytvořen obdélník. Jeho výška je rovna četnosti výskytu veličiny v daném intervalu.

Bodové zápletky

Používají se k testování hypotézy o vztahu mezi dvěma proměnnými. Model je konstruován následovně. Hodnota jednoho parametru je vynesena na ose x a hodnota jiného parametru je vynesena na ose pořadnice. V důsledku toho se na grafu objeví tečka. Tyto kroky se opakují pro všechny hodnoty proměnných. Pokud existuje vztah, korelační pole je prodloužené a směr se nebude shodovat se směrem osy y. Pokud neexistuje žádná vazba, bude rovnoběžná s jednou z os nebo bude mít tvar kruhu.

Kontrolní karty

Používají se při hodnocení procesu za určité období. Sestavení regulačních diagramů je založeno na následujících ustanoveních:

  1. Všechny procesy se v průběhu času odchylují od specifikovaných parametrů.
  2. Nestabilní průběh jevů se nemění náhodou. Odchylky, které přesahují očekávané limity, nejsou náhodné.
  3. Jednotlivé změny lze předvídat.
  4. Stabilní proces se může náhodně odchylovat v očekávaných hranicích.

Využití v praxi ruských podniků

Je třeba říci, že tuzemské i zahraniční zkušenosti ukazují, že nejúčinnější statistickou metodou pro hodnocení stability a přesnosti zařízení a technologických procesů je sestavování regulačních diagramů. Tato metoda se také používá k regulaci kapacit výrobního potenciálu. Při konstrukci map je nutné správně vybrat studovaný parametr. Doporučuje se dát přednost těm ukazatelům, které přímo souvisejí s účelem výrobku, lze je snadno měřit a ovlivnitelné řízením procesu. Pokud je taková volba obtížná nebo neopodstatněná, můžete hodnotit veličiny korelující (vzájemně související) s kontrolovaným parametrem.

Nuance

Pokud je měření ukazatelů s přesností potřebnou pro sestavení map na základě kvantitativních kritérií ekonomicky nebo technicky nemožné, použije se alternativní ukazatel. S tím jsou spojeny pojmy jako „defekt“ a „defekt“. Tím posledním se rozumí každý jednotlivý nesoulad výrobku se stanovenými požadavky. Vady jsou výrobky, které není dovoleno poskytovat spotřebitelům z důvodu výskytu vad.

Zvláštnosti

Každý typ karty má svá specifika. Je třeba to vzít v úvahu při jejich výběru pro konkrétní případ. Mapy založené na kvantitativním kritériu jsou považovány za citlivější na změny procesu než ty, které využívají alternativní charakteristiku. První z nich jsou však pracnější. Používají se pro:

  1. Ladění procesu.
  2. Posouzení možností implementace technologie.
  3. Kontrola přesnosti provozu zařízení.
  4. Definice tolerance.
  5. Porovnání několika přijatelných způsobů vytvoření produktu.

dodatečně

Pokud je porucha procesu charakterizována posunem řízeného parametru, je nutné použít X-karty. Pokud dojde ke zvýšení rozptylu hodnot, musíte zvolit R nebo S-modely. Je však nutné vzít v úvahu řadu funkcí. Zejména použití S-map umožní přesněji a rychleji stanovit neuspořádanost procesu než R-modely současně, jejich konstrukce však nevyžaduje složité výpočty.

Závěr

V ekonomii je možné studovat faktory, které jsou objeveny při kvalitativním hodnocení, v prostoru a dynamice. S jejich pomocí můžete provádět prediktivní výpočty. Statistické metody ekonomické analýzy nezahrnují metody hodnocení příčinných a následných vztahů ekonomických procesů a událostí, identifikace slibných a nevyužitých rezerv pro zvýšení výkonnosti podniku. Jinými slovy, uvažované přístupy nezahrnují faktoriální techniky.

statistické metody

statistické metody- metody statistické analýzy dat. Existují metody aplikované statistiky, použitelné ve všech oblastech vědeckého výzkumu a jakýchkoliv odvětví národního hospodářství, a další statistické metody, jejichž použitelnost je omezena na tu či onu oblast. Jedná se o metody jako je statistická kontrola přejímky, statistická kontrola technologických procesů, spolehlivost a testování a plánování experimentů.

Klasifikace statistických metod

Statistické metody analýzy dat se používají téměř ve všech oblastech lidské činnosti. Používají se vždy, když je třeba získat a zdůvodnit jakékoli soudy o skupině (objektech nebo subjektech) s určitou vnitřní heterogenitou.

Je vhodné rozlišovat tři typy vědeckých a aplikovaných činností v oblasti statistických metod analýzy dat (podle míry specifičnosti metod spojených s ponorem do konkrétních problémů):

a) vývoj a výzkum univerzálních metod bez zohlednění specifik oblasti použití;

b) vývoj a výzkum statistických modelů skutečných jevů a procesů v souladu s potřebami konkrétní oblasti činnosti;

c) aplikace statistických metod a modelů pro statistickou analýzu specifických dat.

Aplikovaná statistika

Popis typu dat a mechanismu jejich generování je začátkem každé statistické studie. K popisu dat se používají jak deterministické, tak pravděpodobnostní metody. Pomocí deterministických metod je možné analyzovat pouze data, která má výzkumník k dispozici. S jejich pomocí byly například získány tabulky, které byly vypočteny oficiálními orgány státní statistiky na základě statistických výkazů předložených podniky a organizacemi. Získané výsledky lze přenést na širší populaci a použít k predikci a kontrole pouze na základě pravděpodobnostně-statistického modelování. Proto se do matematické statistiky často zařazují pouze metody založené na teorii pravděpodobnosti.

Nepovažujeme za možné dávat do kontrastu deterministické a pravděpodobnostně-statistické metody. Považujeme je za sekvenční kroky statistické analýzy. V první fázi je nutné analyzovat dostupná data a prezentovat je ve snadno čitelné podobě pomocí tabulek a grafů. Poté je vhodné analyzovat statistická data na základě určitých pravděpodobnostních a statistických modelů. Všimněte si, že možnost hlubšího vhledu do podstaty skutečného jevu nebo procesu je zajištěna vytvořením adekvátního matematického modelu.

V nejjednodušší situaci jsou statistická data hodnotami nějaké charakteristické charakteristiky studovaných objektů. Hodnoty mohou být kvantitativní nebo indikovat kategorii, do které lze objekt zařadit. V druhém případě hovoří o kvalitativním znaku.

Při měření více kvantitativními nebo kvalitativními charakteristikami získáme vektor jako statistická data o objektu. Lze si to představit jako nový druh dat. V tomto případě se vzorek skládá ze sady vektorů. Jsou zde část souřadnic – čísla, a část – kvalitativní (kategorizovaná) data, pak mluvíme o vektoru různých typů dat.

Jedním prvkem vzorku, tedy jednou dimenzí, může být funkce jako celek. Například popis dynamiky indikátoru, to znamená jeho změny v čase, je elektrokardiogram pacienta nebo amplituda úderu hřídele motoru. Nebo časová řada popisující dynamiku výkonnosti konkrétní společnosti. Pak se vzorek skládá ze sady funkcí.

Vzorovými prvky mohou být i jiné matematické objekty. Například binární vztahy. Při zaměřování znalců tak často využívají řazení (řazení) objektů zkoumání - vzorky produktů, investiční projekty, možnosti rozhodování managementu. Vzorkovacími prvky mohou být v závislosti na předpisech odborné studie různé typy binárních relací (řazení, dělení, tolerance), množiny, fuzzy množiny atd.

Matematická povaha prvků vzorku v různých problémech aplikované statistiky se tedy může velmi lišit. Lze však rozlišit dvě třídy statistických dat – numerické a nenumerické. Podle toho se aplikovaná statistika dělí na dvě části – numerickou statistiku a nenumerickou statistiku.

Numerická statistika jsou čísla, vektory, funkce. Lze je sčítat a násobit koeficienty. Proto mají v numerické statistice různé součty velký význam. Matematickým aparátem pro analýzu součtů náhodných prvků vzorku jsou (klasické) zákony velkých čísel a centrální limitní věty.

Nenumerická statistická data jsou kategorizovaná data, vektory různých typů znaků, binární relace, množiny, fuzzy množiny atd. Nelze je sčítat a násobit koeficienty. Proto nemá smysl mluvit o součtech nenumerických statistik. Jsou to prvky nenumerických matematických prostorů (množin). Matematický aparát pro analýzu nenumerických statistických dat je založen na použití vzdáleností mezi prvky (stejně jako míry blízkosti, indikátory rozdílu) v takových prostorech. Pomocí vzdáleností se určují empirické a teoretické průměry, dokazují se zákony velkých čísel, konstruují se neparametrické odhady hustoty rozdělení pravděpodobnosti, řeší se diagnostické problémy a shluková analýza atd. (viz).

Aplikovaný výzkum využívá různé typy statistických dat. Je to dáno zejména způsoby jejich získávání. Pokud například testování některých technických zařízení pokračuje do určitého okamžiku, pak dostaneme tzv. cenzurovaná data skládající se ze sady čísel – trvání provozu řady zařízení před selháním a informace, že zbývající zařízení na konci testu pokračovala v provozu. Cenzurovaná data se často používají při posuzování a sledování spolehlivosti technických zařízení.

Obvykle se statistické metody pro analýzu dat prvních tří typů posuzují samostatně. Toto omezení je způsobeno skutečností uvedenou výše, že matematický aparát pro analýzu dat nenumerické povahy je výrazně odlišný od dat ve formě čísel, vektorů a funkcí.

Pravděpodobně-statistické modelování

Při aplikaci statistických metod ve specifických oblastech poznání a sektorech národního hospodářství získáváme vědecké a praktické disciplíny jako „statistické metody v průmyslu“, „statistické metody v medicíně“ apod. Z tohoto pohledu je ekonometrie „statistická metody v ekonomii“. Tyto disciplíny skupiny b) jsou obvykle založeny na pravděpodobnostně-statistických modelech budovaných v souladu s charakteristikou oblasti použití. Je velmi poučné porovnávat pravděpodobnostně-statistické modely používané v různých oblastech, objevovat jejich podobnosti a zároveň si všimnout některých rozdílů. Je tedy vidět podobnost problémových tvrzení a statistických metod používaných k jejich řešení v oblastech, jako je vědecký lékařský výzkum, specifický sociologický výzkum a marketingový výzkum, nebo zkrátka v medicíně, sociologii a marketingu. Ty jsou často seskupeny pod názvem „vzorové studie“.

Rozdíl mezi výběrovými studiemi a expertními studiemi se projevuje především v počtu zkoumaných objektů či subjektů - ve výběrových studiích se obvykle bavíme o stovkách a v odborných studiích - o desítkách. Technologie expertního výzkumu je ale mnohem sofistikovanější. Specifičnost je ještě výraznější u demografických či logistických modelů, při zpracování narativních (textových, kronikářských) informací nebo při studiu vzájemného vlivu faktorů.

Problematika spolehlivosti a bezpečnosti technických zařízení a technologií, teorie front jsou podrobně rozebrány ve velkém množství vědeckých prací.

Statistická analýza konkrétních dat

Aplikace statistických metod a modelů pro statistickou analýzu konkrétních dat je úzce spjata s problematikou příslušného oboru. Výsledky třetího z identifikovaných typů vědecké a aplikované činnosti jsou na průsečíku oborů. Lze je považovat za příklady praktické aplikace statistických metod. Ale není o nic méně důvodů připisovat je odpovídající oblasti lidské činnosti.

Například výsledky průzkumu mezi spotřebiteli instantní kávy jsou přirozeně připisovány marketingu (což dělají při přednáškách o marketingovém výzkumu). Studium dynamiky růstu cen pomocí indexů inflace vypočítaných z nezávisle shromážděných informací je zajímavé především z pohledu ekonomiky a řízení národního hospodářství (jak na makroúrovni, tak na úrovni jednotlivých organizací).

Perspektivy rozvoje

Teorie statistických metod je zaměřena na řešení reálných problémů. Proto se v něm neustále objevují nové formulace matematických problémů pro analýzu statistických dat a jsou vyvíjeny a odůvodňovány nové metody. Odůvodnění se často provádí matematickými prostředky, tedy dokazováním vět. Velkou roli hraje metodologická složka - jak přesně nastavit problémy, jaké předpoklady přijmout pro účely dalšího matematického studia. Role moderních informačních technologií, zejména počítačových experimentů, je velká.

Naléhavým úkolem je analyzovat historii statistických metod za účelem identifikace vývojových trendů a jejich aplikace pro prognózování.

Literatura

2. Naylor T. Strojové simulační experimenty s modely ekonomických systémů. - M.: Mir, 1975. - 500 s.

3. Kramer G. Matematické metody statistiky. - M.: Mir, 1948 (1. vyd.), 1975 (2. vyd.). - 648 str.

4. Bolšev L. N., Smirnov N. V. Tabulky matematické statistiky. - M.: Nauka, 1965 (1. vyd.), 1968 (2. vyd.), 1983 (3. vyd.).

5. Smirnov N. V., Dunin-Barkovsky I. V. Kurz teorie pravděpodobnosti a matematické statistiky pro technické aplikace. Ed. 3., stereotypní. - M.: Nauka, 1969. - 512 s.

6. Norman Draper, Harry Smith Aplikovaná regresní analýza. Vícenásobná regrese = aplikovaná regresní analýza. - 3. vyd. - M.: “Dialectics”, 2007. - S. 912. - ISBN 0-471-17082-8

Viz také

Nadace Wikimedia. 2010.

  • Yat-Kha
  • Amalgám (jednoznačné označení)

Podívejte se, co jsou „statistické metody“ v jiných slovnících:

    STATISTICKÉ METODY- STATISTICKÉ METODY vědecké metody pro popis a studium hromadných jevů, které umožňují kvantitativní (číselné) vyjádření. Slovo „statistika“ (z gal. stato stát) má společný kořen se slovem „stát“. Zpočátku to...... Filosofická encyklopedie

    STATISTICKÉ METODY -- vědecké metody popisu a studia hromadných jevů, které umožňují kvantitativní (číselné) vyjádření. Slovo „statistika“ (z italského stato – stát) má společný kořen se slovem „stát“. Zpočátku se to týkalo vědy o managementu a... Filosofická encyklopedie

    statistické metody- (v ekologii a biocenologii) metody variační statistiky, které umožňují studovat celek (například fytocenózu, populaci, produktivitu) podle jeho dílčích agregátů (například podle údajů získaných na registračních místech) a posuzovat stupeň přesnosti...... Ekologický slovník

    statistické metody- (v psychologii) (z latinského stavovského státu) určité metody aplikované matematické statistiky, používané v psychologii především pro zpracování experimentálních výsledků. Hlavním účelem použití S. m. je zvýšit platnost závěrů v ... ... Skvělá psychologická encyklopedie

    statistické metody- 20.2. Statistické metody Specifické statistické metody používané k organizaci, regulaci a testování činností zahrnují, ale nejsou omezeny na následující: a) návrh experimentů a faktorovou analýzu; b) analýza rozptylu a... Slovník-příručka termínů normativní a technické dokumentace

    STATISTICKÉ METODY- metody studia veličin. aspekty masových společností. jevy a procesy. S. m. umožňují digitálně charakterizovat probíhající změny ve společnostech. procesy, studovat různé. formy socioekonomické. vzory, změna...... Zemědělský encyklopedický slovník

    STATISTICKÉ METODY- některé metody aplikované matematické statistiky používané ke zpracování experimentálních výsledků. Řada statistických metod byla vyvinuta speciálně pro testování kvality psychologických testů, pro použití v profesionální... ... Profesní vzdělání. Slovník

    STATISTICKÉ METODY- (v inženýrské psychologii) (z latinského stavovského státu) některé metody aplikované statistiky používané v inženýrské psychologii ke zpracování experimentálních výsledků. Hlavním účelem použití S. m. je zvýšit platnost závěrů v ... ... Encyklopedický slovník psychologie a pedagogiky

Odeslat svou dobrou práci do znalostní báze je jednoduché. Použijte níže uvedený formulář

Studenti, postgraduální studenti, mladí vědci, kteří využívají znalostní základnu ve svém studiu a práci, vám budou velmi vděční.

Zveřejněno na http://www.allbest.ru/

  • 3. Dynamická řada
  • Literatura

1. Absolutní a relativní hodnoty

V důsledku shrnutí a seskupování statistického materiálu se výzkumník ocitá v rukou široké škály informací o studovaných jevech a procesech. Bylo by však velkou chybou pozastavovat se nad získanými výsledky, protože i když jsou seskupeny podle daných charakteristik a vyjádřeny v tabulkové nebo grafické podobě, jsou tato data stále jen jakousi ilustrací, mezivýsledkem, který je třeba analyzovat - v tomto případě , statistický . Statistickýanalýza - Tento výkon studoval objekt PROTI kvalitní rozsekaný systémy, těch. komplex Prvky A spojení, formování PROTI jeho interakce organické Celý.

Výsledkem takové analýzy by měl být model studovaného objektu, a protože mluvíme o statistice, měly by být při sestavování modelu použity statisticky významné prvky a souvislosti.

Ve skutečnosti je statistická analýza zaměřena na identifikaci takových významných prvků a souvislostí.

Absolutníindikátory(hodnoty) - celkové hodnoty vypočtené nebo převzaté ze souhrnných statistických výkazů bez jakýchkoli transformací. Absolutní ukazatele jsou vždy nominální a jsou promítnuty do měrných jednotek, které byly stanoveny při sestavování programu statistického sledování (počet zahájených trestních věcí, počet spáchaných trestných činů, počet rozvodů atd.).

Absolutní ukazatele jsou základem pro jakékoli další statistické operace, ale samy o sobě jsou pro analýzu málo užitečné. Pomocí absolutních ukazatelů je například obtížné posoudit míru kriminality v různých městech či regionech a prakticky nelze odpovědět na otázku, kde je kriminalita vyšší a kde nižší, neboť města či regiony se mohou výrazně lišit v počtu obyvatel, území a krajů. další důležité parametry.

Relativnímnožství ve statistice jsou to zobecňující ukazatele, které odhalují číselnou podobu vztahu dvou porovnávaných statistických veličin. Při výpočtu relativních hodnot se nejčastěji porovnávají dvě absolutní hodnoty, ale je možné porovnávat průměrné i relativní hodnoty a získat nové relativní ukazatele. Nejjednodušším příkladem výpočtu relativní hodnoty je odpověď na otázku: kolikrát je jedno číslo větší než druhé?

Když začínáme uvažovat relativní hodnoty, je nutné vzít v úvahu následující. V zásadě můžete porovnávat cokoli chcete, dokonce i lineární rozměry listu papíru A4 s množstvím výrobků vyráběných porcelánkou Lomonosov. Takové srovnání nám však nic nedá. Nejdůležitější podmínku pro plodný výpočet relativních množství lze formulovat takto:

1. Jednotky měření porovnávaných veličin musí být stejné nebo zcela srovnatelné. Počet trestných činů, trestních věcí a odsouzení jsou korelační ukazatele, tzn. vzájemně propojené, ale ne srovnatelné v jednotkách měření. V jedné trestní věci může být souzeno několik trestných činů a odsouzena skupina osob; Jeden trestný čin může spáchat více odsouzených a naopak jeden odsouzený může spáchat mnoho činů. Počty trestných činů, případů a odsouzení jsou srovnatelné s počtem obyvatel, počtem pracovníků v systému trestní justice, životní úrovní lidí a dalšími údaji za stejný rok. Navíc v průběhu jednoho roku jsou uvažované ukazatele navzájem zcela srovnatelné.

2. Srovnávaná data si musí nutně odpovídat z hlediska času nebo území jejich příjmu, případně obou parametrů dohromady.

Absolutní velikost, S který se porovnávají jiný PROTIEpřevleky, volal základ nebo základna srovnání, A porovnatAvytesaný index - velikost srovnání. Například při výpočtu poměru dynamiky kriminality v Rusku v letech 2000-2010. 2000 údaje budou výchozí. Mohou být brány jako jedna (pak bude relativní hodnota vyjádřena ve formě koeficientu), nebo jako 100 (v procentech). V závislosti na rozměru porovnávaných hodnot se volí nejvhodnější, orientační a vizuální forma vyjádření relativní hodnoty.

Pokud je porovnávaná hodnota mnohem větší než základ, výsledný poměr je lépe vyjádřen v koeficientech. Například kriminalita za určité období (v letech) vzrostla 2,6krát. Vyjádření v časech bude v tomto případě spíše orientační než v procentech. Relativní hodnoty jsou vyjádřeny v procentech, pokud se srovnávací hodnota příliš neliší od základu.

Relativní veličiny používané ve statistice, včetně právní statistiky, přicházejí v různých typech. V právní statistice se používají následující typy relativních veličin:

1. vztahy charakterizující strukturu obyvatelstva, případně distribuční vztahy;

2. vztah části k celku nebo vztah intenzity;

3. vztahy charakterizující dynamiku;

4. vztahy stupně a srovnání.

Relativnívelikostrozdělení - Tento relativní velikost, vyjádřený PROTI procent individuální díly celek studoval jevy(zločiny, zločinci, občanskoprávní případy, soudní spory, příčiny, preventivní opatření atd.) Na jejich Všeobecné jako výsledek, přijato za 100% . Jedná se o nejběžnější (a nejjednodušší) typ relativních dat používaných ve statistice. Jedná se např. o strukturu kriminality (podle druhu trestné činnosti), strukturu rejstříku trestů (podle druhu trestné činnosti, podle věku odsouzených) atp.

statistická analýza absolutní hodnota

přístupintenzita(poměr části k celku) - zobecňující relativní hodnota, která odráží prevalenci určité charakteristiky ve sledovaném celek.

Nejběžnějším ukazatelem intenzity používaným v právní statistice je intenzita kriminality . Intenzita kriminality se obvykle odráží v míře kriminality , těch. počet trestných činů na 100 nebo 10 tisíc obyvatel.

KP= (P*100000)/N

kde P je absolutní počet zaznamenaných trestných činů, N je absolutní velikost populace.

Předpokladem, který určuje samotnou možnost výpočtu takových ukazatelů, jak je uvedeno výše, je, aby všechny použité absolutní ukazatele byly brány na jednom území a za jedno časové období.

Vztah,charakterizujícídynamika, reprezentovat zobecňující relativní množství, ukazovat změna v čas těch nebo jiný indikátory právní statistika. Za časový interval se obvykle považuje rok.

Za základ (základ) rovný 1, resp. 100 % se považuje informace o sledované charakteristice pro určitý rok, která byla nějakým způsobem charakteristická pro zkoumaný jev. Údaje ze základního roku slouží jako pevný základ, ke kterému jsou procentuálně vyjádřeny ukazatele následujících let.

Úlohy statistické analýzy často vyžadují roční (nebo jiné období) srovnání, kdy základna přijato data každý předchozí roku(měsíc nebo jiné období). Takový základ se nazývá mobilní, pohybliví. To se obvykle používá při analýze časových řad (časových řad).

VztahstupněAsrovnání umožňují porovnávat různé ukazatele, aby bylo možné identifikovat, která hodnota je o kolik větší než druhá, do jaké míry se jeden jev liší nebo podobá jinému, co je společné a charakteristické ve sledovaných statistických procesech atd.

Index je speciálně vytvořený relativní ukazatel srovnání (v čase, prostoru, ve srovnání s prognózou atd.), který ukazuje, kolikrát se úroveň studovaného jevu za jedné podmínky liší od úrovně stejného jevu za jiných podmínek. podmínky. Nejběžnější indexy jsou v ekonomických statistikách, i když hrají určitou roli i v analýze právních jevů.

Bez indexů se neobejdete v případech, kdy je nutné porovnávat nesouměřitelné ukazatele, jejichž prosté sčítání je nemožné. Proto jsou indexy obvykle definovány jako číselné ukazateleProMěřeníprůměrnýŘečnícicelekheterogenníPrvky.

Ve statistice se indexy obvykle označují písmenem I (i). Velké nebo velké písmeno – záleží na tom, zda mluvíme o individuálním (soukromém) indexu nebo o obecném.

Individuálníindexy i) odrážejí poměr ukazatele běžného období k odpovídajícímu ukazateli srovnávaného období.

souhrnindexy se používají při analýze vztahu mezi komplexními socioekonomickými jevy a skládají se ze dvou částí: skutečné indexované hodnoty a spoluměřiče („váha“).

2. Průměrné hodnoty a jejich aplikace v právní statistice

Výsledkem zpracování absolutních a relativních ukazatelů je konstrukce distribučních řad. Řádek rozdělení - TentoobjednalPodlevysoká kvalitanebokvantitativníznamenírozděleníJednotkycelek. Analýza těchto řad je základem jakékoli statistické analýzy, bez ohledu na to, jak složitá se později může ukázat jako složitá.

Distribuční řady lze konstruovat na základě kvalitativních nebo kvantitativních charakteristik. V prvním případě je tzv atributivní, ve druhém - variační. V tomto případě se nazývají rozdíly v kvantitativních charakteristikách variace a toto znamení samotné - volba. Právě s variačními řadami se právní statistika musí nejčastěji vypořádat.

Variační řada se skládá vždy ze dvou sloupců (grafu). Jedna označuje hodnotu kvantitativní charakteristiky ve vzestupném pořadí, které se ve skutečnosti nazývá opce, které jsou označeny X. Druhý sloupec (graf) udává počet jednotek, které jsou charakteristické pro jednu nebo druhou možnost. Říká se jim frekvence a jsou označeny latinkou F.

Tabulka 2.1

Volba X

Frekvence F

Frekvence výskytu určitého znaku je velmi důležitá při výpočtu dalších významných statistických ukazatelů, a to průměrů a variačních ukazatelů.

Variační řady zase mohou být oddělený nebo interval. Diskrétní řady, jak název napovídá, jsou stavěny na základě diskrétně se měnících charakteristik a intervalové řady - na základě kontinuálních variací. Například rozdělení pachatelů podle věku může být buď diskrétní (18, 19, 20 let atd.), nebo souvislé (do 18 let, 18-25 let, 25-30 let atd.). Navíc samotné intervalové řady mohou být konstruovány buď na diskrétním nebo spojitém základě. V prvním případě se hranice sousedních intervalů neopakují; v našem příkladu budou intervaly vypadat takto: do 18 let, 18-25, 26-30, 31-35 atd. Taková řada se nazývá kontinuálníoddělenýřádek. IntervalřádekSkontinuálnívariace předpokládá, že horní hranice předchozího intervalu se shoduje s dolní hranicí následujícího.

Úplně prvním indikátorem popisujícím variační řady je průměrný množství. Hrají důležitou roli v právní statistice, protože pouze s jejich pomocí lze populace charakterizovat pomocí kvantitativního proměnného atributu, pomocí kterého je lze porovnávat. Pomocí průměrných hodnot můžeme porovnávat soubory právně významných jevů, které nás zajímají podle určitých kvantitativních charakteristik a vyvodit z těchto srovnání potřebné závěry.

Průměrnýmnožství odrážet nejvíc Všeobecné trend (vzor), inherentní celému množství studovaných jevů. Projevuje se v typický kvantitativní charakteristiky, tzn. v průměrné hodnotě všech dostupných (proměnných) ukazatelů.

Statistika vyvinula mnoho typů průměrů: aritmetický průměr, geometrický průměr, kubický průměr, harmonický průměr atd. V právní statistice se však prakticky nepoužívají, proto budeme uvažovat pouze dva typy průměrů - aritmetický průměr a geometrický průměr.

Nejběžnějším a nejznámějším průměrem je průměrnýaritmetický. Pro jeho výpočet se vypočítá součet ukazatelů a vydělí se celkovým počtem ukazatelů. Například čtyřčlennou rodinu tvoří rodiče ve věku 38 a 40 let a dvě děti ve věku 7 a 10 let. Sečteme věk: 38+40+7+10 a výsledný součet 95 vydělíme 4. Výsledný průměrný věk rodiny je 23,75 let. Nebo spočítejme průměrnou měsíční zátěž vyšetřovatelů, pokud oddělení o 8 lidech řeší 25 případů za měsíc. Vydělte 25 8 a dostaneme 3 125 případů za měsíc na jednoho vyšetřovatele.

V právní statistice se aritmetický průměr používá při výpočtu zátěže zaměstnanců (vyšetřovatelů, státních zástupců, soudců atd.), výpočtu absolutního nárůstu kriminality, výpočtu vzorku atd.

V uvedeném příkladu je však průměrná měsíční zátěž na vyšetřovatele vypočtena nesprávně. Faktem je, že prostý aritmetický průměr nebere v úvahu frekvence studovaný rys. V našem příkladu je průměrná měsíční zátěž vyšetřovatele stejně správná a informativní jako „průměrná teplota v nemocnici“ ze slavného vtipu, což, jak víme, je pokojová teplota. Aby se při výpočtu aritmetického průměru vzala v úvahu frekvence projevů studované charakteristiky, používá se takto: průměrnýaritmetickývážený nebo průměr pro diskrétní variační řady. (Diskrétní variační řada - sled změn charakteristiky podle diskrétních (nespojitých) ukazatelů).

Aritmetický průměr vážený ( vážený průměr) nemá zásadní rozdíly od prostého aritmetického průměru. V něm je sčítání stejné hodnoty nahrazeno vynásobením této hodnoty její četností, tzn. v tomto případě je každá hodnota (varianta) vážena četností výskytu.

Takže při výpočtu průměrného vytížení vyšetřovatelů musíme vynásobit počet případů počtem vyšetřovatelů, kteří vyšetřovali přesně takový počet případů. Obvykle je vhodné prezentovat takové výpočty ve formě tabulek:

Tabulka 2.2

Počet případů

(volba X)

Počet vyšetřovatelů (frekvence F)

Možnost produktu

na frekvence ( XF)

2. Vypočítejme skutečný vážený průměr pomocí vzorce:

Kde X- počet trestních případů a F- počet vyšetřovatelů.

Vážený průměr tedy není 3,125, ale 4,375. Když se nad tím zamyslíte, tak by to mělo být: zátěž na každého jednotlivého vyšetřovatele se zvyšuje kvůli tomu, že se jeden vyšetřovatel na našem hypotetickém oddělení ukázal jako flákač – nebo naopak vyšetřoval zvlášť důležitý a složitý případ . Ale problematice interpretace výsledků statistického výzkumu se budeme věnovat až v dalším tématu. V některých případech, konkrétně v případech seskupených frekvencí diskrétního rozdělení, není výpočet průměru na první pohled zřejmý. Předpokládejme, že potřebujeme vypočítat aritmetický průměr pro rozdělení osob odsouzených za chuligánství podle věku. Distribuce vypadá takto:

Tabulka 2.3

(volba X)

Počet odsouzených (četnost F)

Uprostřed intervalu

Možnost produktu

na frekvence ( XF)

(21-18) /2+18=19,5

Dále se průměr vypočítá podle obecného pravidla a činí pro tuto diskrétní řadu 23,6 let. V případě tzv otevřené řady, tedy v situacích, kdy jsou krajní intervaly určeny „méně než X" nebo více X“, velikost krajních intervalů se nastavuje podobně jako u ostatních intervalů.

3. Dynamická řada

Společenské jevy zkoumané statistikou se neustále vyvíjejí a mění. Sociální a právní indikátory lze prezentovat nejen ve statické podobě, odrážející určitý jev, ale také jako proces probíhající v čase a prostoru i ve formě interakce studovaných charakteristik. Jinými slovy, časové řady ukazují vývoj vlastnosti, tzn. její změna v čase, prostoru nebo v závislosti na podmínkách prostředí.

Tato řada je posloupností průměrných hodnot za určitá časová období (za každý kalendářní rok).

Pro hlubší studium společenských jevů a jejich analýzu nestačí pouhé srovnání úrovní řady dynamik, je nutné vypočítat derivační ukazatele řady dynamik: absolutní růst, tempo růstu, růst tempo, průměrný růst a tempa růstu, absolutní obsah jednoho procenta růstu.

Výpočet ukazatelů řady dynamiky se provádí na základě srovnání jejich úrovní. V tomto případě existují dva možné způsoby, jak porovnat úrovně časové řady:

základní ukazatele, kdy jsou všechny následující úrovně porovnávány s nějakou počáteční úrovní branou jako základ;

řetězové indikátory, kdy se každá následující úroveň řady dynamiky porovnává s předchozí.

Absolutní růst ukazuje, o kolik jednotek je úroveň aktuálního období větší nebo menší než úroveň základního nebo předchozího období za určité časové období.

Absolutní nárůst (P) se vypočítá jako rozdíl mezi porovnávanými úrovněmi.

Základní absolutní nárůst:

P b = y i - y základny . (f.1).

Absolutní nárůst řetězce:

P ts = y i - y i -1 (f.2).

Míra růstu (Tr) ukazuje, kolikrát (o kolik procent) je úroveň aktuálního období větší nebo menší než úroveň základního nebo předchozího období:

Základní tempo růstu:

(f.3)

Rychlost růstu řetězce:

(f.4)

Míra růstu (Tpr) ukazuje, o kolik procent je úroveň běžného období vyšší nebo nižší než úroveň základního nebo předchozího období braného jako základ pro srovnání, a vypočítá se jako poměr absolutního růstu k absolutní úrovni. brát jako základ.

Rychlost růstu lze také vypočítat odečtením 100 % od rychlosti růstu.

Základní tempo růstu:

nebo (f.5)

Rychlost růstu řetězce:

nebo (f.6)

Průměrná rychlost růstu se vypočítá pomocí vzorce geometrického průměru rychlostí růstu řady dynamiky:

(f.7)

kde je průměrná míra růstu;

- tempa růstu za jednotlivá období;

n- počet temp růstu.

Podobné problémy s kořenovým exponentem větším než tři se obvykle řeší pomocí logaritmů. Z algebry víme, že logaritmus odmocniny se rovná logaritmu radikandu děleného exponentem odmocniny a že logaritmus součinu několika faktorů je roven součtu logaritmů těchto faktorů.

Průměrná rychlost růstu se tedy vypočítá extrakcí kořene n stupně z děl jednotlivců n- rychlost růstu řetězce. Průměrná míra růstu je rozdíl mezi průměrnou mírou růstu a jedním (), nebo 100 %, když je míra růstu vyjádřena v procentech:

nebo

Pokud v dynamické řadě neexistují meziúrovně, průměrné míry růstu a přírůstků se určují podle následujícího vzorce:

(f.8)

kde je konečná úroveň dynamické řady;

- počáteční úroveň dynamických řad;

n - počet úrovní (dat).

Je zřejmé, že ukazatele průměrného tempa růstu a přírůstků vypočtené pomocí vzorců (formulář 7 a formulář 8) mají stejné číselné hodnoty.

Absolutní obsah 1% růstu ukazuje, jakou absolutní hodnotu obsahuje 1% růstu a je vypočítán jako poměr absolutního růstu k tempu růstu.

Absolutní obsah zvýšení o 1 %:

základní: (formulář 9)

řetěz: (f.10)

Výpočet a analýza absolutní hodnoty každého procentuálního nárůstu přispívá k hlubšímu pochopení podstaty vývoje zkoumaného jevu. Data z našeho příkladu ukazují, že i přes kolísání temp růstu a zisků za jednotlivé roky zůstávají základní ukazatele absolutního obsahu 1 % růstu nezměněny, zatímco řetězové ukazatele charakterizující změny v absolutní hodnotě jednoho procenta růstu v každém v následujícím roce ve srovnání s předchozím neustále rostou.

Při konstrukci, zpracování a analýze časových řad je často potřeba určit průměrné úrovně studovaných jevů za určitá časová období. Chronologický průměr intervalové řady se vypočítá ve stejných intervalech pomocí jednoduchého vzorce aritmetického průměru a v nestejných intervalech - pomocí váženého aritmetického průměru:

kde je průměrná úroveň intervalové řady;

- počáteční úrovně série;

n- počet úrovní.

Pro momentovou řadu dynamiky, za předpokladu, že jsou časové intervaly mezi daty stejné, se průměrná úroveň vypočítá pomocí průměrného chronologického vzorce:

(f.11)

kde je průměrná chronologická hodnota;

y 1 ,., y n- absolutní úroveň série;

n - počet absolutních úrovní řady dynamiky.

Průměrná chronologická úroveň momentové řady dynamiky je rovna součtu ukazatelů této řady děleno počtem ukazatelů mínus jeden; v tomto případě by počáteční a konečná úroveň měla být brána na polovinu, protože počet dat (momentů) je obvykle o jeden větší než počet období.

V závislosti na obsahu a formě prezentace zdrojových dat (intervalové nebo momentové řady dynamiky, stejné nebo jiné časové intervaly) pro výpočet různých sociálních ukazatelů, například průměrného ročního počtu trestných činů a trestných činů (podle druhu), průměr velikost zůstatků pracovního kapitálu, průměrný počet pachatelů atd., použijte vhodné analytické výrazy.

4. Statistické metody pro studium vztahů

V předchozích otázkách jsme uvažovali takříkajíc o analýze „jednorozměrných“ rozdělení – variačních řad. Jedná se o velmi důležitý, ale zdaleka ne jediný typ statistické analýzy. Analýza variačních řad je základem pro „pokročilejší“ typy statistické analýzy, především pro studovatvzájemné vztahy. V důsledku takového studia jsou odhaleny vztahy příčin a následků mezi jevy, což umožňuje určit, které změny charakteristik ovlivňují variace studovaných jevů a procesů. V tomto případě se vlastnosti, které způsobují změny u ostatních, nazývají faktoriální (faktory) a vlastnosti, které se pod jejich vlivem mění, se nazývají efektivní.

Ve statistické vědě existují dva typy spojení mezi různými charakteristikami a jejich informacemi – funkční spojení (tvrdě deterministické) a statistické (stochastické).

Pro funkčníspojení Mezi změnou charakteristiky faktoru a změnou výsledné hodnoty existuje úplná shoda. Tento vztah se stejně projevuje ve všech jednotkách jakékoli populace. Nejjednodušší příklad: zvýšení teploty se projeví v objemu rtuti v teploměru. V tomto případě působí jako faktor okolní teplota a jako efektivní charakteristika působí objem rtuti.

Funkční vztahy jsou charakteristické pro jevy studované takovými vědami, jako je chemie, fyzika, mechanika, ve kterých je možné provádět „čisté“ experimenty, ve kterých je eliminován vliv vnějších faktorů. Faktem je, že funkční spojení mezi dvěma je možné pouze tehdy, když závisí druhá hodnota (výsledná charakteristika). pouze A výhradně od prvního. To je u společenských jevů pozorováno velmi zřídka.

Sociální a právní procesy, které jsou výsledkem současného působení velkého množství faktorů, jsou popsány prostřednictvím statistických souvislostí, tedy souvislostí stochasticky (náhodou) deterministický, kdy různé hodnoty jedné proměnné odpovídají různým hodnotám jiné proměnné.

Nejdůležitějším (a běžným) případem stochastické závislosti je korelacezávislost. Při takové závislosti příčina neurčuje účinek jednoznačně, ale pouze s určitou mírou pravděpodobnosti. Identifikaci těchto souvislostí je věnován samostatný typ statistické analýzy - korelační analýza.

Hlavní úkol korelační analýza – na základě přísně matematických technik stanovit kvantitativní vyjádření vztahu, který existuje mezi studovanými charakteristikami. Existuje několik přístupů k tomu, jak přesně se korelace vypočítává, a podle toho několik typů korelačních koeficientů: kontingenční koeficient A.A. Chuprov (pro měření vztahu mezi kvalitativními charakteristikami), asociační koeficient K. Pearsona a také Spearmanův a Kendallův koeficient pořadové korelace. Obecně takové koeficienty ukazují pravděpodobnost, s jakou se studované vztahy objevují. V souladu s tím, čím vyšší je koeficient, tím výraznější je vztah mezi charakteristikami.

Mezi zkoumanými faktory mohou existovat přímé i nepřímé korelace. Rovnýkorelacezávislost pozorované v případech, kdy změny hodnot faktoru odpovídají stejným změnám hodnoty výsledného atributu, to znamená, že když se hodnota atributu faktoru zvyšuje, hodnota výsledného atributu se také zvyšuje a naopak. . Existuje například přímá korelace mezi kriminogenními faktory a kriminalitou ( se znaménkem „+“). Pokud zvýšení hodnot jedné charakteristiky způsobí obrácené změny hodnot jiné, pak se takový vztah nazývá zvrátit. Například čím vyšší sociální kontrola ve společnosti, tím nižší kriminalita (vztah se znaménkem „-“).

Dopředné i zpětné spojení může být lineární nebo křivočaré.

Přímka ( Lineární) vztahy se objevují, když se zvýšením hodnot atributu faktoru dojde ke zvýšení (přímé) nebo snížení (inverzní) hodnoty atributu důsledku. Matematicky je tento vztah vyjádřen regresní rovnicí: na = A + bX, Kde na - znamení-důsledek; A A b - odpovídající vazební koeficienty; X - znakový faktor.

Křivočaré spojení jsou jiného charakteru. Nárůst hodnoty faktorové charakteristiky má nerovnoměrný dopad na hodnotu výsledné charakteristiky. Toto spojení může být nejprve přímé a poté reverzní. Známým příkladem je souvislost mezi trestnými činy a věkem pachatelů. Trestná činnost jednotlivců roste nejprve přímo úměrně se zvyšováním věku pachatelů (cca do 30 let) a následně s přibývajícím věkem trestná činnost klesá. Vrchol distribuční křivky pachatelů podle věku je navíc posunut od průměru doleva (směrem k mladšímu věku) a je asymetrický.

Korelační lineární spojení mohou být jedenÓfaktoriál, když je studována souvislost mezi jedním znaménkem faktoru a jedním znaménkem důsledku (párová korelace). Mohou také být multifaktoriální, když je studován vliv mnoha interagujících znakových faktorů na znakový důsledek (vícenásobná korelace).

Ale bez ohledu na to, který korelační koeficient je použit, bez ohledu na to, jaká korelace je studována, není možné vytvořit spojení mezi charakteristikami pouze na základě statistických ukazatelů. Prvotní analýza ukazatelů je vždy analýzou kvalitativní, během níž se studuje a objasňuje sociálně-právní podstata jevu. V tomto případě se používají ty vědecké metody a přístupy, které jsou charakteristické pro vědní obor, který tento fenomén studuje (sociologie, právo, psychologie atd.). Analýza seskupení a průměrů nám pak umožňuje předkládat hypotézy, sestavovat modely a určit typ spojení a závislosti. Teprve poté je stanovena kvantitativní charakteristika závislosti – vlastně korelační koeficient.

Literatura

1. Avanesov G.A. Základy kriminologické prognózy. Tutorial. M.: Vyšší škola ministerstva vnitra SSSR, 1970.

2. Avrutin K.E., Gilinsky Ya.I. Kriminalistický rozbor kriminality v regionu: metodika, technika, technika. L., 1991.

3. Adamov E. aj. Ekonomika a statistika firem: učebnice / Ed. S.D. Ilyenková. M.: Finance a statistika, 2008.

4. Balakina N.N. Statistika: Učebnice. - metoda. komplex. Chabarovsk: IVESEP, pobočka v Chabarovsku, 2008.

5. Bluvshtein Yu.D., Volkov G.I. Časová řada kriminality: Učebnice. Minsk, 1984.

6. Borovikov V.P., Borovikov I.P. STATISTICA - Statistická analýza a zpracování dat v prostředí Windows. M.: Informační a vydavatelský dům "Filin", 1997.

7. Borodin S.V. Kontrola kriminality: Teoretický model pro komplexní program. M.: Nauka, 1990.

8. Otázky statistiky // Měsíční vědecký a informační časopis Státního statistického výboru Ruské federace, 2002-2009.

9. Gusarov V.M. Statistika: Učebnice. manuál pro univerzity. M.: UNITY-DANA, 2009.

10. Dobrynina N.V., Nimenya I.N. Statistika: Učebnice. - metoda. příspěvek. Petrohrad: SPbGIEU, 2009.

11. Eliseeva I.I., Yuzbashev M.M. Obecná teorie statistiky: Učebnice pro vysoké školy / Edited by I. I. Eliseeva. 4. vyd. M.: Finance a statistika, 1999.

12. Eliseeva I.I., Yuzbashev M.M. Obecná teorie statistiky: Učebnice. - M.: Finance a statistika, 1995.

13. Eremina T., Matyatina V., Pluschevskaya Yu.Problémy rozvoje sektorů ruské ekonomiky // Otázky ekonomiky. 2009. č. 7.

14. Efimova M.R., Ganchenko O.I., Petrova E.V. Workshop z obecné teorie statistiky: Učebnice. manuál 2. vyd., revidováno. a doplňkové M.: Finance a statistika, 2009.

15. Efimova M.R., Petrova E.V., Rumyantsev V.N. Obecná teorie statistiky: Učebnice. - M.: INFRA-M, 1998.

16. Kirillov L.A. Kriminalistika a prevence kriminality orgány vnitřních věcí M., 1992.

17. Kosoplechev N.P., Metody kriminologického výzkumu. M., 1984.

18. Lee D.A. Zločin v Rusku: systémová analýza. M., 1997.

19. Lee D.A. Kriminální statistické účetnictví: strukturální a funkční vzorce. M.: Informační a vydavatelská agentura "Ruský svět", 1998.

20. Makarova N.V., Trofimets V.Ya. Statistika v Excelu: Učebnice. příspěvek. M.: Finance a statistika, 2009.

21. Nesterov L.I. Nové trendy ve statistice národního bohatství // Otázky statistiky. 2008. č. 11.

22. Petrova E.V. a další Workshop o dopravní statistice: Učebnice. příspěvek. M.: Finance a statistika, 2008.

23. Kriminalita v Rusku v devadesátých letech a některé aspekty právního státu a boj proti němu. M., 1995.

24. Kriminalita, statistika, právo // Ed. prof. A.I. Dluh. M.: Kriminalistické sdružení, 1997.

25. Rostov K.T. Kriminalita v regionech Ruska (sociálně-kriminologická analýza). Petrohrad: Petrohradská akademie Ministerstva vnitra Ruska, 1998.

26. Směrnice pro sčítání lidu k postupu při provádění celoruského sčítání lidu v roce 2002 a vyplňování sčítacích dokumentů. M.: PIK "Offset", 2003.

27. Savyuk L.K. Právní statistika: Učebnice. M.: Yurist, 1999.

28. Salin V.N., Shpakovskaya E.P. Socioekonomická statistika: Učebnice pro vysoké školy. M.: Právník Gardanika, 2008.

29. Sidenko A.V., Popov G.Yu., Matveeva V.M. Statistika: Učebnice. M.: Obchod a služby, 2008.

30. Sociální prevence kriminality: tipy, doporučení // Ed. ANO. Kerimová. M., 1989.

31. Sociální statistika: Učebnice pro vysoké školy // Ed. I.I. Eliseeva. 3. vyd. M.: Finance a statistika, 2009.

Publikováno na Allbest.ru

Podobné dokumenty

    Zvažování hlavních metod statistické analýzy. Studie městské části Kungur. Provádění výpočtů na základě ročních ukazatelů. Analýza demografie a socioekonomického vývoje území na základě výsledků aplikace.

    práce v kurzu, přidáno 24.06.2015

    Průměrná hodnota je volnou charakteristikou zákonitostí procesu v podmínkách, ve kterých se vyskytuje. Formuláře a metody pro výpočet průměrných hodnot. Aplikace průměrů v praxi: výpočet mzdové diferenciace podle ekonomických sektorů.

    práce v kurzu, přidáno 12/04/2007

    Statistické metody analýzy rozvodů. Statistická analýza rozvodů v regionu Amur. Analýza dynamiky a struktury rozvodů. Seskupení měst a okresů Amurské oblasti podle počtu rozvodů za rok. Výpočet průměrných hodnot a variačních ukazatelů.

    práce v kurzu, přidáno 4.12.2014

    Aspekty statistické analýzy zajištění bydlení. Aplikace statistických metod pro analýzu nabídky bydlení obyvatelstva. Analýza homogenity obyvatelstva okresů podle poměru závislosti. Korelační a regresní analýza.

    práce v kurzu, přidáno 18.01.2009

    Organizace státní statistiky v Rusku. Požadavky na shromažďovaná data. Formy, druhy a metody statistického pozorování. Příprava statistického pozorování. Chyby ve statistickém pozorování. Metody sledování statistik.

    abstrakt, přidáno 12.2.2007

    Vývoj programu sledování trestněprávní statistiky, jeho hlavní etapy a náležitosti, metody a postup implementace. Zjišťování stavu kriminality ve zkoumané oblasti. Pravidla pro záznam výsledků statistického pozorování.

    test, přidáno 18.05.2010

    Klasifikace statistické dokumentace. Druhy dokumentů: písemné, ikonografické, statistické a fonetické. Metody a metody analýzy materiálů: neformalizované (tradiční) a formalizované. Postup při provádění obsahové analýzy.

    prezentace, přidáno 16.02.2014

    Pojem průměrné hodnoty. Metoda průměrů při studiu sociálních jevů. Relevantnost použití metody průměrů při studiu společenských jevů je zajištěna možností přechodu od individuálního k obecnému, od náhodného k přirozenému.

    práce v kurzu, přidáno 13.01.2009

    Pojem statistického pozorování. Analýza lineárních a křivočarých korelací. Seznámení se vzorci a veličinami statistického pozorování. Analýza výpočtů vztahu indexů, konstrukce histogramu, prvky distribuční řady.

    test, přidáno 27.03.2012

    Charakteristika hlavních ukazatelů statistické analýzy sociální podmíněnosti veřejného zdraví v Ruské federaci. Úrovně hodnocení zdraví z pohledu sociálního lékařství. Klasifikace dětské populace podle zdravotních skupin.


Neztrať to. Přihlaste se k odběru a obdržíte odkaz na článek na svůj e-mail.

Činnosti lidí v mnoha případech zahrnují práci s daty, a to zase může znamenat nejen práci s nimi, ale také jejich studium, zpracování a analýzu. Například, když potřebujete zhustit informace, najít nějaké vztahy nebo definovat struktury. A právě pro analytiku je v tomto případě velmi vhodné nejen používat, ale i aplikovat statistické metody.

Charakteristickým rysem metod statistické analýzy je jejich složitost v důsledku rozmanitosti forem statistických vzorů a také složitost procesu statistického výzkumu. Chceme však mluvit o metodách, které může používat každý, a dělat to efektivně a s radostí.

Statistický výzkum lze provést pomocí následujících metod:

  • Statistické pozorování;
  • Souhrn a seskupování statistických pozorovacích materiálů;
  • Absolutní a relativní statistické hodnoty;
  • Variační řada;
  • Vzorek;
  • Korelační a regresní analýza;
  • Dynamická řada.

Statistické pozorování

Statistické pozorování je plánovaný, organizovaný a ve většině případů systematický sběr informací, zaměřený především na jevy společenského života. Tato metoda je realizována prostřednictvím registrace předem určených nejnápadnějších znaků, jejímž účelem je následně získat charakteristiky studovaných jevů.

Statistické sledování musí být provedeno s ohledem na některé důležité požadavky:

  • Musí plně pokrýt zkoumané jevy;
  • Získané údaje musí být přesné a spolehlivé;
  • Získaná data by měla být jednotná a snadno srovnatelná.

Také statistické pozorování může mít dvě formy:

  • Vykazování je formou statistického pozorování, kdy jsou informace poskytovány konkrétním statistickým oddílům organizací, institucí nebo podniků. V tomto případě se údaje zapisují do speciálních sestav.
  • Speciálně organizované pozorování je pozorování, které je organizováno za konkrétním účelem, aby se získaly informace, které nejsou ve zprávách dostupné, nebo aby se vyjasnila a stanovila spolehlivost informací ve zprávách. Tento formulář zahrnuje průzkumy (například průzkumy veřejného mínění), sčítání lidu atd.

Kromě toho lze statistická pozorování kategorizovat na základě dvou charakteristik: buď na základě povahy záznamu údajů, nebo na základě pokrytí jednotek sledování. Do první kategorie patří průzkumy, dokumentace a přímé pozorování a do druhé kategorie souvislé a neúplné pozorování, tzn. selektivní.

K získávání dat pomocí statistického pozorování lze využít metody jako jsou dotazníky, korespondenční aktivity, samokalkulace (kdy pozorovaní např. sami vyplní příslušné dokumenty), expedice a reporting.

Souhrn a seskupování statistických pozorovacích materiálů

Když už mluvíme o druhé metodě, nejprve bychom měli mluvit o shrnutí. Shrnutí je proces zpracování určitých jednotlivých faktů, které tvoří celkový soubor dat shromážděných během pozorování. Při správném provedení sumáře se může obrovské množství jednotlivých údajů o jednotlivých objektech pozorování proměnit v celý komplex statistických tabulek a výsledků. Takový výzkum také pomáhá určit obecné rysy a vzorce studovaných jevů.

S přihlédnutím k ukazatelům přesnosti a hloubky studia lze rozlišit jednoduché a komplexní shrnutí, ale kterýkoli z nich by měl být založen na konkrétních fázích:

  • Je vybrána charakteristika seskupení;
  • Stanoví se pořadí utváření skupin;
  • Vyvíjí se systém indikátorů pro charakterizaci skupiny a objektu nebo jevu jako celku;
  • Připravují se rozvržení tabulek, kde budou prezentovány souhrnné výsledky.

Je důležité si uvědomit, že existují různé formy shrnutí:

  • Centralizovaný souhrn, vyžadující přesun přijatého primárního materiálu na vyšší středisko k následnému zpracování;
  • Decentralizované shrnutí, kde studium dat probíhá v několika fázích vzestupně.

Shrnutí lze provést pomocí specializovaného vybavení, například pomocí počítačového softwaru nebo ručně.

Pokud jde o seskupování, tento proces se vyznačuje rozdělením zkoumaných dat do skupin podle charakteristik. Vlastnosti úloh, které statistická analýza přináší, ovlivňují, o jaký druh seskupení půjde: typologické, strukturální nebo analytické. Proto se pro shrnutí a seskupení buď uchýlí ke službám vysoce specializovaných specialistů, nebo využívají.

Absolutní a relativní statistické veličiny

Absolutní hodnoty jsou považovány za úplně první formu prezentace statistických dat. S jeho pomocí je možné dát jevům rozměrové charakteristiky, například v čase, délce, objemu, ploše, hmotnosti atd.

Pokud chcete vědět o jednotlivých absolutních statistických hodnotách, můžete se uchýlit k měření, odhadu, počítání nebo vážení. A pokud potřebujete získat ukazatele celkového objemu, měli byste použít souhrn a seskupení. Je třeba mít na paměti, že absolutní statistické hodnoty se liší v přítomnosti jednotek měření. Mezi takové jednotky patří náklady, práce a přírodní.

A relativní veličiny vyjadřují kvantitativní vztahy vztahující se k jevům společenského života. Abychom je získali, vždy se některá množství vydělí jinými. Ukazatel, se kterým se porovnává (toto je jmenovatel), se nazývá základ srovnání a ukazatel, se kterým se porovnává (toto je čitatel), se nazývá vykazovací hodnota.

Relativní hodnoty se mohou lišit v závislosti na jejich obsahu. Jsou to například hodnoty srovnání, hodnoty úrovně rozvoje, hodnoty intenzity konkrétního procesu, hodnoty koordinace, struktury, dynamiky atd. a tak dále.

Ke studiu populace založené na rozlišovacích charakteristikách používá statistická analýza průměrné hodnoty – shrnující kvalitativní charakteristiky souboru homogenních jevů na základě nějaké diferenciační charakteristiky.

Mimořádně důležitou vlastností průměrných hodnot je, že vypovídají o hodnotách specifických vlastností v celém jejich komplexu jako jediné číslo. Navzdory skutečnosti, že jednotlivé jednotky mohou vykazovat kvantitativní rozdíly, průměrné hodnoty vyjadřují obecné hodnoty charakteristické pro všechny jednotky studovaného komplexu. Ukazuje se, že použitím charakteristik jedné věci můžete získat vlastnosti celku.

Je třeba si uvědomit, že za jednu z nejdůležitějších podmínek pro použití průměrných hodnot, je-li prováděn statistický rozbor společenských jevů, je považována homogenita jejich komplexu, pro kterou je nutné zjišťovat průměrná hodnota. A vzorec pro její určení bude záviset na tom, jak přesně budou prezentovány výchozí údaje pro výpočet průměrné hodnoty.

Variační série

V některých případech nemusí údaje o průměrných ukazatelích určitých studovaných veličin stačit ke zpracování, vyhodnocení a hloubkové analýze jevu nebo procesu. Pak je třeba vzít v úvahu variaci či rozptyl ukazatelů jednotlivých jednotek, což je také důležitá charakteristika zkoumané populace.

Jednotlivé hodnoty veličin mohou být ovlivněny mnoha faktory a samotné studované jevy či procesy mohou být velmi různorodé, tzn. mít variace (tato variace je variační řada), důvody pro které je třeba hledat v podstatě toho, co je studováno.

Výše uvedené absolutní hodnoty jsou přímo závislé na jednotkách měření charakteristik, a proto činí proces studia, vyhodnocování a porovnávání dvou nebo více variačních řad složitějším. A relativní ukazatele je potřeba vypočítat jako poměr absolutních a průměrných ukazatelů.

Vzorek

Význam metody vzorkování (nebo jednodušeji vzorkování) spočívá v tom, že vlastnosti jedné části se používají k určení číselných charakteristik celku (toto se nazývá obecná populace). Hlavní metodou vzorkování je vnitřní spojení, které spojuje části a celek, jednotlivce a obecné.

Metoda vzorkování má oproti ostatním řadu významných výhod, protože Díky snížení počtu pozorování umožňuje snížit množství vynaložené práce, peněz a úsilí a také úspěšně získávat data o takových procesech a jevech, kde je buď nepraktické nebo prostě nemožné je kompletně prostudovat.

Soulad charakteristik vzorku s charakteristikami studovaného jevu nebo procesu bude záviset na souboru podmínek a především na tom, jak bude metoda vzorkování implementována v praxi. Může to být buď systematický výběr podle připraveného schématu, nebo neplánovaný, když je vzorek tvořen z obecné populace.

Ale ve všech případech musí být metoda vzorkování typická a splňovat kritéria objektivity. Tyto požadavky musí být vždy splněny, protože korespondence mezi charakteristikami metody a charakteristikami toho, co je statisticky analyzováno, bude záviset na nich.

Před zpracováním vzorku materiálu je tedy nutné jej důkladně zkontrolovat a zbavit se tak všeho nepotřebného a nedůležitého. Zároveň se při sestavování ukázky bezpodmínečně vyvarujte jakékoliv amatérské činnosti. To znamená, že v žádném případě byste neměli vybírat pouze ty možnosti, které se zdají typické, a všechny ostatní zahodit.

Efektivní a kvalitní vzorek musí být vybrán objektivně, tzn. musí být provedeno tak, aby byly vyloučeny jakékoli subjektivní vlivy a zaujaté motivy. A aby tato podmínka byla správně splněna, je nutné uchýlit se k principu randomizace nebo jednodušeji k principu náhodného výběru možností z celé jejich populace.

Prezentovaný princip slouží jako základ pro teorii vzorkovací metody a je třeba se jím řídit vždy, když je potřeba vytvořit efektivní výběrovou populaci a případy systematického výběru zde nejsou výjimkou.

Korelační a regresní analýza

Korelační analýza a regresní analýza jsou dvě vysoce účinné metody, které vám umožňují analyzovat velké množství dat a studovat možný vztah dvou nebo více ukazatelů.

V případě korelační analýzy jsou cíle:

  • Změřte blízkost existujícího spojení mezi rozlišovacími charakteristikami;
  • Identifikujte neznámé kauzální vztahy;
  • Posuďte faktory, které nejvíce ovlivňují výslednou charakteristiku.

A v případě regresní analýzy jsou úkoly následující:

  • Určete formu komunikace;
  • Stanovit míru vlivu nezávislých ukazatelů na závislý;
  • Určete vypočítané hodnoty závislého ukazatele.

K vyřešení všech výše uvedených problémů je téměř vždy nutné použít jak korelační, tak regresní analýzu v kombinaci.

Dynamika série

Pomocí této metody statistické analýzy je velmi vhodné určit intenzitu nebo rychlost, s jakou se jevy vyvíjejí, najít trend jejich vývoje, zvýraznit výkyvy, porovnat dynamiku vývoje a najít vztah mezi jevy vyvíjejícími se v čase.

Dynamická řada je řada, ve které jsou v čase sekvenčně umístěny statistické ukazatele, jejichž změny charakterizují proces vývoje studovaného objektu nebo jevu.

Dynamická řada obsahuje dvě složky:

  • Období nebo časový okamžik spojený s dostupnými údaji;
  • Úroveň nebo statistický ukazatel.

Tyto složky dohromady představují dva členy časové řady, kde první člen (časové období) je označen písmenem „t“ a druhý (úroveň) písmenem „y“.

Na základě trvání časových intervalů, se kterými jsou úrovně propojeny, mohou být dynamické řady momentální a intervalové. Intervalové řady vám umožňují přidávat úrovně, abyste získali celkovou hodnotu období následujících po sobě, ale v momentových sériích taková možnost není, ale tam to není vyžadováno.

Časové řady také existují ve stejných a různých intervalech. Podstata intervalů v momentových a intervalových řadách je vždy jiná. V prvním případě je interval časový interval mezi daty, ke kterým se data pro analýzu váží (takovou řadu je vhodné použít např. pro určení počtu akcí za měsíc, rok apod.). A ve druhém případě časové období, ke kterému je připojena sada zobecněných dat (takovouto řadu lze použít ke zjištění kvality stejných akcí za měsíc, rok atd.). Intervaly mohou být stejné nebo různé, bez ohledu na typ série.

Abychom se naučili kompetentně aplikovat každou z metod statistické analýzy, přirozeně o nich nestačí jen vědět, protože statistika je ve skutečnosti celá věda, která také vyžaduje určité dovednosti a schopnosti. Ale aby to bylo jednodušší, můžete a měli byste trénovat své myšlení a...

Jinak výzkum, hodnocení, zpracování a analýza informací jsou velmi zajímavé procesy. A i v případech, kdy to nevede k žádnému konkrétnímu výsledku, se lze během výzkumu dozvědět mnoho zajímavého. Statistická analýza našla své uplatnění v obrovském množství oblastí lidské činnosti a využijete ji ve škole, práci, podnikání a dalších oblastech včetně rozvoje dítěte a sebevzdělávání.

Základy statistické analýzy dat

statistika"biostatistika".

1. jmenný;
2. řadový;
3. interval;

Vzorky

zástupce

selektivní rám jednoduchý náhodný výběr intervalové vzorkování

stratifikovaný vzorek

shluk A kvótní odběr vzorků

nulová hypotéza

alternativní hypotéza Napájení

pravděpodobnost spolehlivosti“.


Název: Základy statistické analýzy dat
Detailní popis:

Po dokončení jakéhokoli vědeckého výzkumu, základního nebo experimentálního, se provede statistická analýza získaných dat. Aby mohla být statistická analýza úspěšně provedena a vyřešeny zadané problémy, musí být studie správně naplánována. Bez pochopení základů statistiky tedy není možné plánovat a zpracovávat výsledky vědeckého experimentu. Medicínské vzdělání však neposkytuje nejen znalosti statistiky, ale dokonce ani základy vyšší matematiky. Velmi často se proto lze setkat s názorem, že otázkami statistického zpracování by se v biomedicínském výzkumu měl zabývat pouze statistik a lékař-výzkumník by se měl zaměřit na medicínskou problematiku své vědecké práce. Tato dělba práce, která zahrnuje asistenci při analýze dat, je zcela oprávněná. Pochopení principů statistiky je však nutné alespoň proto, aby se předešlo nesprávné formulaci problému před odborníkem, s nímž je komunikace před zahájením studia stejně důležitá jako ve fázi zpracování dat.

Než budeme hovořit o základech statistické analýzy, je nutné si ujasnit význam pojmu „ statistika". Existuje mnoho definic, ale nejúplnější a nejstručnější je podle našeho názoru definice statistiky jako „vědy o sběru, prezentaci a analýze dat“. Využití statistik při aplikaci na živý svět se zase nazývá „biometrie“ nebo „ biostatistika".

Je třeba poznamenat, že statistika se velmi často redukuje pouze na zpracování experimentálních dat, aniž by se věnovala pozornost fázi jejich získávání. Statistické znalosti jsou však nutné již při plánování experimentu, aby při něm získané ukazatele mohly poskytnout výzkumníkovi spolehlivé informace. Můžeme tedy říci, že statistická analýza experimentálních výsledků začíná ještě před zahájením studie.

Již ve fázi vývoje plánu musí výzkumník jasně pochopit, jaký typ proměnných bude v jeho práci. Všechny proměnné lze rozdělit do dvou tříd: kvalitativní a kvantitativní. Rozsah, který může proměnná zaujmout, závisí na měřítku měření. Lze rozlišit čtyři hlavní stupnice:

1. jmenný;
2. řadový;
3. interval;
4. racionální (škála vztahů).

Nominální škála (škála „jmén“) obsahuje pouze konvenční označení pro popis určitých tříd objektů, například „pohlaví“ nebo „profese pacienta“. Nominální měřítko znamená, že proměnná bude nabývat hodnot, jejichž kvantitativní vztahy nelze určit. Je tedy nemožné stanovit matematické vztahy mezi mužským a ženským pohlavím. Konvenční číselná označení (ženy - 0, muži - 1 nebo naopak) jsou uváděna zcela libovolně a jsou určena pouze pro počítačové zpracování. Nominální škála je kvalitativní ve své čisté podobě, jednotlivé kategorie v této škále jsou vyjádřeny četnostmi (počet nebo podíl pozorování, procenta).

Pořadová (ordinální) stupnice zajišťuje, že jednotlivé kategorie v ní mohou být uspořádány vzestupně nebo sestupně. V lékařské statistice je klasickým příkladem ordinální stupnice gradace stupňů závažnosti onemocnění. V tomto případě můžeme závažnost uspořádat vzestupně, ale stále nemáme možnost specifikovat kvantitativní vztahy, tj. vzdálenost mezi hodnotami naměřenými na ordinální stupnici je neznámá nebo nezáleží. Je snadné stanovit pořadí hodnot proměnné „závažnost“, ale není možné určit, kolikrát se těžký stav liší od středně těžkého stavu.

Pořadová škála se vztahuje k semikvantitativním typům dat a její gradace lze popsat jak četnostmi (jako v kvalitativní škále), tak mírami centrálních hodnot, o kterých pojednáme níže.

Intervalové a racionální škály jsou čistě kvantitativní typy dat. V intervalové škále již můžeme určit, jak moc se liší jedna hodnota proměnné od druhé. Zvýšení tělesné teploty o 1 stupeň Celsia tedy vždy znamená zvýšení tepla generovaného o pevný počet jednotek. Intervalová stupnice má však kladné i záporné hodnoty (neexistuje absolutní nula). V tomto ohledu nelze říci, že 20 stupňů Celsia je dvakrát teplejších než 10. Můžeme pouze konstatovat, že 20 stupňů je stejně teplejších než 10, jako je 30 teplejších než 20.

Racionální škála (škála vztahů) má jeden referenční bod a pouze kladné hodnoty. V medicíně jsou většinou racionální stupnice koncentrace. Například hladina glukózy 10 mmol/l je dvojnásobná koncentrace ve srovnání s 5 mmol/l. Pro teplotu je racionální stupnice Kelvinova stupnice, kde je absolutní nula (žádné teplo).

Je třeba dodat, že jakákoliv kvantitativní proměnná může být spojitá, jako v případě měření tělesné teploty (jedná se o spojitou intervalovou stupnici), nebo diskrétní, počítáme-li počet krvinek nebo potomků laboratorních zvířat (jedná se o diskrétní racionální měřítko).

Tyto rozdíly jsou klíčové pro volbu metod statistické analýzy experimentálních výsledků. Pro nominální data tedy aplikujeme chí-kvadrát test a známý Studentův test vyžaduje, aby proměnná (intervalová nebo racionální) byla spojitá.

Po vyřešení otázky typu proměnné byste měli začít vytvářet Vzorky. Vzorek je malá skupina předmětů určité třídy (v medicíně populace). Pro získání naprosto přesných dat je nutné prostudovat všechny objekty dané třídy, nicméně z praktických (často finančních) důvodů je studována pouze část populace, která se nazývá vzorek. Následně statistická analýza umožňuje výzkumníkovi rozšířit získané vzorce na celou populaci s určitou mírou přesnosti. Ve skutečnosti jsou všechny biomedicínské statistiky zaměřeny na získání co nejpřesnějších výsledků z co nejmenšího počtu pozorování, protože při výzkumu na lidech jsou důležité i etické ohledy. Nemůžeme si dovolit vystavit riziku více pacientů, než je nutné.

Vytvoření vzorku je regulováno řadou povinných požadavků, jejichž porušení může vést k chybným závěrům z výsledků výzkumu. Za prvé, velikost vzorku je důležitá. Přesnost odhadu studovaných parametrů závisí na velikosti vzorku. Zde byste měli věnovat pozornost slovu „přesnost“. Čím větší je velikost studovaných skupin, tím přesnější (ale ne nutně správné) výsledky vědec získá. Aby byly výsledky výběrových studií přenosné na celou populaci jako celek, musí být vzorek zástupce. Reprezentativnost vzorku předpokládá, že odráží všechny podstatné vlastnosti populace. Jinými slovy, ve zkoumaných skupinách se osoby různého pohlaví, věku, profese, sociálního postavení apod. vyskytují se stejnou frekvencí jako v celé populaci.

Než však začnete s výběrem studijní skupiny, měli byste určit potřebu studovat konkrétní populaci. Příkladem populace mohou být všichni pacienti s určitou nosologií nebo lidé v produktivním věku atd. Výsledky získané pro populaci mladých lidí ve vojenském věku tedy pravděpodobně nebudou extrapolovány na ženy po menopauze. Soubor charakteristik, které bude mít studovaná populace, určuje „zobecnění“ dat studie.

Vzorky mohou být vytvořeny různými způsoby. Nejjednodušší z nich je vybrat pomocí generátoru náhodných čísel požadovaný počet objektů z populace resp selektivní rám(vzorkovací rámeček). Tato metoda se nazývá " jednoduchý náhodný výběr" Pokud náhodně vyberete počáteční bod v rámci vzorkování a poté vezmete každý druhý, pátý nebo desátý objekt (podle toho, jaké velikosti skupin jsou ve studii vyžadovány), získáte intervalové vzorkování. Intervalové vzorkování není náhodné, protože možnost periodického opakování dat v rámci vzorkování není nikdy vyloučena.

Je možné vytvořit tzv. stratifikovaný vzorek“, který předpokládá, že populace se skládá z několika různých skupin a tato struktura by měla být reprodukována v experimentální skupině. Pokud je například poměr mužů a žen v populaci 30:70, pak by ve stratifikovaném vzorku měl být poměr stejný. Při tomto přístupu je kritické nepřevážit vzorek, to znamená vyhnout se homogenitě jeho charakteristik, jinak může výzkumník promeškat šanci najít rozdíly nebo vztahy v datech.

Kromě popsaných způsobů vytváření skupin existují také shluk A kvótní odběr vzorků. První se používá v případě, kdy je získání kompletní informace o ukázkovém rámci obtížné vzhledem k jeho velikosti. Poté je vzorek tvořen z několika skupin zahrnutých v populaci. Druhý - kvótový - je podobný stratifikovanému vzorkování, zde však rozložení objektů neodpovídá tomu v populaci.

Vrátíme-li se k velikosti vzorku, je třeba říci, že úzce souvisí s pravděpodobností statistických chyb prvního a druhého typu. Statistické chyby mohou být způsobeny tím, že studie nezkoumá celou populaci, ale její část. Chyba prvního typu je chybná odchylka nulová hypotéza. Nulová hypotéza je zase předpoklad, že všechny studované skupiny pocházejí ze stejné obecné populace, což znamená, že rozdíly nebo vztahy mezi nimi jsou náhodné. Pokud nakreslíme analogii s diagnostickými testy, pak chyba typu I je falešně pozitivní výsledek.

Chyba druhého typu je nesprávná odchylka. alternativní hypotéza, jehož význam je ten, že rozdíly nebo souvislosti mezi skupinami nejsou způsobeny náhodnou shodou okolností, ale vlivem zkoumaných faktorů. A opět analogie s diagnostikou: chyba typu II je falešně negativní výsledek. S touto chybou je spojen koncept Napájení, který nám říká, jak účinná je určitá statistická metoda za daných podmínek a její citlivost. Výkon se vypočítá pomocí vzorce: 1-β, kde β je pravděpodobnost chyby typu II. Tento ukazatel závisí především na velikosti vzorku. Čím větší jsou velikosti skupin, tím nižší je pravděpodobnost chyby typu II a tím vyšší je síla statistických testů. Tato závislost je přinejmenším kvadratická, to znamená, že zmenšení velikosti vzorku na polovinu povede k poklesu výkonu nejméně čtyřnásobně. Za minimální přijatelný výkon se považuje 80 % a za maximální přijatelnou úroveň chyby typu I 5 %. Vždy je však třeba pamatovat na to, že tyto hranice jsou stanoveny libovolně a mohou se měnit v závislosti na povaze a cílech studia. Vědecká komunita zpravidla uznává svévolnou změnu síly, ale v naprosté většině případů nemůže míra chyby I. typu překročit 5 %.

Vše výše uvedené přímo souvisí s fází plánování studie. Mnoho badatelů však mylně nahlíží na statistické zpracování dat pouze jako na nějakou manipulaci provedenou po dokončení hlavní části práce. Často se po dokončení neplánovaného experimentu objeví neodolatelná touha objednat analýzu statistických dat na straně. Ale z „hromady odpadků“ bude i pro statistika velmi obtížné vydolovat výsledek očekávaný výzkumníkem. Pokud tedy nemáte dostatečné znalosti biostatistiky, měli byste před zahájením experimentu vyhledat pomoc ve statistické analýze.

Pokud jde o samotný postup analýzy, měli bychom poukázat na dva hlavní typy statistických technik: deskriptivní a demonstrativní (analytické). Popisné techniky zahrnují metody, které umožňují prezentovat data v kompaktní a snadno srozumitelné formě. Patří mezi ně tabulky, grafy, četnosti (absolutní a relativní), míry centrální tendence (průměr, medián, modus) a míry rozptylu dat (rozptyl, směrodatná odchylka, mezikvartilní rozmezí atd.). Jinými slovy, popisné metody charakterizují studované vzorky.

Nejoblíbenějším (ačkoli často chybným) způsobem popisu dostupných kvantitativních dat je definování následujících ukazatelů:

  • počet pozorování ve vzorku nebo jeho velikost;
  • průměrná hodnota (aritmetický průměr);
  • směrodatná odchylka je měřítkem toho, jak široce se mění hodnoty proměnné.

Je důležité si uvědomit, že aritmetický průměr a směrodatná odchylka jsou mírou centrální tendence a rozptylu v poměrně malém počtu vzorků. V takových vzorcích se hodnoty většiny objektů odchylují od průměru se stejnou pravděpodobností a jejich rozložení tvoří symetrický „zvon“ (Gaussova nebo Gauss-Laplaceova křivka). Toto rozdělení se také nazývá „normální“, ale v praxi lékařských experimentů se vyskytuje pouze ve 30 % případů. Pokud jsou hodnoty proměnné rozloženy asymetricky vzhledem ke středu, pak je lepší skupiny popsat pomocí mediánu a kvantilů (percentily, kvartily, decily).

Po dokončení popisu skupin je nutné odpovědět na otázku o jejich vztazích a možnosti zobecnění výsledků studie na celou populaci. K tomuto účelu se používají biostatistické metody založené na důkazech. Právě ty si výzkumníci při statistickém zpracování dat vybaví jako první. Tato fáze práce se obvykle nazývá „testování statistických hypotéz“.

Úlohy testování hypotéz lze rozdělit do dvou velkých skupin. První skupina odpovídá na otázku, zda jsou mezi skupinami rozdíly v hladině některého ukazatele, např. rozdíly v hladině jaterních transamináz u pacientů s hepatitidou a zdravých lidí. Druhá skupina vám umožňuje prokázat existenci vztahu mezi dvěma nebo více ukazateli, například funkcí jater a imunitním systémem.

V praxi lze úkoly z první skupiny rozdělit do dvou podtypů:

  • srovnání ukazatele pouze ve dvou skupinách (zdraví a nemocní, muži a ženy);
  • srovnání tří a více skupin (studium různých dávek léku).

Je třeba vzít v úvahu, že statistické metody se výrazně liší pro kvalitativní a kvantitativní data.

V situaci, kdy je studovaná proměnná kvalitativní a porovnávají se pouze dvě skupiny, lze použít chí-kvadrát test. Toto je poměrně silné a široce známé kritérium, ale není dostatečně účinné, pokud je počet pozorování malý. Existuje několik metod k vyřešení tohoto problému, jako je Yatesova korekce kontinuity a Fisherova exaktní metoda.

Pokud je studovaná proměnná kvantitativní, lze použít jeden ze dvou typů statistických testů. Kritéria prvního typu vycházejí ze specifického typu rozložení populace a operují s parametry této populace. Takové testy se nazývají „parametrické“ a obvykle jsou založeny na předpokladu normálního rozdělení hodnot. Neparametrické testy nevycházejí z předpokladu o typu rozložení populace a nepoužívají její parametry. Někdy se taková kritéria nazývají „testy bez distribuce“. Do určité míry je to chybné, protože jakékoli neparametrické kritérium předpokládá, že distribuce ve všech porovnávaných skupinách budou stejná, jinak může dojít k falešně pozitivním výsledkům.

Existují dva parametrické testy aplikované na data extrahovaná z normálně rozdělené populace: Studentův t-test pro srovnání dvou skupin a Fisherův F-test pro testování rovnosti rozptylů (také známý jako analýza rozptylu). Neparametrických kritérií je mnohem více. Různé testy se od sebe liší v předpokladech, na kterých jsou založeny, ve složitosti výpočtů, ve statistické síle atd. Nejpřijatelnější jsou však ve většině případů Wilcoxonův test (pro příbuzné skupiny) a Mann-Whitney test , také známý jako test Wilcoxon pro nezávislé vzorky. Tyto testy jsou vhodné, protože nevyžadují předpoklady o povaze distribuce dat. Pokud se ale ukáže, že vzorky jsou odebírány z normálně rozložené populace, pak se jejich statistická síla nebude výrazně lišit od hodnoty Studentova testu.

Kompletní popis statistických metod lze nalézt v odborné literatuře, nicméně klíčové je, že každý statistický test vyžaduje soubor pravidel (předpokladů) a podmínek pro jeho použití a mechanické vyhledávání několika metod k nalezení „správného “ výsledek je z vědeckého hlediska absolutně nepřijatelný. V tomto smyslu jsou statistické testy podobné lékům - každý má indikace a kontraindikace, vedlejší účinky a pravděpodobnost neúčinnosti. A stejně nebezpečné je nekontrolované používání statistických testů, protože na nich jsou založeny hypotézy a závěry.

Pro lepší pochopení problematiky přesnosti statistické analýzy je nutné definovat a analyzovat pojem „ pravděpodobnost spolehlivosti“. Pravděpodobnost spolehlivosti je hodnota brána jako hranice mezi pravděpodobnými a nepravděpodobnými událostmi. Tradičně se označuje písmenem „p“. Pro mnoho výzkumníků je jediným účelem provádění statistické analýzy vypočítat kýženou p-hodnotu, což, jak se zdá, dává čárky do slavné fráze „poprava nemůže být prominuta“. Za maximální přijatelnou úroveň spolehlivosti se považuje 0,05. Je třeba mít na paměti, že pravděpodobnost pravděpodobnosti není pravděpodobnost nějaké události, ale věc důvěry. Nastavením pravděpodobnosti spolehlivosti před zahájením analýzy tak určíme míru spolehlivosti výsledků našeho výzkumu. A jak víte, přílišná důvěřivost a přílišná podezíravost stejně negativně ovlivňují výsledky jakékoli práce.

Úroveň spolehlivosti ukazuje, jakou maximální pravděpodobnost výskytu chyby typu I považuje výzkumník za přijatelnou. Snížení úrovně spolehlivosti, jinými slovy zpřísnění podmínek pro testování hypotéz, zvyšuje pravděpodobnost chyb druhého typu. Volba úrovně pravděpodobnosti spolehlivosti by proto měla být provedena s ohledem na možné škody způsobené výskytem chyb prvního a druhého typu. Například přísný rámec přijatý v biomedicínské statistice, který definuje podíl falešně pozitivních výsledků na maximálně 5 %, je naléhavou nutností, protože na základě výsledků lékařského výzkumu je zaváděna nebo odmítána nová léčba, a to pro tisíce lidí otázka života.

Je třeba mít na paměti, že samotná hodnota p není pro lékaře příliš informativní, protože pouze ukazuje na pravděpodobnost chybného zamítnutí nulové hypotézy. Tento ukazatel nevypovídá nic např. o velikosti léčebného efektu při použití zkoumaného léku v běžné populaci. Panuje proto názor, že místo úrovně pravděpodobnosti spolehlivosti by bylo lepší hodnotit výsledky studie velikostí intervalu spolehlivosti. Interval spolehlivosti je rozsah hodnot, ve kterém s určitou pravděpodobností leží skutečná hodnota populace (pro průměr, medián nebo frekvenci). V praxi je výhodnější mít obě tyto hodnoty, což umožňuje s větší jistotou posuzovat použitelnost získaných výsledků na populaci jako celek.

Na závěr je třeba říci několik slov o nástrojích používaných statistikem nebo výzkumníkem, který nezávisle provádí analýzu dat. Ruční výpočty jsou dávno pryč. Současné statistické počítačové programy umožňují provádět statistické analýzy bez vážného matematického tréninku. Takové výkonné systémy jako SPSS, SAS, R atd. umožňují výzkumníkovi používat komplexní a výkonné statistické metody. To však není vždy dobré. Bez znalosti míry použitelnosti použitých statistických testů na konkrétní experimentální data může výzkumník provádět výpočty a dokonce získat nějaká výstupní čísla, ale výsledek bude velmi pochybný. Předpokladem pro provádění statistického zpracování experimentálních výsledků proto musí být dobrá znalost matematických základů statistiky.




říct přátelům