1. Nástroje na štatistické spracovanie údajov v programe Excel

2. Používanie špeciálnych funkcií

3. Pomocou nástroja ANALÝZA BALÍK

Literatúra:

hlavný:

1. Burke. Analýza dát s Microsoft Excel. : Za. z angličtiny / Burke, Kenneth, Carey, Patrick. - M .: Vydavateľstvo „Williams“, 2005. - S. 216 - 256.

2. Mišin A.V. Informačné technológie v právnej činnosti: workshop / A.V. Mišin. - M.: RAP, 2013 .-- S. 2-11.

dodatočné:

3. Informatika pre právnikov a ekonómov: učebnica pre univerzity / Red. S.V. Simonovič. - SPb.: Peter, 2004. - S. 498-516.

Praktická lekcia číslo 30

Téma č. 11.1. Údržba databázy v Access DBMS

Lekcia je vedená pomocou projektovej metódy.

Cieľ projektu: vytvoriť databázu o práci súdu.

Technická úloha:

1. Vytvorte databázu „Súd“ z dvoch tabuliek „Sudcovia“ a „Pohľadávky“ s nasledujúcou štruktúrou:

Tabuľka „Sudcovia“

Názov poľa Kód sudcu CELÉ MENO Dni prijatia Pracovné hodiny Pracovné skúsenosti
Dátový typ Numerické Text Text Text Numerické
Veľkosť poľa Dlhé celé číslo Dlhé celé číslo
Formát poľa Hlavná Hlavná
Desatinné miesta
Predvolená hodnota „Streda“ „15: 00-17: 00“
Podmienka hodnoty \u003e 36200 A<36299 Po alebo Út alebo St alebo Št alebo Pia \u003e 0 A<40
Chybná správa Platné hodnoty sú pondelok, utorok, streda, štvrtok alebo piatok. Zadajte znova! ! Platné hodnoty sú od 1 do 39. Znova zadajte!
Požadované pole Áno Áno Nie Nie Nie
Indexované pole Nie Nie Nie Nie

Poznámka. Vyhláste kľúčové pole „Kód sudcu“.

Tabuľka poistných udalostí

Názov poľa Číslo prípadu Žalobca Odpoveď-kuriatko Kód sudcu Dátum stretnutia
Dátový typ Numerické Text Text Numerické Dátum Čas
Vlastnosti poľa: karta Všeobecné
Veľkosť poľa Dlhé celé číslo Dlhé celé číslo Celý formát dátumu
Formát poľa Hlavná
Desatinné miesta
Predvolená hodnota
Podmienka hodnoty \u003e 0 A<99999 \u003e 36200 A<36299
Chybná správa Nesprávny vstup - opakujte! Platné hodnoty sú od 36201 do 36298. Zadajte znova!
Požadované pole Áno Nie Nie Nie Nie
Indexované pole Áno (nie sú povolené žiadne zápasy) Nie Nie Áno (povolené zápasy) Nie

2. Do tabuľky Sudcovia zadajte nasledujúce dátové záznamy:

Do tabuľky Reklamácie zadajte tieto dátové záznamy:

3. Medzi tabuľkami v poli „Sudcovský zákonník“ vytvorte vzťah jedna k viacerým Sudcovia a Nároky... Pritom nastavte možnosti „Zaistiť integritu údajov“ a „Kaskádová aktualizácia prepojených polí“.

Literatúra:

hlavný:

1. Mišin A.V. Informačné technológie v odbornej činnosti: učebnica / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 259-264.

dodatočné:

Praktická lekcia číslo 31

Téma č. 11.2. Zásady vytvárania formulárov a dotazov v Access DBMS

1. Vývoj vstupných formulárov na zadávanie údajov.

2. Metodika výpočtu a analýzy zadaných údajov.

Literatúra:

hlavný:

1. Mišin A.V. Informačné technológie v odbornej činnosti: učebnica / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 265-271.

dodatočné:

2. Informatika a informačné technológie: učebnica pre študentov vysokých škôl / I.G. Lesnichaya, I.V. Chýba, Yu.D. Romanov, V.I. Šestakov. - 2. vyd. - M.: Eksmo, 2006. - 544 s.

3. Mikheeva E.V. Informačné technológie v odbornej činnosti: učebnica pre študentov stredných odborných škôl / E.V. Mikheeva. - 2. vyd., Vymazané. - M.: Akadémia, 2005. - 384 s.

Odošlite svoju dobrú prácu do znalostnej bázy je jednoduché. Použite nasledujúci formulár

Študenti, študenti postgraduálneho štúdia, mladí vedci, ktorí využívajú vedomostnú základňu pri štúdiu a práci, vám budú veľmi vďační.

Zverejnené na http://www.allbest.ru/

Štatistické spracovanie údajov

Úvod

korelácia štatistickej odchýlky

Metódy štatistického spracovania výsledkov experimentu sú matematické techniky, vzorce, metódy kvantitatívnych výpočtov, pomocou ktorých možno ukazovatele získané počas experimentu zovšeobecniť, vniesť do systému a odhaliť v nich ukryté zákony. Hovoríme o takých zákonitostiach štatistickej povahy, ktoré existujú medzi premennými študovanými v experimente.

Niektoré z metód matematickej a štatistickej analýzy umožňujú vypočítať takzvanú elementárnu matematickú štatistiku charakterizujúcu rozloženie vzoriek údajov, napríklad priemer vzorky, rozptyl vzorky, režim, medián a mnoho ďalších. Ďalšie metódy matematickej štatistiky, napríklad analýza variancie, regresná analýza, umožňujú posúdiť dynamiku zmien v jednotlivých štatistikách vzorky. Pomocou tretej skupiny metód, napríklad korelačnej analýzy, faktorovej analýzy, metód na porovnanie vzorových údajov, je možné spoľahlivo posúdiť štatistické vzťahy, ktoré existujú medzi premennými, ktoré sa v tomto experimente skúmajú.

1. Metódy primárneho štatistického spracovania experimentálnych výsledkov

Všetky metódy matematickej a štatistickej analýzy sú konvenčne rozdelené na primárne a sekundárne. Metódy, ktoré možno použiť na získanie ukazovateľov, ktoré priamo odrážajú výsledky meraní vykonaných v experimente, sa nazývajú primárne metódy. Primárne štatistické ukazovatele teda znamenajú tie, ktoré sa používajú v samotných psychodiagnostických metódach a sú výsledkom počiatočného štatistického spracovania výsledkov psychodiagnostiky. Zavolajú sa sekundárne metódy štatistického spracovania, pomocou ktorých sa na základe primárnych údajov odhalia štatistické vzorce v nich skryté.

Medzi primárne metódy štatistického spracovania patrí napríklad stanovenie priemeru vzorky, rozptylu vzorky, režimu vzorky a mediánu vzorky. Sekundárne metódy zvyčajne zahŕňajú korelačnú analýzu, regresnú analýzu, metódy na porovnanie primárnej štatistiky v dvoch alebo viacerých vzorkách.

Zvážte metódy výpočtu základnej matematickej štatistiky.

1.1 Móda

Číselnou charakteristikou vzorky, ktorá zvyčajne nevyžaduje výpočet, je takzvaný režim. Móda je kvantitatívna hodnota študovaného znaku, ktorá sa najčastejšie nachádza vo vzorke. Pre symetrické rozdelenia znakov vrátane normálneho rozdelenia sa hodnota režimu zhoduje s priemernými a strednými hodnotami. Pre iné asymetrické typy distribúcie to nie je typické. Napríklad v poradí hodnôt funkcií 1, 2, 5, 2, 4, 2, 6, 7, 2 je režimom hodnota 2, pretože sa vyskytuje častejšie ako iné hodnoty - štyrikrát.

Móda sa nachádza podľa nasledujúcich pravidiel:

1) V prípade, že sa všetky hodnoty vo vzorke vyskytujú rovnako často, je všeobecne akceptované, že táto séria vzoriek nemá žiadny režim. Napríklad: 5, 5, 6, 6, 7, 7 - v tejto vzorke nie je móda.

2) Keď majú dve susedné (susedné) hodnoty rovnakú frekvenciu a ich frekvencia je vyššia ako frekvencia akýchkoľvek iných hodnôt, režim sa počíta ako aritmetický priemer týchto dvoch hodnôt. Napríklad vo vzorke 1, 2, 2, 2, 5, 5, 5, 6 sa frekvencie susedných hodnôt 2 a 5 zhodujú a rovnajú sa 3. Táto frekvencia je väčšia ako frekvencia ostatných hodnôt 1 a 6 (pre ktoré sa rovná 1). Preto bude režim tejto série mať hodnotu \u003d 3,5

3) Ak majú dve nesusediace (nesusediace) hodnoty vo vzorke rovnaké frekvencie, ktoré sú vyššie ako frekvencie akejkoľvek inej hodnoty, rozlišujú sa dva režimy. Napríklad v riadku 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 sú režimy 11 a 14. V tomto prípade sa hovorí, že vzorka je bimodálna.

Môžu existovať aj takzvané multimodálne distribúcie s viac ako dvoma vrcholmi (režimy).

4) Ak sa režim odhaduje na základe súboru zoskupených údajov, potom je na nájdenie režimu potrebné určiť skupinu s najvyššou frekvenciou vlastnosti. Táto skupina sa nazýva modálna skupina.

1,2 Medián

Medián je hodnota skúmaného znaku, ktorá rozdeľuje vzorku usporiadanú podľa hodnoty tohto znaku na polovicu. Napravo a naľavo od mediánu zostáva v usporiadanom riadku rovnaký počet prvkov. Napríklad pre vzorku 2, 3, 4, 4, 5, 6, 8, 7, 9 bude medián 5, pretože naľavo a napravo od nej sú štyri indikátory. Ak séria obsahuje párny počet znakov, potom bude medián priemer považovaný za polovičný súčet hodnôt dvoch centrálnych hodnôt série. Pre ďalší riadok 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 bude medián 3,5.

Poznanie mediánu je užitočné pri určovaní, či je rozdelenie konkrétnych hodnôt študovaného znaku symetrické a blíži sa k takzvanému normálnemu rozdeleniu. Priemer a medián normálneho rozdelenia sa zvyčajne zhodujú alebo sa navzájom líšia len veľmi málo. Ak je rozdelenie charakteristík vzorky normálne, potom na ňu možno použiť metódy sekundárnych štatistických výpočtov založené na normálnom rozdelení údajov. Inak to nemožno urobiť, pretože do výpočtov sa môžu vkradnúť závažné chyby.

1.3 Priemer vzorky

Priemerná hodnota (aritmetický priemer) vzorky ako štatistický ukazovateľ je priemerným odhadom psychologickej kvality študovanej v experimente. Toto hodnotenie charakterizuje stupeň jeho vývoja ako celku v skupine subjektov, ktoré boli podrobené psychodiagnostickému vyšetreniu. Priamym porovnaním stredných hodnôt dvoch alebo viacerých vzoriek môžeme posúdiť relatívny stupeň vývoja u ľudí tvoriacich tieto vzorky a hodnotenú kvalitu.

1.4 Vzorková nátierka

Rozpätie (niekedy sa táto hodnota nazýva rozsah) vzorky sa označuje písmenom R. Toto je najjednoduchší indikátor, ktorý je možné pre vzorku získať - rozdiel medzi maximálnymi a minimálnymi hodnotami daného variačného radu, t.

R \u003d xmax - xmin

Je zrejmé, že čím viac sa líši nameraná charakteristika, tým vyššia je hodnota R a naopak. Môže sa však stať, že pre dve série vzoriek sa stredná hodnota aj rozsah zhodujú, ale povaha variácie týchto sérií bude odlišná. Napríklad sú uvedené dve vzorky:

X \u003d 10 15 20 25 30 35 40 45 50 X \u003d 30 R \u003d 40

Y \u003d 10 28 28 30 30 30 32 32 50 Y \u003d 30 R \u003d 40

Pri rovnosti prostriedkov a rozptylu pre tieto dve série vzoriek je povaha ich variácií odlišná. Aby sme jasnejšie pochopili podstatu variácií vo vzorkách, mali by sme sa odvolať na ich distribúciu.

1.5 Rozptyl

Rozptyl je aritmetický priemer štvorcov odchýlok hodnôt premennej od jej priemeru.

Odchýlka ako štatistika charakterizuje, ako veľmi sa jednotlivé hodnoty odchyľujú od priemeru v danej vzorke. Čím väčšia je odchýlka, tým väčšia je odchýlka alebo rozptyl v dátach.

Druhá odmocnina sa extrahuje zo súčtu druhých mocnín vydelených počtom členov v rade.

Niekedy existuje pomerne veľa počiatočných súkromných primárnych údajov, ktoré sú predmetom štatistického spracovania, a vyžadujú obrovské množstvo elementárnych aritmetických operácií. S cieľom znížiť ich počet a zároveň zachovať požadovanú presnosť výpočtov sa niekedy uchýli k nahradeniu pôvodnej vzorky konkrétnych empirických údajov intervalmi. Interval je skupina charakteristických hodnôt zoradených podľa hodnoty, ktorá je nahradená priemernou hodnotou v procese výpočtu.

2. Metódy sekundárneho štatistického spracovania experimentálnych výsledkov

Pomocou sekundárnych metód štatistického spracovania experimentálnych údajov sú hypotézy spojené s experimentom priamo overené, dokázané alebo vyvrátené. Tieto metódy sú spravidla komplikovanejšie ako metódy primárneho štatistického spracovania a od výskumného pracovníka v oblasti elementárnej matematiky a štatistiky si vyžadujú dobrú prípravu. (7).

Diskutovanú skupinu metód možno rozdeliť do niekoľkých podskupín:

1. Regresný počet.

2. Metódy porovnania dvoch alebo viacerých základných štatistík (priemerov, odchýlok atď.) Týkajúcich sa rôznych vzoriek.

3. Metódy stanovenia štatistických vzťahov medzi premennými, napríklad ich vzájomná korelácia.

4. Metódy identifikácie vnútornej štatistickej štruktúry empirických údajov (napríklad faktorová analýza). Uvažujme každú z vybraných podskupín metód sekundárneho štatistického spracovania na príkladoch.

2.1 Regresný počet

Regresný počet je metóda matematickej štatistiky, ktorá umožňuje redukovať súkromné, nesúrodé údaje na určitý spojnicový graf, ktorý približne odráža ich vnútorné prepojenie, a získať schopnosť zhruba odhadnúť pravdepodobnú hodnotu inej premennej o hodnotu jednej z premenných (7).

Grafické vyjadrenie regresnej rovnice sa nazýva regresná priamka. Regresná priamka vyjadruje najlepšie predpovede závislej premennej (Y) pre nezávislé premenné (X).

Regresia sa vyjadruje pomocou dvoch regresných rovníc, ktoré v najpriamejšom prípade vyzerajú ako rovné priamky.

Y \u003d a 0 + a 1 * X

X \u003d b 0 + b 1 * Y

V rovnici (1) Y je závislá premenná, X je nezávislá premenná, a 0 je intercept, a 1 je regresný koeficient alebo sklon, ktorý určuje sklon regresnej priamky vzhľadom na osi súradníc.

V rovnici (2) je X závislá premenná, Y je nezávislá premenná, b 0 je priesečník, b 1 je regresný koeficient alebo sklon, ktorý určuje sklon regresnej priamky vzhľadom na osi súradníc.

Kvantifikácia vzťahu (vzťahu) medzi X a Y (medzi Y a X) sa nazýva regresná analýza. Hlavnou úlohou regresnej analýzy je nájsť koeficienty a 0, b 0, a1 a b 1 a určiť úroveň významnosti získaných analytických výrazov spájajúcich premenné X a Y.

Ak chcete použiť metódu lineárnej regresnej analýzy, musia byť splnené tieto podmienky:

1. Porovnávané premenné X a Y by sa mali merať na škále intervalov alebo pomerov.

2. Predpokladá sa, že premenné X a Y majú normálne rozdelenie.

3. Počet rôznych znakov v porovnávaných premenných by mal byť rovnaký. (päť).

2.2 Korelácia

Ďalšia metóda sekundárneho štatistického spracovania, pomocou ktorej je objasnený vzťah alebo priamy vzťah medzi dvoma radmi experimentálnych údajov, sa nazýva korelačná metóda. Ukazuje, ako jeden jav ovplyvňuje druhý alebo s ním súvisí vo svojej dynamike. Tento druh vzťahu existuje napríklad medzi veličinami, ktoré sú v kauzálnych vzťahoch navzájom. Ak sa ukáže, že dva javy navzájom štatisticky významne korelujú a ak súčasne existuje dôvera, že jeden z nich môže pôsobiť ako príčina druhého javu, potom jednoznačne nasleduje záver, že medzi nimi existuje príčinná súvislosť. (7)

Keď je zvýšenie hladiny jednej premennej sprevádzané zvýšením úrovne druhej, potom hovoríme o pozitívnej korelácii. Ak dôjde k rastu jednej premennej so znížením úrovne druhej, potom hovorí o negatívnej korelácii. Pri absencii spojenia medzi premennými máme do činenia s nulovou koreláciou. (1)

Existuje niekoľko variácií tejto metódy: lineárne, hodnotené, spárované a viacnásobné. Analýza lineárnej korelácie umožňuje nadviazať priame vzťahy medzi premennými podľa ich absolútnych hodnôt. Tieto spojenia sú graficky vyjadrené ako priama čiara, odtiaľ pochádza aj názov „lineárny“. Korelačná hodnosť určuje závislosť nie medzi absolútnymi hodnotami premenných, ale medzi ordinálnymi miestami alebo nimi obsadenými radmi v poradí. Analýza párových korelácií zahŕňa štúdium korelácií iba medzi pármi premenných a medzi viacerými premennými súčasne - medzi viacerými premennými. Faktorová analýza je rozšírená forma mnohorozmernej korelačnej analýzy v aplikovanej štatistike. (päť)

Koeficient korelácie radov v psychologickom a pedagogickom výskume sa rieši v prípade, keď sú znaky, medzi ktorými je závislosť zistená, kvalitatívne odlišné a nemožno ich presne vyhodnotiť pomocou takzvanej intervalovej meracej škály. Intervalová stupnica sa nazýva stupnica, ktorá umožňuje odhadnúť vzdialenosť medzi jej hodnotami a posúdiť, ktorá z nich je väčšia a o koľko väčšia ako ostatné. Napríklad pravítkom používaným na hodnotenie a porovnávanie dĺžok objektov je intervalová stupnica, pretože pri jeho použití môžeme povedať, že vzdialenosť medzi dvoma a šiestimi centimetrami je dvakrát väčšia ako vzdialenosť medzi šiestimi a ôsmimi centimetrami. Ak pomocou niektorého meracieho prístroja môžeme iba tvrdiť, že niektoré ukazovatele sú viac ako iné, ale nie sú schopné povedať koľko, potom sa taký merací prístroj nazýva nie intervalový, ale poradový.

Väčšina ukazovateľov získaných v psychologickom a pedagogickom výskume sa týka skôr radových ako intervalových škál (napríklad hodnotenia ako „áno“, „nie“, „skôr nie ako áno“ a ďalšie, ktoré je možné previesť na body), preto na ne lineárny korelačný koeficient nie je použiteľný.

Metóda viacnásobných korelácií, na rozdiel od metódy párových korelácií, umožňuje odhaliť všeobecnú štruktúru korelačných závislostí existujúcich v rámci multidimenzionálneho experimentálneho materiálu, ktorý obsahuje viac ako dve premenné, a tieto korelačné závislosti prezentovať vo forme určitého systému.

Ak chcete použiť konkrétny korelačný koeficient, musia byť splnené tieto podmienky:

1. Porovnávané premenné by sa mali merať na škále intervalov alebo pomerov.

2. Predpokladá sa, že všetky premenné majú normálne rozdelenie.

3. Počet rôznych znakov v porovnávaných premenných by mal byť rovnaký.

4. Na posúdenie úrovne spoľahlivosti Pearsonovho korelačného pomeru by sa mal použiť vzorec (11.9) a tabuľka kritických hodnôt pre Studentov t-test pri k \u003d n - 2. (5)

2.3 Faktorová analýza

Faktorová analýza je štatistická metóda, ktorá sa používa pri spracovaní veľkého množstva experimentálnych údajov. Úlohami faktorovej analýzy sú: znižovanie počtu premenných (redukcia dát) a určovanie štruktúry vzťahov medzi premennými, t.j. klasifikácia premenných, preto sa faktorová analýza používa ako metóda redukcie údajov alebo ako metóda štrukturálnej klasifikácie.

Dôležitým rozdielom medzi faktorovou analýzou a všetkými vyššie opísanými metódami je, že ju nemožno použiť na spracovanie primárnych, alebo, ako sa hovorí, „surových“ experimentálnych údajov, t. získané priamo z skúšky predmetov. Materiálom pre faktorovú analýzu sú korelačné väzby, respektíve Pearsonove korelačné koeficienty, ktoré sa počítajú medzi premennými (t. J. Psychologickými charakteristikami) zahrnutými do prieskumu. Inými slovami, korelačné matice alebo, ako sa inak nazývajú, interkorelačné matice, sa podrobia faktorovej analýze. Názvy stĺpcov a riadkov v týchto maticiach sú rovnaké, pretože predstavujú zoznam premenných zahrnutých v analýze. Z tohto dôvodu sú interkorelačné matice vždy štvorcové, t.j. počet riadkov v nich sa rovná počtu stĺpcov, a symetrický, t.j. na symetrických miestach vzhľadom na hlavnú uhlopriečku existujú rovnaké korelačné koeficienty.

Hlavným konceptom faktorovej analýzy je faktor. Jedná sa o umelý štatistický ukazovateľ, ktorý vzniká v dôsledku špeciálnych transformácií tabuľky korelačných koeficientov medzi študovanými psychologickými charakteristikami alebo matice interkorelácie. Postup extrakcie faktorov z interkorelačnej matice sa nazýva maticová faktorizácia. V dôsledku faktorizácie je možné z korelačnej matice vyťažiť rôzny počet faktorov, a to až do počtu rovnajúceho sa počtu počiatočných premenných. Faktory identifikované v dôsledku faktorizácie sú však spravidla nerovnaké. (päť)

Zistené faktory vysvetľujú vzájomnú závislosť psychologických javov. (7)

Najčastejšie sa na základe faktorovej analýzy nezistí jeden, ale niekoľko faktorov, ktoré rôznymi spôsobmi vysvetľujú interkorelačnú maticu premenných. V tomto prípade sa faktory delia na všeobecné, všeobecné a individuálne faktory. Všeobecnými faktormi sú tie faktory, ktorých všetky faktorové zaťaženia sa výrazne líšia od nuly (nulové zaťaženie naznačuje, že táto premenná nie je nijako spojená so zvyškom a nemá na ne v živote žiadny vplyv). Spoločnými faktormi sú faktory, pre ktoré sú niektoré faktorové zaťaženia nenulové. Jednotlivé faktory sú faktory, pri ktorých sa iba jedno zo zaťažení výrazne líši od nuly. (7)

Faktorová analýza môže byť vhodná, ak sú splnené nasledujúce kritériá.

1. Nie je možné faktorizovať kvalitatívne údaje získané z rozsahu mien, napríklad farby vlasov (čierna / gaštanová / červená) atď.

2. Všetky premenné by mali byť nezávislé a ich rozdelenie by sa malo približovať normálu.

3. Vzťahy medzi premennými by mali byť približne lineárne alebo aspoň nie jasne krivočiare.

4. Pôvodná korelačná matica musí mať niekoľko korelácií v absolútnej hodnote nad 0,3. Inak je dosť ťažké z matice vyťažiť akékoľvek faktory.

5. Vzorka subjektov by mala byť dostatočne veľká. Rady odborníkov sa líšia. Najprísnejšie hľadisko odporúča neaplikovať faktorovú analýzu, ak je počet subjektov menší ako 100, pretože štandardné chyby korelácie v tomto prípade budú príliš veľké.

Ak sú však faktory dobre definované (napríklad pri zaťažení 0,7 namiesto 0,3), experimentátor potrebuje na ich izoláciu menšiu vzorku. Okrem toho, ak je známe, že získané údaje sú vysoko spoľahlivé (používajú sa napríklad platné testy), je možné ich analyzovať pre menší počet subjektov. (päť).

2.4 Apomocou faktorovej analýzy

Faktorová analýza je v psychológii široko používaná v rôznych smeroch týkajúcich sa riešenia teoretických aj praktických problémov.

Teoreticky je použitie faktorovej analýzy spojené s rozvojom tzv. Faktorovo-analytického prístupu k štúdiu štruktúry osobnosti, temperamentu a schopností. Použitie faktorovej analýzy v týchto oblastiach je založené na všeobecne akceptovanom predpoklade, že pozorovateľné a priamo merateľné ukazovatele sú iba nepriamymi a / alebo čiastočnými vonkajšími prejavmi všeobecnejších charakteristík. Tieto charakteristiky, na rozdiel od tých prvých, sú latentné, takzvané latentné premenné, pretože sú to koncepty alebo konštrukty, ktoré nie sú k dispozícii na priame meranie. Môžu sa však zistiť faktorovaním korelácií medzi pozorovanými znakmi a identifikáciou faktorov, ktoré (za predpokladu, že je štruktúra dobrá) možno interpretovať ako štatistické vyjadrenie požadovanej latentnej premennej.

Aj keď majú faktory čisto matematickú povahu, predpokladá sa, že predstavujú skryté premenné (teoreticky postulované konštrukty alebo koncepty), preto názvy faktorov často odrážajú podstatu skúmaného hypotetického konštruktu.

V súčasnosti je faktorová analýza široko používaná v diferenciálnej psychológii a psychodiagnostike. S jeho pomocou môžete navrhnúť testy, vytvoriť štruktúru prepojení medzi jednotlivými psychologickými charakteristikami meranými pomocou sady testov alebo testovaných položiek.

Faktorová analýza sa tiež používa na štandardizáciu testovacích metód, ktoré sa vykonávajú na reprezentatívnej vzorke subjektov.

Záver

Ak sú údaje získané v experimente kvalitatívneho charakteru, potom správnosť záverov vyvodených na základe ich záverov úplne závisí od intuície, erudície a profesionality výskumníka, ako aj od logiky jeho uvažovania. Ak sú tieto údaje kvantitatívneho typu, najskôr sa uskutoční ich primárne a potom sekundárne štatistické spracovanie. Primárne štatistické spracovanie spočíva v určení požadovaného počtu elementárnych matematických štatistík. Takéto spracovanie takmer vždy zahŕňa aspoň vzorový priemer. V prípadoch, keď je rozšírenie relatívnych priemerných údajov informatívnym ukazovateľom pre experimentálne testovanie navrhovaných hypotéz, sa vypočíta odchýlka alebo štandardná odchýlka. Hodnota mediánu sa odporúča vypočítať, ak sa majú použiť metódy sekundárneho štatistického spracovania vypočítané z normálneho rozdelenia. Pre tento druh distribúcie vzorových údajov sa medián, ako aj režim, zhodujú alebo sú dostatočne podobné priemernej hodnote. Toto kritérium možno použiť na hrubé posúdenie povahy výsledného rozdelenia primárnych údajov.

Sekundárne štatistické spracovanie (porovnanie priemerov, odchýlok, distribúcie údajov, regresná analýza, korelačná analýza, faktorová analýza atď.) Sa vykonáva, ak je na účely riešenia problémov alebo dokázania navrhovaných hypotéz potrebné určiť štatistické vzorce skryté v primárnych experimentálnych dátach. Pri spustení sekundárneho štatistického spracovania musí výskumník najskôr rozhodnúť, ktorá z rôznych sekundárnych štatistík by sa mala použiť na spracovanie primárnych experimentálnych údajov. Rozhodnutie sa prijíma na základe zohľadnenia povahy testovanej hypotézy a povahy primárneho materiálu získaného v dôsledku experimentu. V tejto súvislosti uvádzam niekoľko odporúčaní.

Odporúčanie 1. Ak experimentálna hypotéza obsahuje predpoklad, že v dôsledku psychologického a pedagogického výskumu sa zvýšia (alebo znížia) ukazovatele akejkoľvek kvality, potom sa na porovnanie údajov pred experimentom a po experimente odporúča použiť Studentovo kritérium alebo kritérium ch2. Posledná zmienka sa označuje, ak sú primárne experimentálne údaje relatívne a vyjadrené napríklad v percentách.

Odporúčanie 2. Ak experimentálne testovaná hypotéza obsahuje vyhlásenie o kauzálnom vzťahu medzi niektorými premennými, potom je vhodné ju otestovať pomocou koeficientov lineárnej alebo rankovej korelácie. Lineárna korelácia sa používa, keď sa nezávislé a závislé premenné merajú pomocou intervalovej škály a zmeny v týchto premenných pred a po experimente sú malé. Korelačná korelácia sa označuje vtedy, keď stačí vyhodnotiť zmeny v postupnosti z hľadiska nezávislých a závislých premenných, alebo keď sú ich zmeny dostatočne veľké, alebo keď bol merací prístroj ordinálny, nie intervalový.

Odporúčanie 3. Niekedy hypotéza obsahuje predpoklad, že experiment zvýši alebo zníži individuálne rozdiely medzi subjektmi. Tento predpoklad je dobre overený pomocou Fisherovho testu, ktorý umožňuje porovnanie odchýlok pred a po experimente. Upozorňujeme, že pomocou Fisherovho kritéria je možné pracovať iba s absolútnymi hodnotami ukazovateľov, nie však s ich hodnotami.

Zverejnené na Allbest.ru

...

Podobné dokumenty

    Základné techniky a metódy spracovania a analýzy štatistických údajov. Počet aritmetických, harmonických a geometrických stredných hodnôt. Distribučné rady, ich hlavné charakteristiky. Techniky nastavenia blízke dynamike. Systém národných účtov.

    semestrálna práca, pridané 24. 10. 2014

    Pojem ekonomická analýza ako veda, jej podstata, predmet, všeobecné charakteristiky metód a sociálno-ekonomická efektívnosť. Hlavné skupiny ekonometrických metód analýzy a spracovania údajov. Faktorová analýza ekonomických údajov podniku.

    abstrakt, pridané 3. 4. 2010

    Aritmetický priemer vzorky, rozptyl, štandardná odchýlka. Zamietnutie podľa chauvinetského kritéria. Pravidlo troch sigiem. Posúdenie významnosti rozdielu medzi strednými hodnotami dvoch vzoriek. Spárované, viacnásobné regresné analýzy. Kompletná faktorová analýza.

    semestrálna práca, pridané 5. 5. 2012

    Aplikácia rôznych metód prezentácie a spracovania štatistických údajov. Priestorové štatistické vzorky. Párová regresia a korelácia. Časové rady. Budovanie trendu. Praktické príklady a metódy ich riešenia, vzorce a ich význam.

    prednáškový kurz, pridané 26.02.2009

    Štatistické spracovanie výsledkov meraní; aritmetický priemer, kvadratický, rozptyl. Stanovenie parametrov vzorky: zákon troch sigma, histogram, kontrolné diagramy, Ishikawov diagram. Používanie kvalitného náradia pri výrobe sedacích súprav.

    seminárna práca pridaná 17.10.2014

    Priemerná hodnota v štatistike, jej podstata a podmienky použitia. Typy a formy priemerov: prítomnosťou atribútu-váha, formou výpočtu, pokrytím populácie. Móda, medián. Štatistická štúdia dynamiky zisku a ziskovosti na príklade spoločnosti Bashmebel OJSC.

    test, pridané 14.06.2008

    Princípy štatistického spracovania údajov, metódy a techniky použité v tomto procese. Metodika a hlavné etapy regulačných diagramov budov, ich klasifikácia a typy, funkčné vlastnosti, identifikácia výhod a nevýhod použitia.

    semestrálna práca pridaná 23. 8. 2014

    Výpočet numerických charakteristík a spracovanie výsledkov pozorovaní vzoriek. Výpočet a analýza štatistických ukazovateľov v ekonomike. Národné bohatstvo: prvky, hodnotenie; zostatok aktív a pasív; fixné aktíva, ukazovatele pracovného kapitálu.

    semestrálna práca, pridané 25. 12. 2012

    Popisná štatistika a štatistická inferencia. Metódy výberu na zabezpečenie reprezentatívnosti vzorky. Vplyv typu vzorky na veľkosť chyby. Úlohy pri uplatňovaní metódy odberu vzoriek. Šírenie údajov z pozorovania medzi bežnú populáciu.

    test, pridané 27.02.2011

    Zverejnenie pojmu: intervalová škála, aritmetický priemer, úroveň štatistickej významnosti. Ako interpretovať módu, medián a priemer. Riešenie problémov pomocou kritéria Friedman, Rosenbaum. Výpočet Sprimenovho korelačného koeficientu.

Prednáška 12. Metódy štatistického spracovania výsledkov.

Metódy štatistického spracovania výsledkov sú matematické techniky, vzorce, metódy kvantitatívnych výpočtov, pomocou ktorých možno ukazovatele získané v priebehu experimentu zovšeobecniť, vniesť do systému a odhaľovať v nich ukryté vzorce. Hovoríme o takých zákonitostiach štatistickej povahy, ktoré existujú medzi premennými študovanými v experimente.

1. Metódy primárneho štatistického spracovania experimentálnych výsledkov

Všetky metódy matematickej a štatistickej analýzy sú konvenčne rozdelené na primárne a sekundárne. Metódy, ktoré možno použiť na získanie ukazovateľov, ktoré priamo odrážajú výsledky meraní vykonaných v experimente, sa nazývajú primárne metódy. Primárne štatistické ukazovatele teda znamenajú tie, ktoré sa používajú v samotných psychodiagnostických metódach a sú výsledkom počiatočného štatistického spracovania výsledkov psychodiagnostiky. Zavolajú sa sekundárne metódy štatistického spracovania, pomocou ktorých sa na základe primárnych údajov odhalia štatistické vzorce v nich skryté.

Medzi primárne metódy štatistického spracovania patrí napríklad stanovenie priemeru vzorky, rozptylu vzorky, režimu vzorky a mediánu vzorky. Sekundárne metódy zvyčajne zahŕňajú korelačnú analýzu, regresnú analýzu, metódy na porovnanie primárnej štatistiky v dvoch alebo viacerých vzorkách.

Zvážte metódy výpočtu základnej matematickej štatistiky.

Móda sa nazýva kvantitatívna hodnota sledovaného znaku, ktorá sa najčastejšie nachádza vo vzorke.

Medián volá sa hodnota študovaného znaku, ktorá rozdelí vzorku zoradenú podľa hodnoty tohto znaku na polovicu.

Priemer vzorky (aritmetický priemer) hodnota ako štatistický ukazovateľ je priemerné hodnotenie psychologickej kvality študovanej v experimente.

Rozptyl(niekedy sa táto hodnota nazýva rozsah) vzorky je označená písmenom R. Toto je najjednoduchší indikátor, ktorý je možné pre vzorku získať - rozdiel medzi maximálnymi a minimálnymi hodnotami daného variačného radu.

Rozptylje aritmetický priemer štvorcov odchýlok hodnôt premennej od jej priemeru.

2. Metódy sekundárneho štatistického spracovania experimentálnych výsledkov

Pomocou sekundárnych metód štatistického spracovania experimentálnych údajov sú hypotézy spojené s experimentom priamo overené, dokázané alebo vyvrátené. Tieto metódy sú spravidla komplikovanejšie ako metódy primárneho štatistického spracovania a od výskumného pracovníka v oblasti elementárnej matematiky a štatistiky si vyžadujú dobrú prípravu.

Diskutovanú skupinu metód možno rozdeliť do niekoľkých podskupín:

1 Regresný počet

Regresný počet je metóda matematickej štatistiky, ktorá umožňuje redukovať súkromné, rôznorodé údaje na určitý spojnicový graf, ktorý približne odráža ich vnútorné prepojenie, a získať schopnosť zhruba odhadnúť pravdepodobnú hodnotu inej premennej hodnotou jednej z premenných.

2. Korelácia

Ďalšia metóda sekundárneho štatistického spracovania, prostredníctvom ktorej sa objasní spojenie alebo priamy vzťah medzi dvoma radmi experimentálnych údajov, sa nazýva korelačná metóda. Ukazuje, ako jeden jav ovplyvňuje druhý alebo s ním súvisí vo svojej dynamike. Tento druh vzťahu existuje napríklad medzi veličinami, ktoré sú v kauzálnych vzťahoch navzájom. Ak sa ukáže, že dva javy štatisticky spoľahlivo korelujú, a ak je súčasne istota, že jeden z nich môže pôsobiť ako príčina druhého javu, potom z toho jednoznačne vyplýva záver, že medzi nimi existuje príčinná súvislosť.

3 Faktorová analýza

Faktorová analýza je štatistická metóda, ktorá sa používa pri spracovaní veľkého množstva experimentálnych údajov. Úlohami faktorovej analýzy sú: znižovanie počtu premenných (redukcia dát) a určovanie štruktúry vzťahov medzi premennými, t.j. klasifikácia premenných, preto sa faktorová analýza používa ako metóda redukcie údajov alebo ako metóda štrukturálnej klasifikácie.

Skontrolujte otázky

1. Čo sú metódy štatistického spracovania?

2. Do akých podskupín sú rozdelené sekundárne metódy štatistického spracovania?

3. Vysvetlite podstatu korelačnej metódy?

4. V akých prípadoch sa používajú metódy štatistického spracovania?

5. Aké účinné je podľa vášho názoru použitie metód štatistického spracovania vo vedeckom výskume?

2. Zvážte vlastnosti metód štatistického spracovania údajov.

Literatúra

1 .. Gorbatov D.S. Cvičenie z psychologického výskumu: Učebnica. príspevok. - Samara: „BAHRAKH - M“, 2003. - 272 s.

2. Ermolaev A.Yu. Matematická štatistika pre psychológov. - M.: Moskovský psychologický a sociálny inštitút: Flint, 2003,336s.

3. Kornilova T.V. Úvod do psychologického experimentu. Učebnica pre univerzity. Moskva: Vydavateľstvo CheRo, 2001.

Laboratórne práce č. Štatistické spracovanie údajov v systéme MatLab

Všeobecné vyhlásenie o probléme

Hlavným účelom laboratórnej práce je oboznámiť so základmi práce so štatistickým spracovaním údajov v prostredí MatLAB.

Teoretická časť

Primárne štatistické spracovanie údajov

Štatistické spracovanie údajov je založené na primárnych a sekundárnych kvantitatívnych metódach. Účelom primárneho spracovania štatistických údajov je štruktúrovať získané informácie, čo znamená zoskupenie údajov do kontingenčných tabuliek podľa rôznych parametrov. Primárne údaje by mali byť prezentované v takom formáte, aby osoba mohla približne vyhodnotiť získaný súbor údajov a odhaliť informácie o distribúcii údajov prijatej vzorky údajov, napríklad o homogenite alebo kompaktnosti údajov. Po primárnej analýze údajov sa uplatnia metódy sekundárneho štatistického spracovania údajov, na základe ktorých sa v existujúcom súbore údajov určujú štatistické vzorce.

Vykonávanie primárnej štatistickej analýzy na súbore údajov vám umožňuje získať vedomosti o nasledujúcich témach:

Aká je najreprezentatívnejšia hodnota pre vzorku? Na zodpovedanie tejto otázky sú určené miery ústredného trendu.

Je rozptyl v dátach relatívny k tejto charakteristickej hodnote veľký, tj. Čo znamená „rozmazanie“ dát? V takom prípade sa určia miery variability.

Za zmienku stojí skutočnosť, že štatistické ukazovatele miery centrálnej tendencie a variability sa určujú iba na kvantitatívnych údajoch.

Ústredné trendové opatrenia- skupina hodnôt, okolo ktorých sú zoskupené zvyšné údaje. Opatrenia ústredného trendu teda sumarizujú súbor údajov, čo umožňuje formulovať závery tak o vzorke ako celku, ako aj o vzájomnej komparatívnej analýze rôznych vzoriek.

Predpokladajme, že existuje vzorka údajov, potom sa odhady centrálneho trendu odhadujú podľa týchto ukazovateľov:

1. Priemer vzorkyJe výsledkom vydelenia súčtu všetkých hodnôt vzorky ich počtom. Je určená vzorcom (3.1).

(3.1)

kde - ith prvok vzorky;

n - počet prvkov vo vzorke.

Priemer vzorky poskytuje najväčšiu presnosť pri hodnotení ústredného trendu.

Povedzme, že existuje vzorka 20 ľudí. Vzorky sú informáciami o priemernom mesačnom príjme každej osoby. Predpokladajme, že 19 ľudí má priemerný mesačný príjem $ 20 tr. a 1 osoba s príjmom 300 tr. Celkový mesačný príjem celej vzorky je 680 RUB. Priemer vzorky je v tomto prípade S \u003d 34.


2. Medián- generuje hodnotu, nad a pod ktorou je počet rôznych hodnôt rovnaký, to znamená, že je to ústredná hodnota v postupnom rade údajov. Určuje sa v závislosti od párneho / nepárneho počtu prvkov vo vzorke pomocou vzorcov (3.2) alebo (3.3). Algoritmus na odhad mediánu pre vzorku údajov:

Najskôr sú dáta zoradené (usporiadané) zostupne / vzostupne.

Ak má usporiadaná vzorka nepárny počet prvkov, potom sa stredná hodnota zhoduje s hodnotou stredu.

(3.2)

kde n

V prípade párneho počtu prvkov je stredná hodnota definovaná ako aritmetický priemer dvoch centrálnych hodnôt.

(3.3)

kde je priemerný prvok objednanej vzorky;

- nasledujúci prvok usporiadaného výberu;

Počet položiek vo vzorke.

Ak sú všetky prvky vzorky odlišné, potom je presne polovica prvkov vzorky väčšia ako medián a druhá polovica menšia. Napríklad pre vzorku (1, 5, 9, 15, 16) je stredná hodnota rovnaká ako položka 9.

Pri štatistickej analýze údajov vám medián umožňuje určiť prvky vzorky, ktoré silne ovplyvňujú hodnotu priemeru vzorky.

Povedzme, že existuje vzorka 20 ľudí. Vzorky sú informáciami o priemernom mesačnom príjme každej osoby. Predpokladajme, že 19 ľudí má priemerný mesačný príjem $ 20 tr. a 1 osoba s príjmom 300 tr. Celkový mesačný príjem celej vzorky je 680 RUB. Medián sa po objednaní vzorky stanoví ako aritmetický priemer desiateho a jedenásteho prvku vzorky) a rovná sa Me \u003d 20 tr. Tento výsledok sa interpretuje takto: stredná hodnota rozdelí vzorku do dvoch skupín, aby sme mohli dospieť k záveru, že v prvej skupine má každý človek priemerný mesačný príjem najviac 20 tisíc rubľov a v druhej skupine najmenej 20 ton. R. V tomto príklade môžeme povedať, že stredná hodnota je charakterizovaná tým, koľko „priemerný“ človek zarobí. Zároveň je hodnota výberového priemeru významne prekročená S \u003d 34, čo naznačuje, že táto charakteristika je pri hodnotení priemerného zárobku neprijateľná.

Čím väčší je rozdiel medzi mediánom a priemerom vzorky, tým väčší je rozptyl údajov zo vzorky (v posudzovanom príklade sa osoba so zárobkom 300 tisíc rubľov jednoznačne líši od priemerných ľudí v konkrétnej vzorke a má významný vplyv na odhad priemerného príjmu). Čo robiť s takýmito prvkami, sa rozhodne v každom jednotlivom prípade. Všeobecne sa však kvôli zaisteniu spoľahlivosti vzorky odstránia, pretože majú výrazný vplyv na hodnotenie štatistických ukazovateľov.

3. Móda (Moe) - tvorí hodnotu, s ktorou sa vo vzorke najčastejšie stretávame, t. j. hodnotu s najvyššou frekvenciou. Algoritmus odhadu režimu:

V prípade, že vzorka obsahuje prvky, ktoré sa vyskytujú rovnako často, potom sa hovorí, že v takejto vzorke nie je móda.

Ak majú dve susedné vzorky rovnakú frekvenciu, ktorá je vyššia ako frekvencia ostatných vzoriek, potom sa režim určí ako priemer týchto dvoch hodnôt.

Ak majú dve vzorky rovnakú frekvenciu, ktorá je vyššia ako frekvencia ostatných vzoriek, a tieto prvky spolu nesusedia, potom sa hovorí, že v danej vzorke existujú dva režimy.

Režim v štatistickej analýze sa používa v situáciách, keď je potrebné rýchle vyhodnotenie miery centrálneho trendu a vysoká presnosť sa nevyžaduje. Napríklad móda (z hľadiska veľkosti alebo značky) je vhodná na určenie oblečenia a topánok, ktoré sú medzi zákazníkmi najžiadanejšie.

Miery rozptylu (variability)- skupina štatistických ukazovateľov charakterizujúcich rozdiely medzi jednotlivými hodnotami vzorky. Na základe ukazovateľov disperzných opatrení je možné odhadnúť stupeň homogenity a kompaktnosti prvkov vzorky. Opatrenia týkajúce sa rozptylu sa vyznačujú nasledujúcou sadou ukazovateľov:

1. Potiahnutie prstom - je to interval medzi maximálnou a minimálnou hodnotou výsledkov pozorovania (jednotky vzorky). Výkyvná miera indikuje rozšírenie hodnôt v populácii údajov. Ak je rozsah veľký, potom sú hodnoty v agregáte veľmi rozptýlené, inak (rozsah je malý) sa hovorí, že hodnoty v agregáte ležia blízko seba. Rozsah je určený vzorcom (3.4).

(3.4)

Kde - maximálny prvok vzorky;

je minimálny prvok vzorky.

2.Priemerná odchýlka- aritmetický priemerný rozdiel (v absolútnej hodnote) medzi každou hodnotou vo vzorke a jej priemerom vo vzorke. Priemerná odchýlka je určená vzorcom (3.5).

(3.5)

kde - ith prvok vzorky;

Hodnota priemeru vzorky vypočítaná podľa vzorca (3.1);

Počet položiek vo vzorke.

Modul je potrebné vzhľadom na skutočnosť, že odchýlky od priemeru pre každý konkrétny prvok môžu byť pozitívne aj negatívne. Ak teda modul nevyužijete, potom sa súčet všetkých odchýlok bude blížiť k nule a nebude možné posúdiť mieru variability údajov (tlačiace sa dáta okolo priemeru vzorky). Pri vykonávaní štatistickej analýzy je možné namiesto strednej hodnoty vzorky použiť režim a strednú hodnotu.

3. Rozptyl - miera disperzie, ktorá popisuje relatívnu odchýlku medzi hodnotami údajov a strednou hodnotou. Vypočíta sa ako súčet štvorcových odchýlok každého prvku vzorky od priemeru. Rozptyl sa odhaduje rôznymi spôsobmi v závislosti od veľkosti vzorky:

Pre veľké vzorky (n\u003e 30) podľa vzorca (3.6)

(3.6)

Pre malé vzorky (č<30) по формуле (3.7)

(3.7)

kde X i je i-tý prvok vzorky;

S je priemerná hodnota vzorky;

Počet prvkov vo vzorke;

(X i - S) je odchýlka od priemeru pre každú hodnotu v množine údajov.

4. Štandardná odchýlka - miera rozšírenia dátových bodov v pomere k ich priemeru.

Proces kvadratúry jednotlivých odchýlok pri výpočte odchýlky zvyšuje stupeň odchýlky výslednej odchýlky od pôvodných odchýlok, čo zase prináša ďalšie chyby. Preto, aby sa aproximoval odhad rozšírenia údajových bodov v pomere k ich priemeru k hodnote strednej odchýlky, sa z rozptylu získa druhá odmocnina. Extrahovaná odmocnina rozptylu charakterizuje mieru variability nazývanú odmocnina alebo štandardná odchýlka (3.8).

(3.8)

Povedzme, že ste projektovým manažérom vývoja softvéru. Máte podriadených päť programátorov. Riadením procesu vykonávania projektu distribuujete úlohy medzi programátorov. Pre jednoduchosť príkladu budeme vychádzať zo skutočnosti, že úlohy sú ekvivalentné v zložitosti a v čase vykonania. Rozhodli ste sa analyzovať prácu každého programátora (počet úloh dokončených počas týždňa) za posledných 10 týždňov, v dôsledku čoho ste dostali nasledujúce vzorky:

Názov týždňa

Po odhade priemerného počtu splnených úloh ste dosiahli nasledujúci výsledok:

Názov týždňa S
22,3
22,4
22,2
22,1
22,5

Na základe indikátora S pracujú všetci programátori v priemere s rovnakou účinnosťou (asi 22 úloh za týždeň). Indikátor variability (rozsahu) je však veľmi vysoký (od 5 úloh štvrtého programátora po 24 úloh pre piatu).

Názov týždňa S P
22,3
22,4
22,2
22,1
22,5

Odhadnime štandardnú odchýlku, ktorá ukazuje, ako sú hodnoty vo vzorkách rozložené v pomere k priemeru, konkrétne v našom prípade odhadneme, aké veľké je rozšírenie úloh z týždňa na týždeň.

Názov týždňa S P TAK
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Výsledný odhad štandardnej odchýlky hovorí nasledujúce (odhadnime dva krajné prípady programátorov 4 a 5):

Každá hodnota na vzorke 4 programátorov sa odchyľuje v priemere o 1,3 úlohy od priemernej hodnoty.

Každá hodnota vo vzorke 5 programátora sa odchyľuje od priemernej hodnoty v priemere o 5,3 úloh.

Čím bližšie je smerodajná odchýlka k 0, tým spoľahlivejší je priemer, čo naznačuje, že každá hodnota vzorky sa takmer rovná priemeru (v našom príklade je to 22,5 položiek). Štvrtý programátor je teda na rozdiel od piateho najkonzistentnejší. Variabilita výkonu úloh z týždňa na týždeň pre 5. programátora je 5,3 úloh, čo naznačuje výrazné rozšírenie. V prípade 5. programátora nemožno priemeru dôverovať, a preto je ťažké predpovedať počet splnených úloh na budúci týždeň, čo následne komplikuje plánovanie a dodržiavanie pracovných harmonogramov. Aké rozhodnutie manažmentu v tomto kurze urobíte, je irelevantné. Je dôležité, aby ste dostali hodnotenie, na základe ktorého je možné prijímať príslušné rozhodnutia manažmentu.

Možno teda urobiť všeobecný záver, že stredná hodnota nie vždy správne odhadne údaje. Správnosť priemerného odhadu možno posúdiť podľa hodnoty štandardnej odchýlky.