Title: Gazdas
1Gazdasági informatika II.
- 2006/2007. tanév II. félév
- Gazdálkodási szak
- Nappali tagozat
2Statisztikai számítások Excellel
- Minta vizsgálata
- LEÍRÓ STATISZTIKA
- Megjegyzés a statisztikai függvények zömének
paramétere az adathalmaz, ezért nem részletezzük
az egyes függvények paraméterezését!
3EMLÉKEZTETO - Alapfogalmak
- Statisztika tárgya SOKASÁG meghatározott
tulajdonságok szerint egyformák, más
tulajdonságok szerint viszont különbözoek - Ismérv sokaság egységeire vonatkozó jellemzok
- Közös ismérvek egységek ez alapján egyformák
- Megkülönbözteto ismérvek ezek alapján
különböznek egymástól az egységek
4Sokaság típusok
- Álló sokaság valamely idopontra vonatkozik
- Mozgó sokaság valamely idotartamra vonatkozik
5Ismérvek típusai
- Területi földrajzi jellegu
- Idobeli valamilyen idopontra vagy idotartamra
utalnak - Minoségi nem számszerusítheto - kvalitatív
- Mennyiségi számmal kifejezheto kvantitatív
- Az ismérv lehetséges kimenetei az ismérvértékek!
6Statisztikai adatok
- Mérheto adatok (Kvantitatív) olyan adatok,
melyek mérésbol származnak. - Megállapítható adat Nem számadat, kategória
kategorizált adat (Kvalitatív) Pl. nem(férfi,
no) igen-nem válaszlehetoségek 2 gyereke van
ebben az esetben az a fontos, hogy a kétgyermekes
kategóriába tartozik.
7Adattípusok fajtái
- Adattípusok fajtái a rendezhetoség és a köztük
értelmezheto távolságfüggvény alapján - Nominális
- Ordinális
- Intervallum típusú
- Numerikus
8Nominális adatok
- A mérés legalacsonyabb szintjét jelöli, amikor
minden megfigyelt egyedet olyan adattal írunk le,
melyek egymással nagyság szerint nem
összehasonlíthatók - Példa dolgozó neve, születési helye, nemestb.
akkor is nominális, ha számban kódolt pl. a
dolgozó törzsszáma.
9Ordinális adatok
- Bármely két adat összehasonlítható
- Példa dolgozók iskolai végzettsége.
- Jellemzo
- Nincs távolság értelmezve az adatok között. (Pl.
Nem lehet megmondani, hogy mennyivel értékesebb
az érettségi a 8 általánosnál. ) - Egyetlen muvelet adatok rendezése olyan
rangstatisztika alkalmazható, amely csak az
adatok egymáshoz képesti rendezettségét
használják. (Pl. átlagnak nincs értelme, de
mediánnak és módusznak igen ezekrol a
késobbiekben lesz szó).
10Intervallum típusú adatok
- Sorba rendezhetoség mellett az egymástól való
távolság is megadható. - Példa homérsékleti adatok
- Értelmetlen az egymáshoz viszonyított arányról
beszélni 20 C kétszer olyan meleg, mint a
10C.(A homérséklet a Kelvin skálán nem
intervallum típusú!)
11Numerikus adatok
- Valós számokkal jellemezheto adatok.
- Minden olyan muveletet végrehajthatunk ezekkel,
amelyeket a valós számokkal.
12Középértékek
13Számított középértékek
- Matematikai összefüggés alapján számíthatók ki
- Számtani (Aritmetikai) átlag
- Egyszeru
- Súlyozott
- Harmonikus átlag
- Egyszeru
- Súlyozott
- Mértani (Geometriai) átlag
- Egyszeru
- Súlyozott
- Négyzetes (Kvadratikus) átlag
- Egyszeru
- Súlyozott
14Számtani átlag
- Számítsuk ki az adott osztály átlagát
matematikából a megadott eredmények alapján!
ÁTLAG( ) - AVERAGE()
15Mértani átlag
- Egy vállalat nyereségét tartalmazza az alábbi
táblázat az 1982 92 években
MÉRTANI.KÖZÉP GEOMEAN()
Feladat Határozzuk meg az adott idoszakra a
nyereség növekedésének átlagos ütemét!
16További átlagok megfelelo függvényei
- Harmonikus átlag HARM.KÖZÉP() HARMEAN()
17Helyzeti középértékek
- A sokaságban elfoglalt helyzetüknél fogva
jellemzik a sokaságot - Valamilyen szabály szerint rendezni kell az
adatokat ? Rangsor
Elonye Függetlenek a sokaság más tagjainak
értékeitol Heterogén sokaságok esetén
jellemzobbek, mint az átlagok
18Helyzeti középértékek
- Kvantilis értékek A sokaság mennyiségi ismérv
szerinti eloszlásának tömör leírását adják meg
k egyenlo rész neve Függvény
2 MEDIÁN medián() kvartilis()
3 TERICLIS kvartilis()
4 KVARTILIS kvartilis()
5 KVINTILIS
10 DECILIS
100 PERCENTILIS Percentilis()
19Feladat
- Tegyük fel, hogy egy üzem dolgozóinak elmúlt havi
teljesítményszázalékai az alábbiak - Határozzuk
meg a mediánt!
20Excel függvényei
- MEDIÁN() MEDIAN()
- KVARTILIS() QUARTILE()
- PERCENTILIS() PERCENTILE() k-dik percentilis
- SZÁZALÉKRANG() PERCENTRANK() egy értéknek egy
adathalmazon vett százalékos rangját adja - MAX
- MIN
- KICSI() SMALL()Egy adathalmaz k-dik legkisebb
elemét adja értékül! - NAGY() LARGE() Egy adathalmaz k-dik legnagyobb
elemét adja értékül! - SORSZÁM()- RANK() Egy szám sorszámát adja, meg
ha az adatokat sorba rendezzük
21Módusz
- Leggyakrabban eloforduló ismérvérték
MÓDUSZ() MODE()
Figyelem! Több azonos gyakoriságú adat esetén a
sorrendben az elsot adja móduszként! Próbálja
ki! Rendezze át az adatokat!
22Feladat
- Készítsen kimutatást, hogy hány db 1234 és 5
lett matematikából!
GYAKORISÁG(tartomány csoportosítási tömb)
TÖMBKÉPLET! Képlet beírás befejezése CTRL
SHIFT ENTER
23Gyakoriság
- Gyakoriság() FREQUENCY()
- Adott adathalmazban melyik érték hányszor szerepel
24Összefoglalás - Középértékek
- Az egyes adatfajtáknál milyen középértékeket
alkalmazunk?
25Szóródás és mérése
26Méroszámok
- Terjedelem
- Interkvartilis félterjedelem
- Átlagos abszolút eltérés
- Szórás Szórásnégyzet (Variancia)
- Relatív szórás(Variációs koefficiens)
27Függvények az Excelben
- SQ()- átlagtól való eltérések négyzetének
összegét adja eredményül - SZÓRÁSP() STDEVP()- szórás
- VARP() variancia (szórásnégyzet)ÁTL.ELTÉRÉS
átlagos abszolút eltérés AVEDEV()
28Asszimmetria mérése
29(No Transcript)
30Ferdeség mérése
- FERDESÉG() SKEW()
- A ferdeség az eloszlás középérték körüli
aszimmetriájának mértékét jelzi. A pozitív
ferdeség a pozitív értékek irányába nyúló
aszimmetrikus eloszlást jelez, míg a negatív
ferdeség a negatív értékek irányában torzított. - CSÚCSOSSÁG() KURT()
- Egy adathalmaz csúcsosságát számítja ki. A
függvény a normális eloszláshoz viszonyítva egy
eloszlás csúcsosságát vagy laposságát adja meg. A
pozitív értékek viszonylag csúcsos, a negatív
értékek viszonylag lapos eloszlást jelentenek.
31Adatok kezelése
- Számláló - keresofüggvények
32Függvények
- DARAB () - COUNT()
- a megadott tartomány számmal kitöltött celláinak
a számát adja - DARAB2() COUNTA()
- a megadott tartomány értékkel kitöltött celláinak
(nem üres) a számát adja - DARABTELI () COUNTIF ()
- a megadott tartományban megszámolja, hogy hány
darab cella felel meg a megadott kritériumnak - DARABÜRES () COUNTBLANK ()
- A megadott tartományban megszámolja hány db cella
üres
33Feladat
- A megadott adathalmaz egy osztály matematika
eredményeit tartalmazza. Határozzuk meg, hogy
hány db elégtelen lett! - Vizsgáljuk meg, hogy van-e olyan tanuló, akinek
nincs beírva az érdemjegy még nem zárták le?
DARABTELI(tartomány kritérium)
DARABÜRES(tartomány)
34Feladat
- Készítsen kimutatást, hogy hány db 1234 és 5
lett matematikából! - Hány cellában van adat azaz hány tanuló kapott
már érdemjegyet?
DARABTELI(tartomány kritérium)
DARAB(tartomány)
35Idosorok elemzése
36Trendszámítás - elmélet
- Trend Az idoben változó jelenségek alakulásában
mindig megfigyelhetünk alapveto tendenciákat
(növekedés, csökkenésstb) - Szezonális ingadozás Rendszeresen visszatéro
hullámzás - Ciklushatás fel-le mozgás hatása (konjunktúra -
dekonjunktúra) - Véletlen hatás elore nem látható események
befolyása
37Trendszámítás formái
- Analitikus trendszámítás
- Mozgóátlagolású trendszámítás
38Analitikus trendszámítás
- Megfigyelt jelenségek tapasztalatai alapján
felírunk egy olyan függvényt, mely az idobeli
változás alapirányzatát fejezi ki. - Függvénytípusok
- Lineáris
- Exponenciális
- Parabola
- Logisztikus (S-alakú)
39Lineáris függvény felírása
- Egy vállalat dolgozóinak létszámváltozását
tükrözo lineáris függvény felírása, ábrázolása!
Függvény egyenlete Ylétszám függo
változó! Xév független változó! Y20,4x198,3
LIN.ILL függvényrol
LIN.ILL(létszámévek)
40LIN.ILL függvény
- Paraméterei
- Y értékek
- X értékek
- Konstans Igaz (b számítása normál módon
történik) vagy Hamis (b értéke 0 lesz ez az
alapértelmezett érték) - Nulla IGAZ (kiegészíto elemzések készülnek) vagy
HAMIS (nem készülnek kiegészíto elemzések
alapértelmezett érték)
41LIN.ILL függvény használata
- Tömbképletként Ha csak két adathalmazról van
szó X és Y, akkor ketto cellát kijelölve a képlet
beírása után CTRLSHIFTENTER leütéssel képezzük
a tömbképletet LÁSD példa! - Ha nem alkalmazunk tömbképletet, akkor a kapott
érték az egyenes meredeksége lesz következo
dia! - 2 adatsor esetén alkalmazhatjuk a következoképpen
is - Meredekség meghatározása INDEX(LIN.ILL(yx)1)
- Y metszéspont meghatározása INDEX(LIN.ILL(yx)2
) - Lásd! Következo dia!
42Példák a LIN.ILL függvény alkalmazására
43LIN.ILL alkalmazása, ha a nulla értéke IGAZ
- Kiegészíto statisztikákat számol ki az EXCEl, ha
a nulla értékét IGAZ-ra állítjuk - A statisztikákat tömbként adja meg a következo
elrendezésben lásd! Következo dia! - Ha a tömb elemeinek nagyobb tartományt jelölünk
ki a statisztikák számán kívül, akkor a
felesleges cellákban a HIÁNYZIK üzenetet kapjuk!
44LIN.ILL kiegészíto statisztikái
együtthatók
Együtthatók standard hibái
Determináns együttható összehasonlítja a becsült értékeket a tényleges értékekkel értéke 0 és 1 közötti. Ha 1 akkor jó a becsült érték azaz jó a lin. Egyenes ha 0, akkor nem jó! shy az y becslés standard hibája
F próba eredményeként kapott érték Df Szabadságfok
Ssreg regressziós négyzetösszeg (y érték és az y értékek átlaga közötti eltérés négyzete) ssmaradmaradék négyzetösszeg (y becsült érték és a tényleges érték közötti eltérés négyzete) ?e2 ? (yi-yi)2
mn mn-1m1 b
shn shn-1 shb
r2 shy
F Df
ssreg ssmarad
Az egyenes egyenlete Ym1x1m2x2b vagy ymxb
45LIN.ILL kiegészíto statisztikái
?e2 43.9 Megjegyzés ezen érték alapján lehet
például eldönteni, hogy az exponenciális vagy a
lineáris függvény a jobb! R21, azaz a lineáris
függvény jól leírja az adatok tendenciáját!
Szabadságfok 5
46Grafikon rajzolása trendegyenesek
- Rajzoltassunk ki egy grafikont a közölt
adatokból! (Beszúrás?Diagram) - Jelöljük ki a grafikont
- Diagram?Trendvonal felvétele
- Típus lap Tetszoleges függvény kiválasztása
- Egyebek lap Beállíthatjuk, hogy az egyenlet
látszódjon - R négyzet értékét is megjeleníthetjük
47Példa Trendegyenes kirajzoltatása
48Lineáris egyenes meredekségének és y
tengelymetszetének meghatározása
- Külön függvényekkel (természetesen a LIN.ILL is
ugyanezt adja eredményül) - Meredekség MEREDEKSÉG(yx) m
- Y tengelymetszet METSZ(yx) b
49Exponenciális függvény felírása
- Egy vállalat dolgozóinak létszámváltozását
tükrözo exponenciális függvény felírása,
ábrázolása!
LOG.ILL függvényrol
LOG.ILL(létszámévek)
50LOG. ILL függvény
- Ugyanazok az alkalmazások igazak erre a
függvényre, mint a LIN.ILL-re! - Paraméterezésük is azonos
51Elorejelzés a trendegyenlet alapján
- Határozzuk meg a lineáris és exponenciális trend
alapján, hogy mennyi lesz a létszám 2001-ben és
2002-ben! - TREND(yxúj_xkonstans) függvénnyel lineáris
- NÖV(yxúj_xkonstans) - exponenciális
52Melyik egyenlet jellemzi jobban az adatok
trendjét?
A trend() alapján kapott érték kevésbé tér el a
220-tól (1994-es érték), mint a növ() alapján
kapott érték, ezért azt mondhatjuk, hogy ezt az
adatsort a lineáris egyenlet jellemzi jobban!
Ugyanaezt a LIN.ill és a LOG.ILL kiegészíto
statisztikáival is megállapíthatjuk!
- Eldöntheto a NÖV(yx) és TREND(yx)
függvényekkel, ha nem adjuk meg a 3. paramétert!
533. ANALYSIS TOOLPAK VBA
54Eszközök menü - Bovítménykezelo
55Eszközök - Adatelemzés
56Leíró statisztikák
57Példa
- Adott egy osztály matematikából kapott eredménye.
- Számítsuk ki a jellemzo középértékeket (átlag,
medián, módusz) valamint a szórást!
58Megoldás
- Eszközök menü? Adatelemzés?Leíró statisztika
- Leíró statisztika párbeszédpanel
59Leíró statisztika párbeszédpanel beállításai
- Bemeneti tartomány
- Csoportosítási alap
- Feliratok az elso sorban/oszlopban
- Várható értékek konfidenciaszintje
- K-adik legnagyobb
- K-adik legkisebb
- Kimeneti tartomány
- Összesíto statisztika
60Végeredmény
Várható érték ÁTLAG(tartomány) Medián
MEDIÁN(tartomány) Módusz MÓDUSZ
(tartomány) Szórás SZÓRÁS(tartomány) Variancia
VAR(tartomány) Csúcsosság CSÚCSOSSÁG
(tartomány) Ferdeség FERDESÉG(tartomány) Tartomá
ny MAX() MIN() Minimum MIN(tartomány) Maximu
m MAX(tartomány) Összeg SZUM(tartomány) Darabs
zám DARAB(tartomány) Legnagyobb(k)NAGY(tratomán
yk) Legkisebb(k) KICSI(tartományk)
61Gyakoriság
62Feladat
- Az elozo feladatban közölt adatokkal dolgozva
állapítsuk meg a gyakoriságokat hány hallgató
kapott 1,2,3,4,5 osztályzatot matematikából?
Készítsünk diagramot is!
63Megoldás
- Eszközök?Adatelemzés? Hisztogram menüpont
64Hisztogram párbeszédablak pontjai
- Bementi tartomány - adatok
- Rekesztartomány csoportosítási szempont (nem
kötelezo megadni) - Feliratok ekkor a megadott tartományok elso
sorát feliratként kezeli! - Kimeneti beállítások
- Eredmény megjelenítésének helye
- Tartomány - adatokat tartalmazó munkalapon belül
- Új munkalap
- Új munkafüzet
- Paraeto Rendezett oszlopdiagram felrajzolása
csökkeno sorrendben megjelenítve, kezdve a
leggyakoribb adattal - Halmozott százalék kummulált relatív gyakoriság
kiszámolása - Diagram kimenet adatok oszlopdiagramban
ábrázolása
65Paraeto
66Mozgóátlag
- Alkalmazása azon idosoroknál, melyek az adatokat
rövidebb idoszakokra bontva tartalmazzák
67Példa
Adatokat egy oszlopban vagy egy sorban kell
elhelyezni!
68Megoldás