ZÁPOČTOVÉ TESTY Martina Litschmannová Explorační analýza A Analyzujte proměnnou Kategorie obcí v souboru VO_spotreba. a. Vyplňte 2.

Download Report

Transcript ZÁPOČTOVÉ TESTY Martina Litschmannová Explorační analýza A Analyzujte proměnnou Kategorie obcí v souboru VO_spotreba. a. Vyplňte 2.

Slide 1

ZÁPOČTOVÉ TESTY
Martina Litschmannová


Slide 2

Explorační analýza
A
Analyzujte proměnnou Kategorie obcí v souboru VO_spotreba.
a.
Vyplňte 2. – 4. řádek tabulky četnosti (v tabulce uveďte všechny používané
číselné charakteristiky).
b. Kolik obcí v získaném souboru má méně než 10 tisíc obyvatel? Uveďte absolutní i
relativní četnost.
c.
Určete modus.
d. Načrtněte výsečový graf.
B
Analyzujte proměnnou Spotřeba_km2 v souboru VO_spotreba.
a.
Kolik odlehlých pozorování se v datech nachází? (Uveďte použité kritérium pro
identifikaci outlierů.)
b. Určete a komentujte 30%-ní kvantil. (konkrétně)
c.
Určete pravdivost výroku: „Spotřeba energie VO na km2 více než poloviny obcí je
nadprůměrná.“
d. Jakou maximální spotřebu energie VO na km2 byste očekávali u Krmelína? Proč?
e.
Jaká je variabilita těchto dat? (nízká, průměrná, vysoká) Uveďte číselnou
charakteristiku na jejímž základě jste rozhodli.


Slide 3

Kombinatorika
A
Četa vojáků má vyslat na stráž 4 muže. Kolik
mužů má četa, je-li možno úkol splnit 210
způsoby?
B
Student má v knihovně 4 různé učebnice
pružnosti, 3 různé učebnice matematiky a 2
různé učebnice angličtiny. Kolika způsoby je lze
seřadit, mají-li zůstat učebnice jednotlivých
oborů vedle sebe?


Slide 4

Teorie pravděpodobnosti
A
Sonda má dvě kamery, které mohou pracovat nezávisle na sobě.
Každá z nich je vybavena pro případ poruchy korekčním
mechanismem. Pravděpodobnost poruchy kamery je 0,1,
pravděpodobnost úspěšné opravy případné poruchy pomocí
korekčního mechanismu je 0,3. S jakou pravděpodobností se
nepodaří ani jednou z kamer nic nafilmovat?
B
Dvě osoby A a B si smluvily schůzku na daném místě v neurčitém
čase mezi 13:00 a 14:00. Každý z nich je ochoten čekat na
druhého maximálně 10 minut. Předpokládáme, že příjdou
nezávisle na sobě a okamžiky příchodu jsou stejně možné
kdykoliv během uvedené hodiny. Určete pravděpodobnost, že se
opravdu sejdou.


Slide 5

Náhodný vektor
Náhodný vektor (Y,X) má pravděpodobnostní funkci zadanou tabulkou:
Y\X

1
3 0,06
5 0,04
7 0,12

2
0,08
0,16
0,08

3
0,03
?
0,06

4
0,25
0,05
0,01

Určete:
a) Chybějící hodnotu sdružené pravděpodobnostní funkce
b) F(3,6;4,8)
c) P(Y=3|X=4)
d) P(X<3,8)
e) marginální rozdělení (marginální pravd. funkce náh. vel. X a náh. veličiny Y)
f) FY(5,3)
g) kovarianci a koeficient korelace


Slide 6

Vybraná rozdělení NV
A
Ve strojírenském závodě se vyrábějí určité součástky, jejichž
rozměry mají nahodilé odchylky řídící se normálním zákonem
rozložení s nulovou střední hodnotou a směrodatnou
odchylkou 4 mm. Výrobky s odchylkou menší než 5 mm se
zařazují do vyšší jakostní třídy. Určete střední hodnotu počtu
výrobků zařazených do vyšší jakostní třídy z daných 4 výrobků.

B
Výsledky měření jsou zatíženy jen normálně rozdělenou
chybou s nulovou střední hodnotou a se směrodatnou
odchylkou 3 mm. Jaká je pravděpodobnost, že při 3 měřeních
bude alespoň jednou chyba v intervalu (0; 2,4)mm?


Slide 7

Limitní věty
A
Cestující pravidelně jezdí do zaměstnání a zpět MHD. Je
známo, že doba čekání na příjezd MHD se pohybuje v
mezích od 0 do 3 minut. Jaká je pravděpodobnost, že
celková doba čekání zaměstnance na příjezd MHD během
24 pracovních dnů bude kratší než 3/4 hodiny?
B
Stanovte pravděpodobnost, že průměrný věk ve skupině
50-ti žáků autoškoly bude v intervalu od 20 do 23 let,
pokládáme - li věk žáků za náhodnou veličinu se střední
hodnotou 22 let a směrodatnou odchylkou 6 let.


Slide 8

Intervalové odhady
A
Agentura provádějící průzkum veřejného mínění plánuje šetření, na
základě kterého chce odhadnout, kolik procent voličů podporuje
současnou vládní koalici. Předpokládejme (v praxi tomu tak ovšem
není), že jsou dotazování vybírání zcela náhodně. Kolik
dotazovaných by mělo být do výběru zařazeno, jestliže si vedení
agentury přeje, aby se odhad z výběru nelišil od skutečného podílu
příznivců koalice o více než 3%? (Volte hladinu významnosti 0,05.)
B
Při kontrole data spotřeby určitého druhu masové konzervy ve
skladech produktů masného průmyslu bylo náhodně vybráno 320
konzerv a zjištěno, že 59 z nich má prošlou záruční lhůtu. Stanovte
95% interval spolehlivosti pro odhad procenta konzerv s prošlou
záruční lhůtou.


Slide 9

Pozn.: Pořadí politiků v žebříčku je dáno přesnou procentní
hodnotou součtu příznivých hodnocení (na jedno desetinné místo).
Zdroj: http://zpravy.idnes.cz/nejpopularnejsim-politikem-je-john-predbehl-sobotku-ischwarzenberga-1zg-/domaci.asp?c=A100419_133843_domaci_mad

a) Odhadněte se spolehlivostí 95% změnu v popularitě Karla Schwarzenberga v
období leden 2010 – duben 2010.
b) Lze tvrdit (na hladině významnosti 5%), že popularita Karla Schwarzenberga je v
dubnu 2010 vyšší než popularita Petra Nečase?
c) Určete 95% intervalový odhad popularity Jiřího Paroubka v dubnu 2010.
d) Proč se mezi nejoblíbenějšími politiky (duben 2010) neobjevil premiér Jan Fischer?


Slide 10

Testování hypotéz + IO
Tabáková firma TAB prohlašuje, že jejich cigarety mají
nižší obsah nikotinu než cigarety NIK. Pro ověření
tohoto prohlášení bylo náhodně vybráno z produkce
TAB 20 krabiček cigaret (po 20-ti kusech) a v nich bylo
zjištěno (42,6 ±3,7) mg nikotinu (v jediné cigaretě). Ve
25-ti krabičkách cigaret NIK (po 20-ti kusech) bylo
zjištěno (48,9 ± 4,3) mg nikotinu na cigaretu.
a) Ověřte tvrzení firmy TAB čistým testem významnosti.
b) Otestujte tvrzení firmy TAB prostřednictvím
intervalového odhadu na hladině významnosti 0,05.
c) Nalezněte 95% interval spolehlivosti pro obsah
nikotinu v cigaretách TAB.