Nástroj Regrese je komplexním nástrojem pro analýzu lineárního vztahu mezi dvěma či více proměnnými. Nejdříve si ukážeme analýzu vztahu mezi dvěma proměnnými a na konci článku se pak zmíníme o analýze vztahu více proměnných.
Máme připravenou tabulku se dvěma sloupci – v prvním sloupci jsou uvedeny hodnoty nezávislé veličiny X, ve druhém pak hodnoty závislé veličiny Y.
Na kartě Data klikneme na tlačítko Analýza dat a zvolíme nástroj Regrese (pokud na kartě Data toto tlačítko nemáme, tak je potřeba aktivovat doplněk Analytické nástroje – viz první díl seriálu).
Do pole Vstupní oblast Y zadáme oblast s hodnotami závislé veličiny, do pole Vstupní oblast X pak oblast s hodnotami nezávislé veličiny. Pozor na pořadí oblastí – v prvním poli se opravdu zadává závislá veličina a až ve druhém nezávislá veličina! Očekávají se sloupcové oblasti se stejným počtem hodnot. Pokud jsou v záhlaví oblastí uvedeny jejich názvy, tak zaškrtneme volbu Popisky.
Nástroj mj. vypočítává interval spolehlivosti pro hladinu spolehlivosti 95 %. Chceme-li nechat vypočítat interval spolehlivosti i pro jinou hladinu, tak zaškrtneme volbu Hladina spolehlivosti a zapíšeme požadovanou hladinu spolehlivosti. Požadujeme-li, aby konstantní člen rovnice regresní přímky vyjadřující závislost mezi veličinami (konstanta b v rovnici y=ax+b) byl roven nule, tak zaškrtneme volbu Konstanta je nula.
V části Možnosti výstupu určíme, kde se má vytvořit výstupní tabulka. Dialogové okno obsahuje v částech Rezidua a Normální pravděpodobnost ještě pět dalších voleb. Nyní je ale nezaškrtávejme, vrátíme se k nim za chvíli.
Výstupní tabulka se skládá ze tří části. V první části s názvem Regresní statistika vidíme několik hodnot, které charakterizují lineární regresi mezi zadanými veličinami. Excel ale používá poněkud svéráznou terminologii. Pod názvem Násobné R se skrývá koeficient korelace a pod názvem Hodnota spolehlivosti R pak koeficient determinace (druhá mocnina koeficientu korelace). Čím jsou tyto koeficienty blíže číslu jedna, tím je korelace mezi veličinami silnější. Ani jedna z těchto veličin nezohledňuje svým znaménkem, zdali je proložená funkce rostoucí či klesající.
Ve druhé části s názvem ANOVA si můžeme zkontrolovat statistickou významnost analýzy. Pokud je hodnota Významnost F menší než 0,05, tak můžeme výsledky považovat za statisticky průkazné. K neprůkaznosti může dojít např. vlivem nedostatečného počtu údajů.
Z poslední části výstupní tabulky můžeme sestavit rovnici regresní přímky vyjadřující vztah mezi veličinami. Je-li obecný tvar rovnice přímky y=ax+b, tak koeficient a najdeme ve sloupci Koeficienty na řádku X a koeficient b na řádku Hranice. V našem případě by tedy měla rovnice regresní přímky tvar y=13,98x-11,17.
Vždy je ale potřeba počítat s určitou odchylkou, a tak může být vhodnější pracovat místo pouhé přímky s pásem ohraničeným dvěma přímkami – tzv. intervalem spolehlivosti. Sestavíme-li tento interval z přímek, jejichž koeficienty jsou uvedeny ve sloupcích Dolní…