De F-statistiek is een test die wordt gebruikt om de verklarende kracht van een groep onafhankelijke variabelen op de variatie van de afhankelijke variabele te evalueren.
Op deze manier probeert de F-statistiek te bepalen of, van een groep onafhankelijke variabelen, ten minste één het vermogen heeft om een significant deel van de variatie van de afhankelijke variabele te verklaren.
Deze test wordt vaak gebruikt in statistische gevolgtrekkingen om hypothesen te testen. Het resultaat van de berekening wordt vergeleken met de kritische waarde van een Snedecor F-verdeling met het voor de test toegekende betrouwbaarheidsniveau. Het is belangrijk op te merken dat deze test een enkele wachtrij is.
Het wordt voornamelijk gebruikt in meervoudige regressies. Het kan ook worden gebruikt in eenvoudige regressie, hoewel het tot dezelfde conclusie zou leiden als het gebruik van een andere statistiek, de t-statistiek.
RangFormule van de F-statistiek
De formule voor de F-statistiek is als volgt:
SCR = Regressie som van kwadraten
SCE = Som van kwadraten van residuen
N = Totaal aantal waarnemingen in de steekproef
K = Graden van vrijheid
De vrijheidsgraden is het aantal verklarende variabelen dat een model heeft. Dat wil zeggen, het aantal variabelen waarvan we willen zien of ze 'betrouwbaar' zijn.
r kwadraat of determinatiecoëfficiënt