Statistische normalisatie - Wat het is, definitie en concept

Inhoudsopgave:

Anonim

Statistische normalisatie is de schaaltransformatie van de verdeling van een variabele om vergelijkingen te kunnen maken met betrekking tot verzamelingen elementen en het gemiddelde door de effecten van invloeden te elimineren.

Met andere woorden, normalisatie is proporties zonder meeteenheden (dimensieloos of schaalinvariant) waarmee we elementen van verschillende variabelen en verschillende meeteenheden kunnen vergelijken.

In de statistiek en econometrie worden gestandaardiseerde kansverdelingstabellen gebruikt om de kans te vinden dat een waarneming plaatsvindt, gegeven de verdelingsfunctie die de variabele volgt.

Het is belangrijk om de normalisatieterm niet alleen te beperken tot verzamelingen elementen waarvan de normale verdeling een goede benadering is van hun frequentie.

statistische variabele

Tafel

De volgende tabel geeft een overzicht van de meest voorkomende standaardisaties in statistieken die worden toegepast op financiën en economie.

  • De getypeerde of standaardscore normaliseert de fouten wanneer we de steekproefparameters kunnen berekenen.
  • De normalisatie in de Student's t-verdeling normaliseert de residuen wanneer de parameters onbekend zijn en we maken een schatting om ze te verkrijgen.
  • De variatiecoëfficiënt gebruikt het gemiddelde als schaalmaat, in tegenstelling tot de gestandaardiseerde score en Student's t, die de standaarddeviatie gebruiken. De verdeling is genormaliseerd voor de Poisson- en exponentiële verdelingen.
  • Het gestandaardiseerde moment kan worden toegepast op elke kansverdeling die een momentgenererende functie heeft. Met andere woorden, dat de integralen van de momenten convergent zijn.

Toepassingen

Hoe vaak hebben we gelezen dat de normale kansverdeling een goede benadering lijkt voor de frequentie van de waarnemingen en wordt ons gevraagd de kans te vinden dat de variabele X een specifieke waarde aanneemt?

Met andere woorden, we stellen X ~ N (μ, σ2), en we worden gevraagd om P (X ≤ xik)

We weten dat om P (X ≤ xik), moeten we de kans opzoeken in de kansverdelingstabellen. In dit geval in de tabellen van de verdeling van de normale verdeling. De meest gebruikte kansverdelingstabellen in de econometrie en kwantitatieve financiën zijn: chi-kwadraat, Student's t, Fisher-Snedecor's F, Poisson, exponentieel, cauchy en de standaardnormaal.

De in de verdelingstabellen berekende kansen voldoen aan de eigenschap:

Dat wil zeggen, de kansen (de getallen in de tabel) zijn getypeerd. Dan zullen we onze variabele ook moeten typen volgens de parameters van de verdelingsfunctie als we de kans op P (X ≤ xik).

praktijkvoorbeeld

We willen de kans weten dat het aantal skiërs dat op vrijdagochtend gaat skiën 288 is.

Het skigebied vertelt ons dat de frequentie van de variabele skiërs een normale verdeling van gemiddelde 280 en variantie 16 kan benaderen.

Dus we hebben:

X ~ N (μ,2)

waarbij X is gedefinieerd als de variabele 'skiërs'

Ze vragen ons naar de kans dat het aantal skiërs dat op vrijdag gaat skiën kleiner of gelijk is aan 288. Dat wil zeggen:

P (X ≤ 288)

Werkwijze

Om de kans te vinden dat het aantal skiërs gelijk is aan 288, moeten we eerst de variabele typen.

Dan kijken we naar de verdelingstabel van de continue standaardnormaal:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

De kans dat 288 skiërs op vrijdagochtend gaan skiën is 97,72% gegeven de parameters van het gemiddelde en de variantie.