Lær, hvilken simpel lineær regression er, og hvordan den virker

En grundlæggende statistikmetode til analyse af kvantitative data

Rettigheder Colin Broug, Fotograf. © 10. juni 2010 Stock.xchng

Lineære regressionsmodeller bruges til at vise eller forudsige forholdet mellem to variabler eller faktorer . Faktoren, der forudsiges (den faktor, som ligningen løser for ) kaldes afhængig variabel. De faktorer, der bruges til at forudsige værdien af ​​den afhængige variabel, kaldes de uafhængige variabler.

Gode ​​data fortæller ikke altid hele historien. Regressionsanalyse er almindeligt anvendt i forskning, da det fastslår, at der er en sammenhæng mellem variabler.

Men korrelation er ikke den samme som årsagssammenhæng . Selv en linje i en simpel lineær regression, der passer til datapunkterne, kan godt ikke sige noget definitivt om et årsag-og-effektforhold.

I simpel lineær regression består hver observation af to værdier. En værdi er for den afhængige variabel, og en værdi er for den uafhængige variabel.

Enkel lineær regressionsmodel

Den simple lineære regressionsmodel er repræsenteret som denne: y = ( β 0 + β 1 + Ε

Ved matematisk konvention betegnes de to faktorer, der er involveret i en simpel lineær regressionsanalyse, x og y .

Ligningen, der beskriver, hvordan y er relateret til x, er kendt som regressionsmodellen . Den lineære regressionsmodel indeholder også et fejlbegreb , der er repræsenteret af Ε , eller det græske brev epsilon. Fejlbegrebet bruges til at tage højde for variabiliteten i y, der ikke kan forklares af det lineære forhold mellem x og y .

Der er også parametre, der repræsenterer befolkningen, der studeres. Disse parametre af modellen, der er repræsenteret af ( β 0+ β 1 x ).

Enkel lineær regressionsmodel

Den simple lineære regressionsligning er repræsenteret som denne: Ε ( y ) = ( β 0 + β 1 x ).

Den simple lineære regressionsligning er graferet som en lige linje.

( β 0 er y- interceptet af regressionslinjen.

β 1 er hældningen.

Ε ( y ) er den gennemsnitlige eller forventede værdi af y for en given værdi af x .

En regressionslinje kan vise et positivt lineært forhold, et negativt lineært forhold eller intet forhold. Hvis den graferede linje i en simpel lineær regression er flad (ikke skrå), er der intet forhold mellem de to variabler. Hvis regressionslinjen skråner opad med den nedre ende af linien ved grafens y- afsnit (akse), og den øvre ende af linien strækker sig opad i graffeltet, er der et positivt lineært forhold væk fra x- afsnitet (akse) . Hvis regressionslinjen skråner nedad med den øvre ende af linjen ved grafens y- afsnit (akse), og den nedre ende af linien strækker sig nedad i graffeltet, mod x- afsnit (akse), eksisterer et negativt lineært forhold.

Estimeret lineær regressionsligning

Hvis parametrene for befolkningen var kendt, kunne den simple lineære regressionsligning (vist nedenfor) bruges til at beregne middelværdien af y for en kendt værdi af x .

Ε ( y ) = ( β 0 + β 1 x ).

I praksis er parameterværdierne imidlertid ikke kendte, så de skal estimeres ved hjælp af data fra en stikprøve af befolkningen. Befolkningsparametrene anslås ved hjælp af stikprøvestatistikker . Prøvestatistikken er repræsenteret ved b 0 + b 1. Når stikprøvestatistikkerne er erstattet af populationsparametrene, dannes den estimerede regressionsligning.

Den estimerede regressionsligning er vist nedenfor.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) er udtalt y hat .

Grafen for den estimerede simple regressionsligning kaldes den estimerede regressionslinje.

B 0 er y-afsnit.

B 1 er hældningen.

Ŷ ) er den estimerede værdi af y for en given værdi af x .

Vigtigt Bemærk: Regressionsanalyse bruges ikke til at fortolke årsagssammenhæng mellem variabler. Regressionsanalyse kan dog angive, hvordan variabler er relaterede eller i hvilket omfang variabler er forbundet med hinanden.

På den måde har regressionsanalyser tendens til at skabe fremtrædende forhold, der berettiger en videnskabelig forsker at kigge nærmere .

Også kendt som: bivariat regression, regressionsanalyse

Eksempler: Den mindste kvadratmetode er en statistisk procedure til brug af prøvedata for at finde værdien af ​​den estimerede regressionsligning. Den mindste kvadratmetode blev foreslået af Carl Friedrich Gauss, som blev født i år 1777 og døde i 1855. Den mindste kvadratmetode anvendes stadig meget.

Kilder:

Anderson, DR, Sweeney, DJ og Williams, TA (2003). Essentials of Statistics for erhvervslivet og økonomi (3. ed.) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Forklaret: Regressionsanalyse. MIT News.

McIntyre, L. (1994). Brug af cigaretdata til en introduktion til flere regressioner. Journal of Statistics Education, 2 (1).

Mendenhall, W. og Sincich, T. (1992). Statistik for ingeniørvidenskab og videnskab (3. ed.), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Statistikker for ansøgninger, efterår 2006, sektion 14, enkel lineær regression. (Massachusetts Institute of Technology: MIT OpenCourseWare)