Del 3: Den logistiske regressionsmodel

Forventet tid ca. 45 min.

Aktivitet 1

Start med at se denne video (eller læs afsnittet den logistiske regressionsmodel):

Aktivitet 2

Lav nedenstående opgave.

Opgave 1

I denne opgave ser vi på sandsynligheden p(x) for at lide af forhøjet blodtryk som funktion af kolestreroltallet x. Vi kigger derfor på datasættet nedenfor, som er en udvalgt del af et virkeligt datasæt. I tabellen angiver y=1 forhøjet blodtryk, mens y=0 angiver normalt blodtryk.

  • Lav en tabel, hvor du beregner sandsynligheden for forhøjet blodtryk, odds og ln(odds) inden for hvert interval.

  • Indtegn punkter i et koordinatsystem, hvor x-værdien er midtpunkterne for intervallerne, og y-værdien er de tilhørende ln(odds).

  • Ser sammenhængen lineær ud?

  • Vil det give mening at bruge en logistisk regression?

x y=0 y=1
]100,150] 27 6
]150,200] 693 202
]200,250] 1354 571
]250,300] 716 471
]300,350] 156 132
]350,400] 20 23
]400,450] 2 5

1 Forhøjet blodtryk er defineret som systolisk blodtryk højere end 140mmHg eller diastolisk blodtryk højere end 90mmHg.