Forventet tid ca. 45 min.
Aktivitet 2
Lav nedenstående opgave.
I denne opgave ser vi på sandsynligheden \(p(x)\) for at lide af forhøjet blodtryk som funktion af kolestreroltallet \(x\). Vi kigger derfor på datasættet nedenfor, som er en udvalgt del af et virkeligt datasæt. I tabellen angiver \(y=1\) forhøjet blodtryk, mens \(y=0\) angiver normalt blodtryk.
Lav en tabel, hvor du beregner sandsynligheden for forhøjet blodtryk, odds og ln(odds) inden for hvert interval.
Indtegn punkter i et koordinatsystem, hvor \(x\)-værdien er midtpunkterne for intervallerne, og \(y\)-værdien er de tilhørende ln(odds).
Ser sammenhængen lineær ud?
Vil det give mening at bruge en logistisk regression?
]100,150] |
27 |
6 |
]150,200] |
693 |
202 |
]200,250] |
1354 |
571 |
]250,300] |
716 |
471 |
]300,350] |
156 |
132 |
]350,400] |
20 |
23 |
]400,450] |
2 |
5 |
1 Forhøjet blodtryk er defineret som systolisk blodtryk højere end 140mmHg eller diastolisk blodtryk højere end 90mmHg.