Del 7: Vurdering af værdien af tabsfunktionen (skibidi toilet)
Forventet tid ca. 1 x 60 min.
Aktivitet 1 - Træn neuralt netværk

Vi vil se på data fra 200 fiktive personer, der efter et besøg på et museum om internetfænomener bliver spurgt, om de ved, hvad "skibidi toilet" betyder.
Der er to feature variable, \(x_1\) er personens alder, og \(x_2\) er besøgets længde i minutter, samt en target variabel \(t\), som angiver, om personen har lært, hvad "skibidi toilet" betyder (1 betyder "Ja", 0 betyder "Nej").
Data ligger i Excel-filen her. Vi vil bruge kunstig neuron app’en til at træne en model på disse data.
Det er ikke åbenlyst, om modellen er trænet godt nok, men i det følgende vil vi se på, hvad man i hvert fald kan bruge til at se, at det nok ikke er særligt godt endnu.
Aktivitet 2 - Lille eksempel
Lad os sige, at vi har spurgt 10 personer, om de ved, hvad "skibidi toilet" betyder. De 7 svarede "Ja", og de 3 svarede "Nej". Vi sætter targetværdien \(t=1\) for "Ja" og \(t=0\) for "Nej".
Vi skal så ud fra en eller flere feature variable for hver person træne en kunstig neuron til at kunne klassificere, om en ny person ved, hvad "skibidi toilet" betyder.
Vi vil dog ikke fokusere på netværket, men på mulige værdier af tabsfunktionen, idet vi bruger squared error som tabsfunktion: \[ E = \frac{1}{2} \sum \left (t-o \right)^2 \tag{1}\] hvor der summeres over alle træningsdata.
Så \(o=0.5\) giver os et udgangspunkt, som værdien af tabsfunktionen i hvert fald bør komme under, men mon ikke det kan blive bedre end det?
Normalt vil outputværdien \(o\) afhænge af vores feature variable. Men som vi gjorde det i opgave 3, vil vi nu prøve at undersøge nærmere, hvad der sker, hvis vi fastholder outputværdien på en fast værdi \(o=p\) for alle input. Det vil sige, at vi vil se på tabsfunktionen som en funktion af \(p\) alene: \(E(p)\).
Aktivitet 3 - Generalisering
I matematik vil vi rigtigt gerne generalisere, så vi ikke bare ser på et lille eksempel med \(10\) personer, hvor andelen \(q=\frac{7}{10}\) svarer "Ja", men på noget mere generelt.
Lad os derfor sige, at vores datasæt er med \(n\) personer, og at andelen af personer, som svarer "Ja", betegnes med \(q\).
Aktivitet 4 - Det store datasæt igen
Med disse overvejelser skal vi tilbage til datasættet med de 200 person om "skibidi toilet". Vi skal se, om den model, vi trænede med appen, ser ud til måske at være trænet godt nok.
I opgave 6 har du nok set, at du ved hjælp af app’en kan træne en model, hvor værdien af tabsfunktionen er væsentligt mindre end den mindste værdi af tabsfunktionen, som du kan få, hvis \(p\) er sat til den fast værdi for alle input. Det skyldes selvfølgelig, at den nye model også tager højde for de to feature variable alder (\(x_1\)) og tid (\(x_2\)), så \(p\) nu ikke længere er et fast tal, men afhænger af alder og tid.
Aktivitet 5 - Klassifikationsnøjagtigheden
Måske du i opgave 1 så på klassifikationsnøjagtigheden (CA). Hvis ikke, så lav opgave 1 igen.
Måske du har undret dig over, at vi både taler om værdien af tabsfunktionen og om CA, som jo begge siger noget om, hvor god modellen er. Lad os kigge på, om de altid følges ad.
Vi håber naturligvis, at vi ved at minimere værdien af tabsfunktionen får prædikteret flere tilfælde korrekt, men som opgave 8 viser, så er der ikke altid en 100% sammenhæng mellem lavere værdi af tabsfunktionen og bedre klassifikationsnøjagtighed.
Delvis facitliste