Hvilken politiker er du mest enig med?
Formål
Evnen til at skelne mellem forskellige kategorier er helt central for os som mennesker. Vi kan langt oftest kende forskel på et æble og en pære, på en cykel og en knallert eller på om en person er en kvinde eller en mand. Men hvordan får man en computer til at gøre det samme?
Formålet med dette forløb er at lære lidt om nogle af de metoder, som ligger bag, når en computer skal lære at kende forskel på forskellige ting. Forløbet slutter med at undersøge, hvordan en computer kan afgøre, hvor enig eller uenig man er med en given politiker.
Introduktion
Vi har apps på vores telefoner eller computere, som ud fra et billede kan genkende personer eller fra nogle få strofer kan genkende en sang. Der er scannere i lufthavne og andre steder, som kan genkende farlige ting, og biler har autopiloter, der selv holder afstanden til forankørende. Vi har også apps, som går den anden vej, og forvrænger et billede af en person, så personen bliver svær at genkende, men ofte alligevel kan genkendes, selvom ansigtet er fordrejet.
Så alle steder og hele tiden foregår der bevist eller ubevist en skelnen mellem forskellige kategorier, men hvordan foregår denne skelnen i grunden? Hvis vi skulle svare fyldestgørende på dette spørgsmål, om overhovedet muligt, ville det nok betyde et langt studie på universitetet og sikkert mere end dette, men lad os starte med et meget simpelt eksempel, og tage den derfra.
Vi får brug for din viden om afstande mellem punkter, men kommer også til senere at se på andre former for afstande. Det er en fordel af lave opgaverne i grupper, da der kan blive en del af diskutere.
VIDEO: Hvem ligner du mest?
I denne video gives en kort introduktion til forløbet.
Afstand mellem to punkter
| Farve | ||||
|---|---|---|---|---|
| Blå | \((13.8, 19.9)\) | \((8.2, 14.9)\) | \((16.4, 14.1)\) | \((15.5, 13.1)\) |
| Rød | \((10.6, 16.0)\) | \((16.3, 15.2)\) | \((15.6, 11.3)\) | |
| Grøn | \((11.1, 18.6)\) | \((16.4, 17.5)\) | \((21.7, 13.4)\) |
Opsamling
Det bliver nok klart, at der er brug for en metode til at beslutte, hvor stor radius skal være for at få det bedste resultat. Kort og lidt simpelt forklaret, involverer det noget, som man kalder træningsdata og testdata. Man har for eksempel 1000 punkter, som man kender farven på. Man lader så som om, at man ikke kender farven på for eksempel 200 af punkterne (som man så kalder testdata). Så bruger man de øvrige 800 punkter (træningsdata) til at forudsige farven af hver af de 200 punkter i testdata. Dette gør man for forskellige værdier af radius, hvorefter man vælger den radius, der forudsiger flest af de 200 punkters farve korrekt. Hvis for eksempel radius 5 forudsiger 121 punkters farve korrekt, radius 10 furudsiger 135 punkters farve korrekt, og radius 20 kun forudsiger 87 punkters farve korrekt, så har radius 10 jo klaret sig bedst.
Manhattan-afstand
I nogle situationer giver den almindelige afstand mellem punkter ikke så god mening. For eksempel er de fleste veje på Manhattan i New York enten nord-syd eller øst-vest, så man kan ikke bare gå eller køre "på skrå", men kun lodret eller vandret.
Hvis vi ser på punkterne \(P(2,3)\) og \(Q(5,7)\), så er den almindelige afstand \(5\) ved hjælp af Pythagoras, mens Manhattan-afstanden er \(3+4=7\). Dette er illustreret på figur 3.
Hvilken politiker er du mest enig med?
Op til både folketings-, kommunal- og regionalvalg kan man svare på en række spørgsmål, hvorefter ens svar bliver sammenlignet med politikernes svar på de samme spørgsmål. Herefter kan man så se, hvem man er mest enig med.
Her er et eksempel fra kommunalvalget i 2025: Tag kandidattesten Kommunalvalg 2025 - Altinget - Alt om politik: altinget.dk.
Men hvordan virker det mon? Hvordan vurderes, hvilken kandidat du er mest enig med, og hvordan udregnes, hvor mange procent enige I er?
Til hvert spørgsmål kan der svares "helt uenig", "uenig", "enig" eller "helt enig", men desuden er der en skjult "neutral" mulighed i midten, som man ikke kan vælge:
| Helt uenig | Uenig | Neutral | Enig | Helt enig |
Afstanden mellem to svar regnes som antal "felter" i tabellen, så afstanden mellem "Uenig" og "Enig" er \(2\), mens afstanden mellem "Enig" og "Helt enig" er \(1\), og den største afstand er \(4\).
I figur 5 ses en persons svar og et partis kandidaters svar på \(23\) spørgsmål. Opstillingen på figuren er lidt anderledes end på Altinget for at gøre det mere overskueligt, men indholdet er tilsvarende. Bemærk, at antallet af spørgsmål kan variere fra kommune til kommune, så du har måske færre eller flere spørgsmål.
Afstanden i det første spørgsmål er \(1\), afstanden i det andet spørgsmål også \(1\) og afstanden i det tredje spørgsmål er \(2\) på grund af den skjulte "neutral" mulighed i midten.