Feature-skalering
Hvis de data, man arbejder med, måler vidt forskellige ting – måske endda på vidt forskellige skalaer – så vil man som oftest have brug for at "justere" data, så de er på…
Det er ikke altid helt klart, hvordan man skal bestemme afstanden mellem to datapunkter, hvis koordinaterne i hvert datapunkter beskriver vidt forskellige ting. Det er faktisk ikke en gang entydigt, hvad man overhovedet skal forstå ved en afstand – eller det som man i matematik vil kalde for en metrik. Her på siden behandler vi nogle af disse problemstillinger. Vi vil se nærmere på, hvilke problemer, der kan opstå, hvis man ikke tænker sig om – og hvad man kan gøre for at løse dem.
Læs mere i noterne herunder.