Forklar, hvad en bigram- og en trigram sprogmodel er.
I noten om simple sprogmodeller findes nedestående tabel, som viser hyppigheden af det lille tekstkorpus, som noten tog udgangspunkt i. Den får vi brug for i næste opgave.
en
hund
løber
efter
kat
ikke
en hund
1
0
1
2
0
0
en kat
1
0
3
0
0
0
hund en
0
1
0
0
0
0
hund løber
0
0
0
1
0
0
hund efter
2
0
0
0
0
0
løber en
0
2
0
0
0
0
løber efter
1
0
0
0
0
0
løber ikke
0
0
0
1
0
0
efter en
0
2
0
0
2
0
kat en
0
0
0
0
1
0
kat løber
2
0
0
0
0
1
ikke efter
1
0
0
0
0
0
Tabel 1: Hyppighed af trigram.
Opgave 3: Prædiktion af næste ord
I skal prøve at prædiktere næste ord i en sætning på 8 ord, som starter med "en hund" ved hjælp af tabel 1. Det kan være en fordel at printe dette klip-selv ark og klippe de forskellige ord ud.
Ved hjælp af tabel 1 kan vi se, at efter "en hund" er der mulighed for følgende ord: "en", "løber" og "efter" med sandsynlighed \(1/4\), \(1/4\) og \(1/2\).
Læg derfor følgende ord i en bunke på bordet:
enløberefterefter
Træk et tilfældigt ord fra bunken.
Nu har du prædikteret det næste ord. Fortsæt på denne måde indtil du har prædikteret 6 nye ord.
Giver din sætning mening? Hvis din sætning ikke giver mening, hvor i sætningen ryger meningen så (i starten, i midten, til slut, i hele sætningen)? Kan du komme med et bud på, hvorfor det forholder sig sådan?
Opgave 4: Prædiktion af næste ord på mobiltelefonen
De fleste mobiltelefoner kommer med et bud på hvad det næste ord i en sætning kan være, når man for eksempel skriver en sms. Hvis din lærer giver lov så prøv din telefons sprogmodel af:
Skriv en sms, hvor du starter med et valgfrit første ord. Herefter må du kun vælge de ord, som din mobil foreslår. Skriv gerne en længere sætning.
Giver din sætning mening?
Hvis din sætning ikke giver mening, hvor i sætningen ryger meningen så (i starten, i midten, til slut, i hele sætningen)? Kan du komme med et bud på, hvorfor det forholder sig sådan?