Sammenligning af DNA-strenge

C-niveau
Kort
Biologi

Forløbet kræver ingen forudsætninger.

Tidsforbrug: Ca. 1 x 60 minutter.

Formål

Formålet med dette forløb er at give en kort introduktion til, hvordan man kan måle afstanden eller forskellen mellem noget, som ikke er tal. Her skal vi konkret se på forskellen mellem to tekststrenge og mellem to DNA strenge.

Hvor ens er to tekster?

I forbindelse med at undersøge om en tekst, for eksempel en dansk stil, er plagiat, bliver det relevant at sammenligne, hvor ens to tekster er. Helt så avanceret bliver det dog ikke her.

Vi vil kun se meget simpelt på ord med \(5\) bogstaver, og hvordan man for eksempel kan måle afstande mellem forskellige ord. Vi vil se på alle kombinationer af \(5\) bogstaver, også for eksempel "xtmsp", selvom de ikke er normale ord.

NoteOpgave 1

I tabellen herunder ses ordet "nedes" sammen med ordene "model", "metal" og "nudts".

n e d e s
m o d e l
m e t a l
n u d t s
  • Hvilket af ordene "model", "metal" og "nudts" synes du, at ordet "nedes" ligner mest. Begrund dit svar.
NoteOpgave 2

Hvis vi vælger, at afstanden mellem to ord er antallet af bogstaver, som er forskellige incl. placering, så er afstanden mellem "xtmsp" og "xmtsq" \(3\), da kun \(2\) af de \(5\) bogstaver matcher incl. placering i de to ord, nemlig x og s.

  • Udregn med den metode afstanden mellem "nedes" og hver af de \(3\) ord i opgave 11. Var det sådan du allerede havde gjort det i opgave 11, eller gav dette et andet resultat?
NoteOpgave 3 (valgfri)
  • Overvej og diskuter andre måder at regne afstand mellem to ord på hver \(5\) bogstaver. Det kunne for eksempel være noget, hvor ombytning af to nabobogstaver giver mindre afstand end helt tilfældige andre bogstaver, så for eksempel "kolon" og "kloon" er tættere på hinanden end "kolon" og "kston".

DNA-strenge og alignment

Uden i øvrigt at komme ind på biologien repræsenteres DNA som meget lange tekststrenge. Når mennesker og chimpanser er meget ens, kommer det til udtryk ved, at DNA-strengen for et menneske ligner den for en chimpanse meget, der er altså en kort afstand mellem DNA for et menneske og DNA for en chimpanse. Indenfor biologien kaldes dette for alignment. I stedet for at sammenligne på DNA niveau, sammenlignes også nogle gange på aminosyre niveau, hvilket vi vil bruge her.

Følgende eksempel, der viser et meget lille udsnit af sådanne koder fra mus, rotter, mennesker og gær er taget fra Tema12-Link5.pdf (nucleus.dk), der kan anbefales, hvis man ønsker at arbejde mere med alignment.

Dyr Kode
Mus S W A W A E G W T R Y G P
Rotte K W V W A E G W T R Y G P
Menneske A W A W A E G W T R Y G P
Gær E W L R K P G W V K Y V P

Hvis afstanden her regnes som antal bogstaver, der er forskellige, ses det at afstanden mellem mus og rotte er på \(2\), som vist nedenfor.

Dyr Kode
Mus S W A W A E G W T R Y G P
Rotte K W V W A E G W T R Y G P
NoteOpgave 4

Udregn på tilsvarende vis afstandene mellem mus-menneske, mus-gær, rotte-menneske, rotte-gær og menneske-gær.

Når resultatet sikkert virker overraskende, skyldes det, at vi kun har set på et meget lille udsnit af DNA for de fire. I figur 1 har man set på hele det protein, som udsnittet stammer fra, og her bliver resultatet mere som forventet.

Figur 1: De faktiske afstande mellem mus-menneske, mus-gær, rotte-menneske, rotte-gær og menneske-gær.

Delvis facitliste

Facitliste.