Facit til forløbet "Hvad skal du se på Netflix?"

\[ \begin{aligned} & F_{\{\text{computer}\}} \approx 0.235\\ & F_{\{\text{mus}\}} \approx 0.424\\ & F_{\{\text{tastatur}\}} \approx 0.114\\ & F_{\{\text{computer,mus}\}} \approx 0.023 \\ & F_{\{\text{computer, tastatur}\}} \approx 0.052 \end{aligned} \]

\[ \begin{aligned} & \hat{P}( F_{\text{mus}} \mid F_{\text{computer}}) \approx 0.098 \\ & \hat{P}(F_{\text{tastatur}} \mid F_{\text{computer}} ) \approx 0.219 \end{aligned} \]

\[ \begin{aligned} &F_{\{\text{Blinkende Lygter}\}} = 0.75\\ &F_{\{\text{Olsen-banden}\}} =0.25 \\ &F_{\{\text{Blinkende Lygter, Olsen-banden}\}} =0.25\\ \end{aligned} \]

\[ \begin{aligned} & \hat{P}(F_{\text{Olsen-banden}}\mid F_{\text{Blinkende lygter}} ) \approx 0.33 \\ & \hat{P}( F_{\text{Hævnen}}\mid F_{\text{Blinkende lygter}}) \approx 0.67 \end{aligned} \]

  • Hvis \(x_2=0\) er \[ \hat{r} = 2-0.02 x_1 \] hvilket er en lineær funktion med hældning \(-0.02\) og skæring \(2\).

    Hvis indholdet af romantik stiger med \(1\), så falder ratings med \(0.02\).

  • Hvis \(x_2=50\) er \[ \hat{r} = 4.5-0.02 x_1 \] Det vil sige, at skæringen nu er \(4.5\), mens hældningen er uændret.

    De to linjer er parallelle.

  • Hvis indholdet af action stiger med \(1\), så stiger ratings med \(0.05\).

  • Bruger 1 med \(b=2.8\), \(p_1=-0.01\), \(p_2=-0.1\) og \(p_3= 0.1\).
  • Bruger 2 med \(b=-1\), \(p_1=0\), \(p_2=0\) og \(p_3=0.6\).

Ratings:

"Titanic" "Olsen-banden ser rødt" "Jagten"
Bruger 1 \(1.95\) \(4.92\) \(1.28\)
Bruger 2 \(3.74\) \(3.62\) \(3.98\)
  • Vægte 1: \(b=3.8\), \(p_1=-0.02\), \(p_2=-0.05\) og \(p_3=0.3\).

    "Titanic" "Olsen-banden ser rødt" "Jagten"
    Faktiske ratings \(r\) \(2\) \(5\) \(4\)
    Prædikterede ratings \(\hat{r}\) \(2.44\) \(5.21\) \(3.39\)
    Prædiktionsfejl \(r-\hat{r}\) \(-0.44\) \(-0.21\) \(0.61\)

    Værdi af tabsfunktionen: \(0.6098\).

  • Vægte 2: \(b=1.8\), \(p_1=0.01\), \(p_2=-0.1\) og \(p_3=0\).

    "Titanic" "Olsen-banden ser rødt" "Jagten"
    Faktiske ratings \(r\) \(2\) \(5\) \(4\)
    Prædikterede ratings \(\hat{r}\) \(4.04\) \(5.25\) \(1.75\)
    Prædiktionsfejl \(r-\hat{r}\) \(-2.04\) \(-0.25\) \(2.25\)

    Værdi af tabsfunktionen: \(9.2866\).

Sreamingtjeneste med \(n=1.000.000\) brugere og \(p=10.000\) film.

  • Alle kombinationer af film og brugere: \(10000000000=10^{10}\) (altså 10 milliader) ratings.

  • Matrixfaktorisering med \(M=5\): \(M \cdot p + n \cdot M = 5050000\) vægte.

  • Regressionsmodel med \(M=5\) features: \(n \cdot (1+M) = 6000000\) vægte.

  • Prædikterede ratings \(\hat{r}_{ij}\):

    "Titanic" "Ringenes Herre" "Jurassic park"
    Bruger 1 \(2\) \(1\) \(4\)
    Bruger 2 \(2\) \(1\) \(7\)
    Bruger 3 \(6\) \(3\) \(3\)
  • Prædiktionsfejl \(r_{ij}-\hat{r}_{ij}\)

    "Titanic" "Ringenes Herre" "Jurassic park"
    Bruger 1 \(-1\) NA \(0\)
    Bruger 2 \(1\) NA \(-2\)
    Bruger 3 NA \(0\) \(-1\)
  • Værdi af tabsfunktionen: \(7\).