Facit til forløbet "Hvad skal du se på Netflix?"
\[ \begin{aligned} & F_{\{\text{computer}\}} \approx 0.235\\ & F_{\{\text{mus}\}} \approx 0.424\\ & F_{\{\text{tastatur}\}} \approx 0.114\\ & F_{\{\text{computer,mus}\}} \approx 0.023 \\ & F_{\{\text{computer, tastatur}\}} \approx 0.052 \end{aligned} \]
\[ \begin{aligned} & \hat{P}( F_{\text{mus}} \mid F_{\text{computer}}) \approx 0.098 \\ & \hat{P}(F_{\text{tastatur}} \mid F_{\text{computer}} ) \approx 0.219 \end{aligned} \]
\[ \begin{aligned} &F_{\{\text{Blinkende Lygter}\}} = 0.75\\ &F_{\{\text{Olsen-banden}\}} =0.25 \\ &F_{\{\text{Blinkende Lygter, Olsen-banden}\}} =0.25\\ \end{aligned} \]
\[ \begin{aligned} & \hat{P}(F_{\text{Olsen-banden}}\mid F_{\text{Blinkende lygter}} ) \approx 0.33 \\ & \hat{P}( F_{\text{Hævnen}}\mid F_{\text{Blinkende lygter}}) \approx 0.67 \end{aligned} \]
Hvis \(x_2=0\) er \[ \hat{r} = 2-0.02 x_1 \] hvilket er en lineær funktion med hældning \(-0.02\) og skæring \(2\).
Hvis indholdet af romantik stiger med \(1\), så falder ratings med \(0.02\).
Hvis \(x_2=50\) er \[ \hat{r} = 4.5-0.02 x_1 \] Det vil sige, at skæringen nu er \(4.5\), mens hældningen er uændret.
De to linjer er parallelle.
Hvis indholdet af action stiger med \(1\), så stiger ratings med \(0.05\).
- Bruger 1 med \(b=2.8\), \(p_1=-0.01\), \(p_2=-0.1\) og \(p_3= 0.1\).
- Bruger 2 med \(b=-1\), \(p_1=0\), \(p_2=0\) og \(p_3=0.6\).
Ratings:
| "Titanic" | "Olsen-banden ser rødt" | "Jagten" | |
|---|---|---|---|
| Bruger 1 | \(1.95\) | \(4.92\) | \(1.28\) |
| Bruger 2 | \(3.74\) | \(3.62\) | \(3.98\) |
Vægte 1: \(b=3.8\), \(p_1=-0.02\), \(p_2=-0.05\) og \(p_3=0.3\).
"Titanic" "Olsen-banden ser rødt" "Jagten" Faktiske ratings \(r\) \(2\) \(5\) \(4\) Prædikterede ratings \(\hat{r}\) \(2.44\) \(5.21\) \(3.39\) Prædiktionsfejl \(r-\hat{r}\) \(-0.44\) \(-0.21\) \(0.61\) Værdi af tabsfunktionen: \(0.6098\).
Vægte 2: \(b=1.8\), \(p_1=0.01\), \(p_2=-0.1\) og \(p_3=0\).
"Titanic" "Olsen-banden ser rødt" "Jagten" Faktiske ratings \(r\) \(2\) \(5\) \(4\) Prædikterede ratings \(\hat{r}\) \(4.04\) \(5.25\) \(1.75\) Prædiktionsfejl \(r-\hat{r}\) \(-2.04\) \(-0.25\) \(2.25\) Værdi af tabsfunktionen: \(9.2866\).
Sreamingtjeneste med \(n=1.000.000\) brugere og \(p=10.000\) film.
Alle kombinationer af film og brugere: \(10000000000=10^{10}\) (altså 10 milliader) ratings.
Matrixfaktorisering med \(M=5\): \(M \cdot p + n \cdot M = 5050000\) vægte.
Regressionsmodel med \(M=5\) features: \(n \cdot (1+M) = 6000000\) vægte.
Prædikterede ratings \(\hat{r}_{ij}\):
"Titanic" "Ringenes Herre" "Jurassic park" Bruger 1 \(2\) \(1\) \(4\) Bruger 2 \(2\) \(1\) \(7\) Bruger 3 \(6\) \(3\) \(3\) Prædiktionsfejl \(r_{ij}-\hat{r}_{ij}\)
"Titanic" "Ringenes Herre" "Jurassic park" Bruger 1 \(-1\) NA \(0\) Bruger 2 \(1\) NA \(-2\) Bruger 3 NA \(0\) \(-1\) Værdi af tabsfunktionen: \(7\).