Finito 2

97cf5191 · Matt · 74acc629 · 96bb5456 · 97cf5191 · 97cf5191
Commit 97cf5191 authored Apr 5, 2022 by Matt
--- a/ALSMF.ipynb
+++ b/ALSMF.ipynb
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 5,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "=================================================================================================\n",
+      "Factorization method: bmf\n",
+      "Initialization method: nndsvd\n",
+      "Basis matrix W: \n",
+      "Mixture (Coefficient) matrix H0: \n",
+      "Distance (Euclidean):  431720.4844872935\n",
+      "Actual number of iterations:  12\n",
+      "Sparseness basis:  0.1187, Sparseness mixture:  0.5198\n",
+      "Explained variance:  0.20623274555185334\n",
+      "Residual sum of squares:  431720.4844872936\n",
+      "=================================================================================================\n"
+     ]
+    }
+   ],
+   "source": [
+    "from main import *\n",
+    "import os\n",
+    "from collections import Counter\n",
+    "from sklearn.decomposition import NMF\n",
+    "import numpy as np\n",
+    "\n",
+    "DATA_FOLDER = \"active1000\"\n",
+    "files = os.listdir(DATA_FOLDER)\n",
+    "ARBITRARY_INDEX = 0\n",
+    "filepath = os.path.join(DATA_FOLDER, files[ARBITRARY_INDEX])\n",
+    "\n",
+    "\n",
+    "data = load_data(DATA_FOLDER)\n",
+    "ratings = load_dataset(data)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 26,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from concurrent.futures import ThreadPoolExecutor\n",
+    "from concurrent.futures import as_completed\n",
+    "\n",
+    "class ALSMF():\n",
+    "    def __init__(self, data, featureCount, a = 40, lambd = 10):\n",
+    "        self.data = data\n",
+    "        self.featureCount = featureCount\n",
+    "        self.a = a\n",
+    "        self.lambd= lambd\n",
+    "        self.userCount = data.shape[0]\n",
+    "        self.itemCount = data.shape[1]\n",
+    "        self.userFeatures = np.random.rand(self.userCount, self.featureCount)\n",
+    "        self.itemFeatures = np.random.rand(self.itemCount, self.featureCount)\n",
+    "        self.confidence = 1 + a*self.data\n",
+    "        self.loss = []\n",
+    "\n",
+    "\n",
+    "    def MSE(self):\n",
+    "        \"\"\"\n",
+    "        Mean Squared Error. It compares the dor product of user.feature row and feature-item column to user-item cell\n",
+    "        \"\"\"\n",
+    "        matrixProduct = np.matmul(self.userFeatures, self.itemFeatures)\n",
+    "        res = np.sum((self.data - matrixProduct)**2)\n",
+    "        return res\n",
+    "\n",
+    "\n",
+    "    def updateItemFeatures(self, l2Reg):\n",
+    "        fixedUsers = self.userFeatures.T.dot(self.userFeatures)\n",
+    "        for i in range(self.itemCount):\n",
+    "            print(\"Jobber med item features 1\")\n",
+    "            itemConf = np.diag(self.confidence[:, i])\n",
+    "            print(\"Jobber med item features 2\")\n",
+    "            w_i = fixedUsers + self.userFeatures.T.dot(itemConf - np.identity(self.userCount)).dot(self.userFeatures) + l2Reg\n",
+    "            print(\"Jobber med item features 3\")\n",
+    "            self.itemFeatures[i] = np.linalg.inv(w_i).dot(self.userFeatures.T.dot(itemConf).dot(self.data[:,i]))\n",
+    "\n",
+    "\n",
+    "    def updateUserFeatures(self, l2Reg):\n",
+    "        fixedItems = self.itemFeatures.T.dot(self.itemFeatures)\n",
+    "        for i in range(self.userCount):\n",
+    "            print(\"Jobber med user features 1\")\n",
+    "            print(self.userCount)\n",
+    "            print(self.itemCount)\n",
+    "            userConf = np.diag(self.confidence[i, :])\n",
+    "            print(\"Jobber med user features 2\")\n",
+    "            w_u = fixedItems + self.itemFeatures.T.dot(userConf - np.identity(self.itemCount)).dot(self.itemFeatures) + l2Reg\n",
+    "            print(\"Jobber med user features 3\")\n",
+    "            self.userFeatures[i] = np.linalg.inv(w_u).dot(self.itemFeatures.T.dot(userConf).dot(self.data[i,:]))\n",
+    "\n",
+    "\n",
+    "    def train(self, iterations = 10):\n",
+    "        l2Reg = self.lambd * np.identity(self.featureCount)\n",
+    "        for i in range(iterations):\n",
+    "            print(\"iteration: \" + str(i))\n",
+    "            self.updateUserFeatures(l2Reg)\n",
+    "            print(\"User features done\")\n",
+    "            self.updateItemFeatures(l2Reg)\n",
+    "            print(\"Item features done\")\n",
+    "            tempLoss = (self.confidence * (self.data - self.userFeatures.dot(self.itemFeatures.T))**2).sum()\n",
+    "            tempL2 = (pow(self.userFeatures, 2).sum() + pow(self.itemFeatures, 2).sum())\n",
+    "            self.loss.append(tempLoss + self.lambd + tempL2)\n",
+    "            print(\"MSE: \" + str(self.MSE()))\n",
+    "\n",
+    "#https://everdark.github.io/k9/notebooks/ml/matrix_factorization/matrix_factorization.nb.html\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 27,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "iteration: 0\n",
+      "Jobber med user features 1\n",
+      "1000\n",
+      "20344\n",
+      "Jobber med user features 2\n",
+      "Jobber med user features 3\n",
+      "Jobber med user features 1\n",
+      "1000\n",
+      "20344\n",
+      "Jobber med user features 2\n"
+     ]
+    },
+    {
+     "ename": "KeyboardInterrupt",
+     "evalue": "",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[1;31mKeyboardInterrupt\u001b[0m                         Traceback (most recent call last)",
+      "\u001b[1;32md:\\Projects\\RecommenderSystems\\recommender-system\\ALSMF.ipynb Cell 3'\u001b[0m in \u001b[0;36m<cell line: 2>\u001b[1;34m()\u001b[0m\n\u001b[0;32m      <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000002?line=0'>1</a>\u001b[0m model \u001b[39m=\u001b[39m ALSMF(ratings, \u001b[39m5\u001b[39m, \u001b[39m40\u001b[39m, \u001b[39m10\u001b[39m)\n\u001b[1;32m----> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000002?line=1'>2</a>\u001b[0m model\u001b[39m.\u001b[39;49mtrain()\n",
+      "\u001b[1;32md:\\Projects\\RecommenderSystems\\recommender-system\\ALSMF.ipynb Cell 2'\u001b[0m in \u001b[0;36mALSMF.train\u001b[1;34m(self, iterations)\u001b[0m\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=49'>50</a>\u001b[0m \u001b[39mfor\u001b[39;00m i \u001b[39min\u001b[39;00m \u001b[39mrange\u001b[39m(iterations):\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=50'>51</a>\u001b[0m     \u001b[39mprint\u001b[39m(\u001b[39m\"\u001b[39m\u001b[39miteration: \u001b[39m\u001b[39m\"\u001b[39m \u001b[39m+\u001b[39m \u001b[39mstr\u001b[39m(i))\n\u001b[1;32m---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=51'>52</a>\u001b[0m     \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49mupdateUserFeatures(l2Reg)\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=52'>53</a>\u001b[0m     \u001b[39mprint\u001b[39m(\u001b[39m\"\u001b[39m\u001b[39mUser features done\u001b[39m\u001b[39m\"\u001b[39m)\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=53'>54</a>\u001b[0m     \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mupdateItemFeatures(l2Reg)\n",
+      "\u001b[1;32md:\\Projects\\RecommenderSystems\\recommender-system\\ALSMF.ipynb Cell 2'\u001b[0m in \u001b[0;36mALSMF.updateUserFeatures\u001b[1;34m(self, l2Reg)\u001b[0m\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=40'>41</a>\u001b[0m userConf \u001b[39m=\u001b[39m np\u001b[39m.\u001b[39mdiag(\u001b[39mself\u001b[39m\u001b[39m.\u001b[39mconfidence[i, :])\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=41'>42</a>\u001b[0m \u001b[39mprint\u001b[39m(\u001b[39m\"\u001b[39m\u001b[39mJobber med user features 2\u001b[39m\u001b[39m\"\u001b[39m)\n\u001b[1;32m---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=42'>43</a>\u001b[0m w_u \u001b[39m=\u001b[39m fixedItems \u001b[39m+\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mitemFeatures\u001b[39m.\u001b[39mT\u001b[39m.\u001b[39mdot(userConf \u001b[39m-\u001b[39;49m np\u001b[39m.\u001b[39;49midentity(\u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49mitemCount))\u001b[39m.\u001b[39mdot(\u001b[39mself\u001b[39m\u001b[39m.\u001b[39mitemFeatures) \u001b[39m+\u001b[39m l2Reg\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=43'>44</a>\u001b[0m \u001b[39mprint\u001b[39m(\u001b[39m\"\u001b[39m\u001b[39mJobber med user features 3\u001b[39m\u001b[39m\"\u001b[39m)\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=44'>45</a>\u001b[0m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39muserFeatures[i] \u001b[39m=\u001b[39m np\u001b[39m.\u001b[39mlinalg\u001b[39m.\u001b[39minv(w_u)\u001b[39m.\u001b[39mdot(\u001b[39mself\u001b[39m\u001b[39m.\u001b[39mitemFeatures\u001b[39m.\u001b[39mT\u001b[39m.\u001b[39mdot(userConf)\u001b[39m.\u001b[39mdot(\u001b[39mself\u001b[39m\u001b[39m.\u001b[39mdata[i,:]))\n",
+      "\u001b[1;31mKeyboardInterrupt\u001b[0m: "
+     ]
+    }
+   ],
+   "source": [
+    "model = ALSMF(ratings, 5, 40, 10)\n",
+    "model.train()"
+   ]
+  }
+ ],
+ "metadata": {
+  "interpreter": {
+   "hash": "5610483dab37edbd1464f63c36da6df48a47e5b3ff6ab353d79a6c7444d50fe3"
+  },
+  "kernelspec": {
+   "display_name": "Python 3.9.12 64-bit (windows store)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.9.12"
+  },
+  "orig_nbformat": 4
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
+%% Cell type:code id: tags:
+``` python
+from main import *
+import os
+from collections import Counter
+from sklearn.decomposition import NMF
+import numpy as np
+DATA_FOLDER = "active1000"
+files = os.listdir(DATA_FOLDER)
+ARBITRARY_INDEX = 0
+filepath = os.path.join(DATA_FOLDER, files[ARBITRARY_INDEX])
+data = load_data(DATA_FOLDER)
+ratings = load_dataset(data)
+```
+%% Output
+    =================================================================================================
+    Factorization method: bmf
+    Initialization method: nndsvd
+    Basis matrix W:
+    Mixture (Coefficient) matrix H0:
+    Distance (Euclidean):  431720.4844872935
+    Actual number of iterations:  12
+    Sparseness basis:  0.1187, Sparseness mixture:  0.5198
+    Explained variance:  0.20623274555185334
+    Residual sum of squares:  431720.4844872936
+    =================================================================================================
+%% Cell type:code id: tags:
+``` python
+from concurrent.futures import ThreadPoolExecutor
+from concurrent.futures import as_completed
+class ALSMF():
+    def __init__(self, data, featureCount, a = 40, lambd = 10):
+        self.data = data
+        self.featureCount = featureCount
+        self.a = a
+        self.lambd= lambd
+        self.userCount = data.shape[0]
+        self.itemCount = data.shape[1]
+        self.userFeatures = np.random.rand(self.userCount, self.featureCount)
+        self.itemFeatures = np.random.rand(self.itemCount, self.featureCount)
+        self.confidence = 1 + a*self.data
+        self.loss = []
+    def MSE(self):
+        """
+        Mean Squared Error. It compares the dor product of user.feature row and feature-item column to user-item cell
+        """
+        matrixProduct = np.matmul(self.userFeatures, self.itemFeatures)
+        res = np.sum((self.data - matrixProduct)**2)
+        return res
+    def updateItemFeatures(self, l2Reg):
+        fixedUsers = self.userFeatures.T.dot(self.userFeatures)
+        for i in range(self.itemCount):
+            print("Jobber med item features 1")
+            itemConf = np.diag(self.confidence[:, i])
+            print("Jobber med item features 2")
+            w_i = fixedUsers + self.userFeatures.T.dot(itemConf - np.identity(self.userCount)).dot(self.userFeatures) + l2Reg
+            print("Jobber med item features 3")
+            self.itemFeatures[i] = np.linalg.inv(w_i).dot(self.userFeatures.T.dot(itemConf).dot(self.data[:,i]))
+    def updateUserFeatures(self, l2Reg):
+        fixedItems = self.itemFeatures.T.dot(self.itemFeatures)
+        for i in range(self.userCount):
+            print("Jobber med user features 1")
+            print(self.userCount)
+            print(self.itemCount)
+            userConf = np.diag(self.confidence[i, :])
+            print("Jobber med user features 2")
+            w_u = fixedItems + self.itemFeatures.T.dot(userConf - np.identity(self.itemCount)).dot(self.itemFeatures) + l2Reg
+            print("Jobber med user features 3")
+            self.userFeatures[i] = np.linalg.inv(w_u).dot(self.itemFeatures.T.dot(userConf).dot(self.data[i,:]))
+    def train(self, iterations = 10):
+        l2Reg = self.lambd * np.identity(self.featureCount)
+        for i in range(iterations):
+            print("iteration: " + str(i))
+            self.updateUserFeatures(l2Reg)
+            print("User features done")
+            self.updateItemFeatures(l2Reg)
+            print("Item features done")
+            tempLoss = (self.confidence * (self.data - self.userFeatures.dot(self.itemFeatures.T))**2).sum()
+            tempL2 = (pow(self.userFeatures, 2).sum() + pow(self.itemFeatures, 2).sum())
+            self.loss.append(tempLoss + self.lambd + tempL2)
+            print("MSE: " + str(self.MSE()))
+#https://everdark.github.io/k9/notebooks/ml/matrix_factorization/matrix_factorization.nb.html
+```
+%% Cell type:code id: tags:
+``` python
+model = ALSMF(ratings, 5, 40, 10)
+model.train()
+```
+%% Output
+    iteration: 0
+    Jobber med user features 1
+    1000
+    20344
+    Jobber med user features 2
+    Jobber med user features 3
+    Jobber med user features 1
+    1000
+    20344
+    Jobber med user features 2
+    ---------------------------------------------------------------------------
+    KeyboardInterrupt                         Traceback (most recent call last)
+    d:\Projects\RecommenderSystems\recommender-system\ALSMF.ipynb Cell 3' in <cell line: 2>()
+          <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000002?line=0'>1</a> model = ALSMF(ratings, 5, 40, 10)
+    ----> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000002?line=1'>2</a> model.train()
+    d:\Projects\RecommenderSystems\recommender-system\ALSMF.ipynb Cell 2' in ALSMF.train(self, iterations)
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=49'>50</a> for i in range(iterations):
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=50'>51</a>     print("iteration: " + str(i))
+    ---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=51'>52</a>     self.updateUserFeatures(l2Reg)
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=52'>53</a>     print("User features done")
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=53'>54</a>     self.updateItemFeatures(l2Reg)
+    d:\Projects\RecommenderSystems\recommender-system\ALSMF.ipynb Cell 2' in ALSMF.updateUserFeatures(self, l2Reg)
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=40'>41</a> userConf = np.diag(self.confidence[i, :])
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=41'>42</a> print("Jobber med user features 2")
+    ---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=42'>43</a> w_u = fixedItems + self.itemFeatures.T.dot(userConf - np.identity(self.itemCount)).dot(self.itemFeatures) + l2Reg
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=43'>44</a> print("Jobber med user features 3")
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/ALSMF.ipynb#ch0000001?line=44'>45</a> self.userFeatures[i] = np.linalg.inv(w_u).dot(self.itemFeatures.T.dot(userConf).dot(self.data[i,:]))
+    KeyboardInterrupt:
--- a/MFAlgorithm.ipynb
+++ b/MFAlgorithm.ipynb
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from main import *\n",
+    "import os\n",
+    "from collections import Counter\n",
+    "from sklearn.decomposition import NMF\n",
+    "import numpy as np\n",
+    "\n",
+    "DATA_FOLDER = \"active1000\"\n",
+    "files = os.listdir(DATA_FOLDER)\n",
+    "ARBITRARY_INDEX = 0\n",
+    "filepath = os.path.join(DATA_FOLDER, files[ARBITRARY_INDEX])\n",
+    "\n",
+    "\n",
+    "data = load_data(DATA_FOLDER)\n",
+    "ratings = load_dataset(data)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "0\n",
+      "user feature done\n",
+      "print item feature done\n"
+     ]
+    },
+    {
+     "ename": "TypeError",
+     "evalue": "can only concatenate str (not \"numpy.float64\") to str",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[1;31mTypeError\u001b[0m                                 Traceback (most recent call last)",
+      "\u001b[1;32md:\\Projects\\RecommenderSystems\\recommender-system\\MFAlgorithm.ipynb Cell 2'\u001b[0m in \u001b[0;36m<cell line: 89>\u001b[1;34m()\u001b[0m\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=84'>85</a>\u001b[0m         \u001b[39mreturn\u001b[39;00m predictions\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=87'>88</a>\u001b[0m model \u001b[39m=\u001b[39m MFAlgorithm(ratings, \u001b[39m20\u001b[39m)\n\u001b[1;32m---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=88'>89</a>\u001b[0m model\u001b[39m.\u001b[39;49mtrainModel()\n",
+      "\u001b[1;32md:\\Projects\\RecommenderSystems\\recommender-system\\MFAlgorithm.ipynb Cell 2'\u001b[0m in \u001b[0;36mMFAlgorithm.trainModel\u001b[1;34m(self, learningRate, iterations)\u001b[0m\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=74'>75</a>\u001b[0m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mupdateItemFeatures(learningRate\u001b[39m=\u001b[39mlearningRate)\n\u001b[0;32m     <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=75'>76</a>\u001b[0m \u001b[39mprint\u001b[39m(\u001b[39m\"\u001b[39m\u001b[39mprint item feature done\u001b[39m\u001b[39m\"\u001b[39m)\n\u001b[1;32m---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=76'>77</a>\u001b[0m \u001b[39mprint\u001b[39m(\u001b[39m\"\u001b[39;49m\u001b[39mMSE: \u001b[39;49m\u001b[39m\"\u001b[39;49m \u001b[39m+\u001b[39;49m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49mMSE())\n",
+      "\u001b[1;31mTypeError\u001b[0m: can only concatenate str (not \"numpy.float64\") to str"
+     ]
+    }
+   ],
+   "source": [
+    "class MFAlgorithm():\n",
+    "\n",
+    "    def __init__(self, data, featureCount):\n",
+    "        self.data = data\n",
+    "        self.featureCount = featureCount\n",
+    "        self.userCount = data.shape[0]\n",
+    "        self.itemCount = data.shape[1]\n",
+    "        #randomly ininitialize the features matrices for users and items\n",
+    "        self.userFeatures = np.random.uniform(low = 0.1, high = 0.9, size = (self.userCount, self.featureCount))\n",
+    "        self.itemFeatures = np.random.uniform(low = 0.1, high = 0.9, size = (self.featureCount, self.itemCount))\n",
+    "\n",
+    "    \n",
+    "    def MSE(self):\n",
+    "        \"\"\"\n",
+    "        Mean Squared Error. It compares the dor product of user.feature row and feature-item column to user-item cell\n",
+    "        \"\"\"\n",
+    "        matrixProduct = np.matmul(self.userFeatures, self.itemFeatures)\n",
+    "        res = np.sum((self.data - matrixProduct)**2)\n",
+    "        return res\n",
+    "\n",
+    "    \n",
+    "    def singleGradient(self, userRowIndex, itemCollumnIndex, userIndex=None, itemIndex=None):\n",
+    "        \"\"\"\n",
+    "        Computes gradient of single user-item cell to a single user-feature or feature-item cell\n",
+    "        \"\"\"\n",
+    "        if userIndex != None and itemIndex != None:\n",
+    "            return \"Too many elements\"\n",
+    "        elif userIndex == None and itemIndex == None:\n",
+    "            return \"not enough elements\"\n",
+    "        else:\n",
+    "            userRow = self.userFeatures[userRowIndex, :]\n",
+    "            itemCollumn = self.itemFeatures[:, itemCollumnIndex]\n",
+    "            UIRating = float(self.data[userRowIndex, itemCollumnIndex])\n",
+    "            prediction = float(np.dot(userRow, itemCollumn))\n",
+    "            if userIndex != None:\n",
+    "                rowElement = float(itemCollumn[userIndex])\n",
+    "                gradient = (UIRating - prediction)*rowElement*2\n",
+    "            else:\n",
+    "                collumnElement = float(userRow[itemIndex])\n",
+    "                gradient = (UIRating - prediction)*collumnElement*2\n",
+    "        return gradient\n",
+    "    \n",
+    "\n",
+    "    def userFeatureGradient(self, userRow, userIndex):\n",
+    "        sum = 0\n",
+    "        for i in range(0, self.itemCount):\n",
+    "            sum += self.singleGradient(userRowIndex=userRow, itemCollumnIndex=i, userIndex=userIndex)\n",
+    "        res = sum / self.itemCount\n",
+    "        return res\n",
+    "    \n",
+    "\n",
+    "    def itemFeatureGradient(self, itemCollumn, itemIndex):\n",
+    "        sum = 0\n",
+    "        for i in range(0, self.userCount):\n",
+    "            sum += self.singleGradient(userRowIndex=i, itemCollumnIndex=itemCollumn, itemIndex=itemIndex)\n",
+    "        res = sum / self.itemCount\n",
+    "        return res\n",
+    "    \n",
+    "\n",
+    "    def updateUserFeatures(self, learningRate):\n",
+    "        for i in range(0, self.userCount):\n",
+    "            for j in range(0, self.featureCount):\n",
+    "                self.userFeatures[i, j] += learningRate*self.userFeatureGradient(userRow=i, userIndex=j)\n",
+    "    \n",
+    "    def updateItemFeatures(self, learningRate):\n",
+    "        for i in range(0, self.featureCount):\n",
+    "            for j in range(0, self.itemCount):\n",
+    "                self.itemFeatures[i, j] += learningRate*self.itemFeatureGradient(itemCollumn=j, itemIndex=i)\n",
+    "\n",
+    "    def trainModel(self, learningRate=0.5, iterations = 100):\n",
+    "        for i in range(iterations):\n",
+    "            print(i)\n",
+    "            self.updateUserFeatures(learningRate=learningRate)\n",
+    "            print(\"user feature done\")\n",
+    "            self.updateItemFeatures(learningRate=learningRate)\n",
+    "            print(\"item feature done\")\n",
+    "            print(\"MSE: \" + str(self.MSE()))\n",
+    "    \n",
+    "\n",
+    "    def predict(self):\n",
+    "        predictions = np.zeros(self.userCount, self.itemCount)\n",
+    "        for i in range(self.userCount):\n",
+    "            for j in range(self.itemCount):\n",
+    "                predictions[i][j] = np.dot(self.userFeatures[i, :], self.itemFeatures[:, j])\n",
+    "        return predictions\n",
+    "\n",
+    "\n",
+    "model = MFAlgorithm(ratings, 20)\n",
+    "model.trainModel()"
+   ]
+  }
+ ],
+ "metadata": {
+  "interpreter": {
+   "hash": "5610483dab37edbd1464f63c36da6df48a47e5b3ff6ab353d79a6c7444d50fe3"
+  },
+  "kernelspec": {
+   "display_name": "Python 3.9.12 64-bit (windows store)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.9.12"
+  },
+  "orig_nbformat": 4
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
+%% Cell type:code id: tags:
+``` python
+from main import *
+import os
+from collections import Counter
+from sklearn.decomposition import NMF
+import numpy as np
+DATA_FOLDER = "active1000"
+files = os.listdir(DATA_FOLDER)
+ARBITRARY_INDEX = 0
+filepath = os.path.join(DATA_FOLDER, files[ARBITRARY_INDEX])
+data = load_data(DATA_FOLDER)
+ratings = load_dataset(data)
+```
+%% Cell type:code id: tags:
+``` python
+class MFAlgorithm():
+    def __init__(self, data, featureCount):
+        self.data = data
+        self.featureCount = featureCount
+        self.userCount = data.shape[0]
+        self.itemCount = data.shape[1]
+        #randomly ininitialize the features matrices for users and items
+        self.userFeatures = np.random.uniform(low = 0.1, high = 0.9, size = (self.userCount, self.featureCount))
+        self.itemFeatures = np.random.uniform(low = 0.1, high = 0.9, size = (self.featureCount, self.itemCount))
+    def MSE(self):
+        """
+        Mean Squared Error. It compares the dor product of user.feature row and feature-item column to user-item cell
+        """
+        matrixProduct = np.matmul(self.userFeatures, self.itemFeatures)
+        res = np.sum((self.data - matrixProduct)**2)
+        return res
+    def singleGradient(self, userRowIndex, itemCollumnIndex, userIndex=None, itemIndex=None):
+        """
+        Computes gradient of single user-item cell to a single user-feature or feature-item cell
+        """
+        if userIndex != None and itemIndex != None:
+            return "Too many elements"
+        elif userIndex == None and itemIndex == None:
+            return "not enough elements"
+        else:
+            userRow = self.userFeatures[userRowIndex, :]
+            itemCollumn = self.itemFeatures[:, itemCollumnIndex]
+            UIRating = float(self.data[userRowIndex, itemCollumnIndex])
+            prediction = float(np.dot(userRow, itemCollumn))
+            if userIndex != None:
+                rowElement = float(itemCollumn[userIndex])
+                gradient = (UIRating - prediction)*rowElement*2
+            else:
+                collumnElement = float(userRow[itemIndex])
+                gradient = (UIRating - prediction)*collumnElement*2
+        return gradient
+    def userFeatureGradient(self, userRow, userIndex):
+        sum = 0
+        for i in range(0, self.itemCount):
+            sum += self.singleGradient(userRowIndex=userRow, itemCollumnIndex=i, userIndex=userIndex)
+        res = sum / self.itemCount
+        return res
+    def itemFeatureGradient(self, itemCollumn, itemIndex):
+        sum = 0
+        for i in range(0, self.userCount):
+            sum += self.singleGradient(userRowIndex=i, itemCollumnIndex=itemCollumn, itemIndex=itemIndex)
+        res = sum / self.itemCount
+        return res
+    def updateUserFeatures(self, learningRate):
+        for i in range(0, self.userCount):
+            for j in range(0, self.featureCount):
+                self.userFeatures[i, j] += learningRate*self.userFeatureGradient(userRow=i, userIndex=j)
+    def updateItemFeatures(self, learningRate):
+        for i in range(0, self.featureCount):
+            for j in range(0, self.itemCount):
+                self.itemFeatures[i, j] += learningRate*self.itemFeatureGradient(itemCollumn=j, itemIndex=i)
+    def trainModel(self, learningRate=0.5, iterations = 100):
+        for i in range(iterations):
+            print(i)
+            self.updateUserFeatures(learningRate=learningRate)
+            print("user feature done")
+            self.updateItemFeatures(learningRate=learningRate)
+            print("item feature done")
+            print("MSE: " + str(self.MSE()))
+    def predict(self):
+        predictions = np.zeros(self.userCount, self.itemCount)
+        for i in range(self.userCount):
+            for j in range(self.itemCount):
+                predictions[i][j] = np.dot(self.userFeatures[i, :], self.itemFeatures[:, j])
+        return predictions
+model = MFAlgorithm(ratings, 20)
+model.trainModel()
+```
+%% Output
+    0
+    user feature done
+    print item feature done
+    ---------------------------------------------------------------------------
+    TypeError                                 Traceback (most recent call last)
+    d:\Projects\RecommenderSystems\recommender-system\MFAlgorithm.ipynb Cell 2' in <cell line: 89>()
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=84'>85</a>         return predictions
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=87'>88</a> model = MFAlgorithm(ratings, 20)
+    ---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=88'>89</a> model.trainModel()
+    d:\Projects\RecommenderSystems\recommender-system\MFAlgorithm.ipynb Cell 2' in MFAlgorithm.trainModel(self, learningRate, iterations)
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=74'>75</a> self.updateItemFeatures(learningRate=learningRate)
+         <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=75'>76</a> print("print item feature done")
+    ---> <a href='vscode-notebook-cell:/d%3A/Projects/RecommenderSystems/recommender-system/MFAlgorithm.ipynb#ch0000001?line=76'>77</a> print("MSE: " + self.MSE())
+    TypeError: can only concatenate str (not "numpy.float64") to str
--- a/MFAlgorithm.py
+++ b/MFAlgorithm.py
+from main import *
+import os
+from collections import Counter
+from sklearn.decomposition import NMF
+import numpy as np
+DATA_FOLDER = "active1000"
+files = os.listdir(DATA_FOLDER)
+ARBITRARY_INDEX = 0
+filepath = os.path.join(DATA_FOLDER, files[ARBITRARY_INDEX])
+data = load_data(DATA_FOLDER)
+ratings = load_dataset(data)
+#print(data)
+#print(ratings)
+#print(type(ratings))
+class MFAlgorithm():
+    def __init__(self, data, featureCount):
+        self.data = data
+        self.featureCount = featureCount
+        self.userCount = data.shape[0]
+        self.itemCount = data.shape[1]
+        #randomly ininitialize the features matrices for users and items
+        self.userFeatures = np.random.uniform(low = 0.1, high = 0.9, size = (self.userCount, self.featureCount))
+        self.itemFeatures = np.random.uniform(low = 0.1, high = 0.9, size = (self.featureCount, self.itemCount))
+    def MSE(self):
+        """
+        Mean Squared Error. It compares the dor product of user.feature row and feature-item column to user-item cell
+        """
+        matrixProduct = np.matmul(self.userFeatures, self.itemFeatures)
+        res = np.sum((self.data - matrixProduct)**2)
+        return res
+    def singleGradient(self, userRowIndex, itemCollumnIndex, userIndex=None, itemIndex=None):
+        """
+        Computes gradient of single user-item cell to a single user-feature or feature-item cell
+        """
+        if userIndex != None and itemIndex != None:
+            return "Too many elements"
+        elif userIndex == None and itemIndex == None:
+            return "not enough elements"
+        else:
+            userRow = self.userFeatures[userRowIndex, :]
+            itemCollumn = self.itemFeatures[:, itemCollumnIndex]
+            UIRating = float(self.data[userRowIndex, itemCollumnIndex])
+            prediction = float(np.dot(userRow, itemCollumn))
+            if userIndex != None:
+                rowElement = float(itemCollumn[userIndex])
+                gradient = (UIRating - prediction)*rowElement*2
+            else:
+                collumnElement = float(userRow[itemIndex])
+                gradient = (UIRating - prediction)*collumnElement*2
+        return gradient
+    def userFeatureGradient(self, userRow, userIndex):
+        sum = 0
+        for i in range(0, self.itemCount):
+            sum += self.singleGradient(userRowIndex=userRow, itemCollumnIndex=i, userIndex=userIndex)
+        res = sum / self.itemCount
+        return res
+    def itemFeatureGradient(self, itemCollumn, itemIndex):
+        sum = 0
+        for i in range(0, self.userCount):
+            sum += self.singleGradient(userRowIndex=i, itemCollumnIndex=itemCollumn, itemIndex=itemIndex)
+        res = sum / self.itemCount
+        return res
+    def updateUserFeatures(self, learningRate):
+        for i in range(0, self.userCount):
+            for j in range(0, self.featureCount):
+                self.userFeatures[i, j] += learningRate*self.userFeatureGradient(userRow=i, userIndex=j)
+    def updateItemFeatures(self, learningRate):
+        for i in range(0, self.featureCount):
+            for j in range(0, self.itemCount):
+                self.itemFeatures[i, j] += learningRate*self.itemFeatureGradient(itemCollumn=j, itemIndex=i)
+    def trainModel(self, learningRate=0.1, iterations = 1000):
+        for i in range(iterations):
+            self.updateUserFeatures(learningRate=learningRate)
+            self.updateItemFeatures(learningRate=learningRate)
+            if i % 50 == 0:
+                print(self.MSE())
+model = MFAlgorithm(ratings, 2)
+model.trainModel()
+#https://towardsdatascience.com/recommender-systems-in-python-from-scratch-643c8fc4f704
+#nmf = NMF()
+#ratings = numpy.array(ratings)
+#W = nmf.fit_transform(ratings)
+#H = nmf.components_
+#nR = numpy.dot(W, H)
+#print(nR)
--- a/__pycache__/main.cpython-39.pyc
+++ b/__pycache__/main.cpython-39.pyc