-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathLogisticReg.py
More file actions
81 lines (65 loc) · 3.01 KB
/
LogisticReg.py
File metadata and controls
81 lines (65 loc) · 3.01 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
import numpy as np
class LogisticRegressionGD:
"""
A simple logistic regression for binary classification with gradient descent
"""
def __extend_X(self, X):
"""
Данный метод должен возвращать следующую матрицу:
X_ext = [1, X], где 1 - единичный вектор
это необходимо для того, чтобы было удобнее производить
вычисления, т.е., вместо того, чтобы считать X@W + b
можно было считать X_ext@W_ext
"""
return np.hstack((np.ones((X.shape[0], 1)), X))
def init_weights(self, input_size, output_size):
"""
Инициализирует параметры модели
W - матрица размерности (input_size, output_size)
инициализируется рандомными числами из
нормального распределения со средним 0 и стандартным отклонением 0.01
"""
np.random.seed(42)
self.W = np.random.normal(size=(input_size, output_size), scale=0.01)
def get_loss(self, p, y):
"""
Данный метод вычисляет логистическую функцию потерь
@param p: Вероятности принадлежности к классу 1
@param y: Истинные метки
"""
return -(y * np.log(p) + (1 - y) * np.log(1 - p)).mean()
@staticmethod
def sigmoid(x):
return 1.0 / (1.0 + np.exp(-x))
def get_prob(self, X):
"""
Данный метод вычисляет P(y=1|X,W)
Возможно, будет удобнее реализовать дополнительный
метод для вычисления сигмоиды
"""
if X.shape[1] != self.W.shape[0]:
X = self.__extend_X(X)
return self.sigmoid(X @ self.W)
def get_acc(self, p, y, threshold=0.5):
"""
Данный метод вычисляет accuracy
"""
return (y == (p >= threshold).astype('int')).mean()
def predict(self, X, threshold=0.5):
return (self.get_prob(X) >= threshold).astype('int')
def fit(self, X, y, num_epochs=100, lr=0.001):
X = self.__extend_X(X)
self.init_weights(X.shape[1], y.shape[1])
accs = []
losses = []
for _ in range(num_epochs):
p = self.get_prob(X)
W_grad = X.T @ (p - y) / X.shape[0]
self.W -= lr * W_grad
# необходимо для стабильности вычислений под логарифмом
p = np.clip(p, 1e-10, 1 - 1e-10)
log_loss = self.get_loss(p, y)
losses.append(log_loss)
acc = self.get_acc(p, y)
accs.append(acc)
return accs, losses