HSAT/utils.py at master · HashmatShadab/HSAT · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.autograd import Variable
import numpy as np
import random
import os
import dill


def pgd_attack(model, images, labels, device, eps=8. / 255., alpha=2. / 255., iters=20, advFlag=None, forceEval=True, randomInit=True):
    # images = images.to(device)
    # labels = labels.to(device)
    loss = nn.CrossEntropyLoss()

    # init
    if randomInit:
        delta = torch.rand_like(images) * eps * 2 - eps
    else:
        delta = torch.zeros_like(images)
    delta = torch.nn.Parameter(delta, requires_grad=True)

    for i in range(iters):
        if advFlag is None:
            if forceEval:
                model.eval()
            outputs = model(images + delta)
        else:
            if forceEval:
                model.eval()
            outputs = model(images + delta, advFlag)

        model.zero_grad()
        cost = loss(outputs, labels)
        # cost.backward()
        delta_grad = torch.autograd.grad(cost, [delta])[0]

        delta.data = delta.data + alpha * delta_grad.sign()
        delta.grad = None
        delta.data = torch.clamp(delta.data, min=-eps, max=eps)
        delta.data = torch.clamp(images + delta.data, min=0, max=1) - images

    model.zero_grad()

    return (images + delta).detach()

def trades_loss(model, x_natural, y, optimizer, step_size=2/255, epsilon=8/255, perturb_steps=10, beta=6.0, distance='l_inf'):
    batch_size = len(x_natural)
    # define KL-loss
    criterion_kl = nn.KLDivLoss(size_average=False)
    model.eval()

    # generate adversarial example
    x_adv = x_natural.detach()
    if distance == 'l_inf':
        for _ in range(perturb_steps):
            x_adv.requires_grad_()
            with torch.enable_grad():
                model.eval()
                loss_kl = criterion_kl(F.log_softmax(model(x_adv), dim=1),
                                       F.softmax(model(x_natural), dim=1))
            grad = torch.autograd.grad(loss_kl, [x_adv])[0]
            x_adv = x_adv.detach() + step_size * torch.sign(grad.detach())
            x_adv = torch.min(torch.max(x_adv, x_natural -
                              epsilon), x_natural + epsilon)
            x_adv = torch.clamp(x_adv, 0.0, 1.0)
    else:
        assert False

    x_adv = Variable(torch.clamp(x_adv, 0.0, 1.0), requires_grad=False)

    # zero gradient
    optimizer.zero_grad()
    model.train()
    # calculate robust loss
    logits = model(x_natural)

    loss = F.cross_entropy(logits, y)

    logits_adv = model(x_adv)

    loss_robust = (1.0 / batch_size) * criterion_kl(F.log_softmax(logits_adv, dim=1),
                                                    F.softmax(logits, dim=1))
    loss += beta * loss_robust

    return loss


def setup_seed(seed):
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    np.random.seed(seed)
    random.seed(seed)
    torch.backends.cudnn.deterministic = True


def save_checkpoints(epoch, model, optimizer, scheduler, train_stats,
                      name='checkpoint.pth'):
    """
    Save model, optimizer and scheduler to a checkpoint file inside out_dir.

    """
    print("Saving checkpoint to: ", os.path.join(os.getcwd(), name))
    torch.save({
        'epoch': epoch,
        'model': model.state_dict(),
        'optimizer': optimizer.state_dict(),
        'schedule': scheduler.state_dict() if scheduler else None,
        'loss': train_stats['total_loss'],
    },
        f"{name}")

def restart_from_checkpoint(checkpoint_name, model, optimizer,
                            scheduler):
    """
    New script for this codebase
    Loads model, optimizer and scheduler from a checkpoint. If the checkpoint is not found
    in the out_dir, returns 0 epoch.

    """
    if not os.path.isfile(checkpoint_name):
        print(f"Restarting: No checkpoints found in {os.getcwd()}")
        return 0, 0

    # open checkpoint file
    checkpoint = torch.load(checkpoint_name, pickle_module=dill)
    start_epoch = checkpoint['epoch']
    loss = checkpoint['loss']

    print(f"=> Restarting from checkpoint {os.path.join(os.getcwd(), checkpoint_name)} (Epoch{start_epoch})")
    if "model" in checkpoint and checkpoint['model'] is not None:
        model_weights = checkpoint["model"]
        # remove the module from the keys
        model_weights = {k.replace("module.model.model", "module.model"): v for k, v in model_weights.items()}
        msg = model.load_state_dict(model_weights, strict=False)
        print("Load model with msg: ", msg)

    if "optimizer" in checkpoint and checkpoint['optimizer'] is not None:
        msg = optimizer.load_state_dict(checkpoint['optimizer'])
        print("Load optimizer with msg: ", msg)

    if "schedule" in checkpoint and checkpoint['schedule'] is not None:
        msg = scheduler.load_state_dict(checkpoint['schedule'])
        print("Load scheduler with msg: ", msg)
    else:
        print("No scheduler in checkpoint")

    return start_epoch, loss