记一次天池参赛总结

第一次参加这类的算法比赛，记录一下自己遇到的一些点，做个总结。
比较浅显的一些记录，第一次的经验之谈，适合首次参加可能容易遇到的问题

文章目录

- 平台
- 代码
- tips
- - 整理
- 加载权重文件
- autopel下载上传

平台

使用的autodl平台

下载大量数据：可以使用百度网盘的方式，不过百度网盘限速在这里同样适用，所以请开会员~~微笑脸~~
拷贝机器：代码部分可以保存为镜像，数据部分，最好租用一个地区的实例，可以同地区传输，比下载快

代码

config文件
可以将程序的一些配置写进配置文件
例如：数据类型dtype、设备cuda or cpu、数据路径、log路径、checkpoints路径、batch大小、最大训练次数等。

import torch as tclass config(object):seed = 1024dtype = t.float32device = "cuda:0" if t.cuda.is_available() else "cpu"data_dir = "/root/autodl-tmp/"log_dir = "./logs"checkpoints_dir = "./save_checkpoint"model_name = ""pretrain_model = ""  # pretrain for fine-tune# dataset confignum_step = 20  # 1 for 6-hours, 4 for 1-day, and 20 for 5-daystest_names = ["msl"]  # ["t2m", "u10", "v10", "msl", "tp"]ini_forecast_timestep =  "12" # ["00", "12", "00 & 12", "all"] # train configtrain_batch_size = 16num_workers = 16train_max_epochs = 50loss_log_iters = 100img_log_iters = 500model_save_fre = 5# valid and test configval_batch_size = 16test_batch_size = 1conf = config()

基础设置
1. 将随机数生成器的种子设置为固定值

    t.manual_seed(seed)if t.cuda.is_available():t.cuda.manual_seed(seed)t.cuda.manual_seed_all(seed)

2. 使得cuDNN来衡量自己库里面的多个卷积算法的速度，然后选择其中最快的那个卷积算法，启动算法的前期会比较慢，但算法跑起来以后会非常快

t.backends.cudnn.benchmark = False

3. 令卷积算法确定，设置随机数seed一定，可保证每次运行网络相同输入得到输出相同

t.backends.cudnn.deterministic = True

4. Tensorboard使用

from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter(log_dir=log_dir) # 设置tensorboard的找文件的文件夹
writer.add_scalar("Train/Losses/loss", loss.item(), iters)
def img_summary(img, iters, name_scope, writer):batch_size = img.size()[0]for i in range(batch_size):writer.add_images(name_scope + "/Img" + str(i + 1), img[i], iters)
utils.img_summary(output,#写入的二维函数iters,"Train/Imgs/{}/Prediction".format(conf.test_names[0].upper()),writer,)writer.close()

5. 函数使用，导入模块，函数名字即可调用

getattr(unet, conf.model_name)(conf)

6. 加载数据dataloader

    train_dataset = dataset.dataset_name(conf, train=True, test=False)train_dataloader = DataLoader(train_dataset,conf.train_batch_size,shuffle=True,#是否打乱，train打乱、valid不乱num_workers=conf.num_workers,#几个线程一起跑，考验cpupin_memory=True,#cpu会报错，gpu下物理导入，更快)

dataset类

class dataset(Dataset):def __init__(self, conf, train=True, test=False):self.data_dir = conf.data_dirself.dtype = conf.dtypeself.num_step = conf.num_stepself.input_names = xxxself.test_names = xxxself.train = trainself.test = testself.train_folder = "train"self.test_folder = "testA"self.num_data = 0self.ds = []self.load_dataset()def load_dataset(self):if self.train:······else:if not self.test:······else:······def __getitem__(self, idx):if not self.test:assert idx < self.num_data······else:assert idx < self.num_data······def __len__(self):return self.num_data