一个简单的神经网络项目

张

张建站

2026/4/9 6:45:09

10分钟阅读

模型的准确度不一定是直线上升的很有可能是曲折的对于训练集测试机和验证集的要求训练流程训练数据通过数据处理部分得到x,y。x通过模型部分得到预测值y尖,y与y尖处理得到lossloss乘学习率得到梯度得到梯度之后该模型就会得到更新模型就会更准回归任务看预测与真实值是否接近分类任务看分类的准确率。在验证集上不更新模型打开项目创建一个py文件按步骤进行以下操作一个项目需要dataset类dataset的结构和功能一般不推荐所有数据算一次loss一步走太远就容易走过。一般也不推荐一个数据更新一次。我们一般使用batch即一批数据算一个loss更新一次batch我们一般当作步长model的两个函数 foward函数中就是前向代码前向过程样本维度项目中加入动量即惯性动量在深度学习中的作用动量Momentum是优化算法中用于加速梯度下降的技术通过引入历史梯度信息来调整当前更新方向。其核心思想是模拟物理中的动量现象即物体运动时保持原有方向的趋势。动量算法的数学表达动量的更新规则通常表示为其中vtvt 是当前动量向量 ββ 是动量系数通常设为0.9 αα 是学习率 ∇θJ(θ)∇θJ(θ) 是当前梯度动量的主要优势加速收敛在梯度方向一致的维度上动量会累积梯度信息实现更快的参数更新。抑制震荡在梯度方向频繁变化的维度上动量能平滑更新路径减少参数震荡。逃离局部极小值动量提供的惯性有助于跳出局部最优解或鞍点。动量与普通SGD的对比普通随机梯度下降SGD动量SGD在参数更新时不仅考虑当前梯度还保留部分历史梯度信息形成更稳定的更新方向。动量系数的选择典型取值范围为0.8-0.99较低值如0.5会使优化过程更保守较高值如0.99可能导致更新速度过快常用默认值为0.9Nesterov加速梯度NAG NAG是动量的改进版本先根据累积动量进行临时更新再计算梯度这种方法能更准确地预测参数位置减少振荡。实际应用建议初始学习率设置使用动量时初始学习率通常可比普通SGD稍大。结合自适应方法现代优化器如Adam、RMSprop等已将动量与其他技术结合。批量归一化与动量优化配合使用时需注意移动平均统计量的更新方式。动量技术已成为深度学习优化器的标准组件能显著提升训练效率和模型性能。对项目进行简单的更改加入正则化缓解过拟合训练代码import matplotlib.pyplot as pltimport torchimport numpy as npimport csvimport pandas as pdfrom torch.utils.data import DataLoader, Datasetimport torch.nn as nnfrom torch import optimimport timefrom sklearn.feature_selection import SelectKBest, chi2import osos.environ[KMP_DUPLICATE_LIB_OK]TRUEdef get_feature_importance(feature_data, label_data, k 4,column None):此处省略 feature_data, label_data 的生成代码。如果是 CSV 文件可通过 read_csv() 函数获得特征和标签。这个函数的目的是找到所有的特征种比较有用的k个特征并打印这些列的名字。model SelectKBest(chi2, kk) #定义一个选择k个最佳特征的函数feature_data np.array(feature_data, dtypenp.float64)# label_data np.array(label_data, dtypenp.float64)X_new model.fit_transform(feature_data, label_data) #用这个函数选择k个最佳特征#feature_data是特征数据label_data是标签数据该函数可以选择出k个特征print(x_new, X_new)scores model.scores_ # scores即每一列与结果的相关性# 按重要性排序选出最重要的 k 个indices np.argsort(scores)[::-1] #[::-1]表示反转一个列表或者矩阵。# argsort这个函数可以矩阵排序后的下标。比如 indices[0]表示的是scores中最小值的下标。if column: # 如果需要打印选中的列k_best_features [column[i1] for i in indices[0:k].tolist()] # 选中这些列打印print(k best features are: ,k_best_features)return X_new, indices[0:k] # 返回选中列的特征和他们的下标。class CovidDataset(Dataset):def __init__(self, file_path, modetrain, all_featureFalse, feature_dim6):with open(file_path, r) as f:ori_data list(csv.reader(f))column ori_data[0]csv_data np.array(ori_data[1:])[:, 1:].astype(float)feature np.array(ori_data[1:])[:, 1:-1]label_data np.array(ori_data[1:])[:, -1]if all_feature:col np.array([i for i in range(0, 93)])else:_, col get_feature_importance(feature, label_data, feature_dim, column)col col.tolist()if mode train: #逢5取1.indices [i for i in range(len(csv_data)) if i % 5 ! 0]data torch.tensor(csv_data[indices, :-1])self.y torch.tensor(csv_data[indices, -1])elif mode val:indices [i for i in range(len(csv_data)) if i % 5 0]data torch.tensor(csv_data[indices, :-1])self.y torch.tensor(csv_data[indices, -1])else:indices [i for i in range(len(csv_data))]data torch.tensor(csv_data[indices])data data[:, col]self.data (data- data.mean(dim0, keepdimTrue))/data.std(dim0, keepdimTrue)self.mode modedef __getitem__(self, idx):if self.mode ! test:return self.data[idx].float(), self.y[idx].float()else:return self.data[idx].float()def __len__(self):return len(self.data)class MyModel(nn.Module):def __init__(self, inDim):super(MyModel, self).__init__()self.fc1 nn.Linear(inDim, 64)self.relu1 nn.ReLU()self.fc2 nn.Linear(64, 1)def forward(self, x): #模型前向过程x self.fc1(x)x self.relu1(x)x self.fc2(x)if len(x.size()) 1:return x.squeeze(1)return xdef train_val(model, train_loader, val_loader, device, epochs, optimizer, loss, save_path):model model.to(device)plt_train_loss [] #记录所有轮次的lossplt_val_loss []min_val_loss 9999999999999for epoch in range(epochs): #冲锋的号角train_loss 0.0val_loss 0.0start_time time.time()model.train() #模型调为训练模式for batch_x, batch_y in train_loader:x, target batch_x.to(device), batch_y.to(device)pred model(x)train_bat_loss loss(pred, target,model)train_bat_loss.backward()optimizer.step() #更新模型的作用optimizer.zero_grad()train_loss train_bat_loss.cpu().item()plt_train_loss.append(train_loss / train_loader.__len__())model.eval()with torch.no_grad():for batch_x, batch_y in val_loader:x, target batch_x.to(device), batch_y.to(device)pred model(x)val_bat_loss loss(pred, target,model)val_loss val_bat_loss.cpu().item()plt_val_loss.append(val_loss/ val_loader.__len__())if val_loss min_val_loss:torch.save(model, save_path)min_val_loss val_lossprint([%03d/%03d] %2.2f sec(s) Trainloss: %.6f |Valloss: %.6f% \(epoch, epochs, time.time()-start_time, plt_train_loss[-1], plt_val_loss[-1]))plt.plot(plt_train_loss)plt.plot(plt_val_loss)plt.title(loss)plt.legend([train, val])plt.show()def evaluate(sava_path, test_loader,device,rel_path ): #得出测试结果文件model torch.load(sava_path).to(device)rel []with torch.no_grad():for x in test_loader:pred model(x.to(device))rel.append(pred.cpu().item())print(rel)with open(rel_path, w,newline) as f:csvWriter csv.writer(f)csvWriter.writerow([id,tested_positive])for i, value in enumerate(rel):csvWriter.writerow([str(i), str(value)])print(文件已经保存到rel_path)all_feature Falseif all_feature:feature_dim 93else:feature_dim 6train_file covid.train.csvtest_file covid.test.csvtrain_dataset CovidDataset(train_file, train,all_featureall_feature, feature_dimfeature_dim)val_dataset CovidDataset(train_file, val,all_featureall_feature, feature_dimfeature_dim)test_dataset CovidDataset(test_file, test,all_featureall_feature, feature_dimfeature_dim)batch_size 16train_loader DataLoader(train_dataset, batch_sizebatch_size, shuffleTrue)val_loader DataLoader(val_dataset, batch_sizebatch_size, shuffleTrue)test_loader DataLoader(test_dataset, batch_size1, shuffleFalse)# for batch_x, batch_y in train_loader:# print(batch_x, batch_y)## predy model(batch_x)## file pd.read_csv(train_file)# print(file.head())#超参部分device cuda if torch.cuda.is_available() else cpuprint(device)config {lr: 0.001,epochs: 20,momentum: 0.9,save_path: model_save/best_model.pth,rel_path: pred.csv}def mseLoss_with_reg(pred, target, model):loss nn.MSELoss(reductionmean) Calculate loss regularization_loss 0 # 正则项for param in model.parameters():# TODO: you may implement L1/L2 regularization here# 使用L2正则项# regularization_loss torch.sum(abs(param))regularization_loss torch.sum(param ** 2) # 计算所有参数平方return loss(pred, target) 0.00075 * regularization_loss # 返回损失。model MyModel(inDimfeature_dim).to(device)loss mseLoss_with_regoptimizer optim.SGD(model.parameters(), lrconfig[lr], momentumconfig[momentum])train_val(model, train_loader, val_loader, device, config[epochs], optimizer, loss, config[save_path])evaluate(config[save_path], test_loader, device, config[rel_path])