[BPnet识别MNIST09]神经网络的调试

worker

分类：机器学习

发布时间 2021.08.07阅读数 4114 评论数 0

写在前面

今天我把这个程序跑了一遍，发现实在是找不出问题了，于是我就开始反思程序逻辑上的问题，之前我的神经网络只有2个神经元输入可能太少了，导致神经网络训练的效果本身就不理想，还有我今天有复查了一下公式，又发现了一个错误，等下放出来。

神经网络模型

我将神经网络改成了输入神经元是784个，也就是说图像上的每一个像素点都最为神经网络的输入，而且我把神经网络的2个隐层里的神经元都设置为了16个，图示如下图所示：

公式更新：

python程序实现：

n_num = 16        #第二个隐层神经元数目
m_num = 16        #第一个隐层神经元数目
total_x = 784    #输入层神经元个数

for i in range(0, n_num):
    gamma[i] = random.uniform(0, start_rand_max)
    theta_2[0][i] = random.uniform(0, start_rand_max)

# init para
for i in range(0, m_num):  
    theta_1[0][i] = random.uniform(0,start_rand_max)
    for k in range(0, total_x):
        w[k][i] = random.uniform(0, start_rand_max)

for i in range(0, m_num):
    for j in range(0, n_num):
        v[i][j] = random.uniform(0, start_rand_max)

# update dw,dv,dgama,dtheta_1,dtheta_2,dtheta_3
dtheta_3 = -1 * (y_out - y) * (y_out * (1 - y_out))
for i in range(0, n_num):
    dtheta_2[0][i] = -1 * (y_out - y) * (y_out * (1 - y_out)) * gamma[i] * \
                     (n[0][i] * (1 - n[0][i]))
    dgamma[i] = (y_out - y) * (y_out * (1 - y_out)) * n[0][i]
for i in range(0, m_num):
    for j in range(0, n_num):
        dv[i][j] =  (y_out - y) * (y_out * (1 - y_out)) * (n[0][j] * (1 - n[0][j])) * \
                  gamma[j] * m[0][i]
        dtheta_1[0][i] = dtheta_1[0][i] + (-1) * (y_out - y) * (y_out * (1 - y_out)) * gamma[j] * \
                        (n[0][j] * (1 - n[0][j])) * v[i][j] * (m[0][i] * (1 - m[0][i]))

for i in range(0, total_x):
    for j in range(0, m_num):
        for k in range(0, n_num):
            dw[i][j] = dw[i][j] + (y_out - y) * (y_out * (1 - y_out)) * gamma[k] * \
                      (n[0][k] * (1 - n[0][k])) * \
                       v[j][k] * (m[0][j] * (1 - m[0][j])) * x[i]

# update w,v,gama,theta_1,theta_2,theta_3
for i in range(0, m_num):
    theta_1[0][i] = theta_1[0][i] - study_step * dtheta_1[0][i]
    for j in range(0, total_x):
        w[j][i] = w[j][i] - study_step * dw[j][i]
for i in range(0, n_num):
    theta_2[0][i] = theta_2[0][i] - study_step * dtheta_2[0][i]
    gamma[i] = gamma[i] - study_step * dgamma[i]
# print(w)
for i in range(0, m_num):
    for j in range(0, n_num):
        v[i][j] = v[i][j] - study_step * dv[i][j]
theta_3 = theta_3 - study_step * dtheta_3

结果分析

我先看了一下第一个隐层的输出：

输入层和隐层神经元的数量的增加从结果上来看并没有很大程度上改善结果的输出，于是我打印了一些sigmoid(x)函数输出的结果：

我发现这些数字的大小太相近了，我想可能是因为选择这个激励函数本身就有点问题，神经网络很有可能发生了梯度消失或者梯度爆炸，因为我这个梯度求导的数值可能一直都会小于1，所以发生了梯度消失的可能性更大，所以明天我打算换ReLU函数，公式再进行更新一下。

BP神经网络

原创文章作者：worker。如若转载，请注明出处：古月居 http://www.guyuehome.com/34719

打赏 0

上一篇：[BPnet识别MNIST08]神经网络参数初始值对于模型结果的影响

下一篇：[MNIST02]损失函数

[BPnet识别MNIST09]神经网络的调试

worker

写在前面

神经网络模型

结果分析

为你推荐

Machine Learning-L8-SVM：支持向量机全面解析

目标检测Bounding_Box_Regression_With_Uncertainty_for_Accurate_Object_Detection

Ubuntu 18.04安装CUDA 11.4.3和cuDNN 8.2.4

利用yolov5完成目标检测详细过程

基于深度学习的图像去模糊（两篇经典的文献阅读笔记）

精选【Matlab】复化梯形公式求积分、求二重积分

评论（0）

关于作者

worker

105

0

1

6

[基于Pytorch的MNIST识别01]神经网络建立

[基于Pytorch的MNIST识别04]模型调试

[MNIST03]GPU加速和过程参数保存

相关推荐

数据分类分析--决策树算法

pytorch实现yolov3(4) 非极大值抑制nms

Haar特征分类器和AdaBoost算法

精选【技术分享】使用YOLOv4跑通VOC官方数据集

【NLP】cs224n课程笔记

【强化学习与最优控制】笔记（八） 模型预测控制（Model Predictive Control）

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

TA的专栏

gazebo

c++

ros

传统路径规划方法

LeetCode

机器学习

多谢老板！

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

【强化学习与最优控制】笔记（八）模型预测控制（Model Predictive Control）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板