STM32开发时HardFault错误的排查

本篇是 嵌入式开发-STM32硬件I2C驱动OLED屏 一文的扩展。
把相关的问题记录一下,给遇到HardFault_Handler问题的朋友做个参考。

故障现象

做STM32开发,经常遇到HardFault错误,也就是程序不会正常运行,此时若停止程序运行,会发现跳转到下面的程序段,并死循环运行,也就是著名的HardFault错误

void HardFault_Handler(void)
{
  /* USER CODE BEGIN HardFault_IRQn 0 */

  /* USER CODE END HardFault_IRQn 0 */
  while (1)
  {
    /* USER CODE BEGIN W1_HardFault_IRQn 0 */
    /* USER CODE END W1_HardFault_IRQn 0 */
  }
}

故障原因

常见故障有
1 数组越界
2 内存溢出
3 堆栈溢出
4 数据类型出错
等等

问题分析

在下图处打断点,等到运行到这个位置时会暂停,如下图:

在Call Stack Window页面,可以看到如下信息:

箭头所指,就是进入HardFault_Handler之前的函数。
这个调试窗口展示的是从main开始运行时,逐次调用函数的一个过程,
下图就是两个函数循环调用,但还没有堆栈溢出的情况,发展下去,肯定是堆栈溢出。
检查相关代码,可以发现问题。

void oled_write_onebyte(u8 data, u8 cmd)
{
  u32 ret;
  ret = HAL_I2C_Mem_Write(&hi2c2, OLED_ADDR, 0, I2C_MEMADD_SIZE_8BIT, &data, 1, 1000);
  if(ret!=0)
  {
    oled_init();
    OLED_DisPlay_Off();
    HAL_Delay(10);
    OLED_DisPlay_On();
  }
}

在oled_init()这个函数中,调用了oled_write_onebyte()这个函数,但是当oled_write_onebyte函数出错时,又会调用oled_init这个函数,于是形成嵌套,最终是堆栈资源耗完,溢出,然后进HardFault_Handler。
可以改为

If(ret!=0)
	i2c_err_flag = 1;

然后在主循环中,操作i2c相关函数时,检查i2c_err_flag的值,再进行相关处理即可。