一个对齐的问题
最近碰到一个问题,有个程序是跑在ARM cortex M4上。 之前用-O0编译的时候运行一切正常, 但用-O3编译就会有unaligned的UsageFault。但因为空间的问题又必须用-O3编译。
问题的原因
跟踪调试了一些,出问题的是下面的代码:
1 | uint32_t *txb = (uint32_t*)buf; |
而这里的buf本来是一个uint8的指针,并且因为上层传输协议的原因,地址并不是4字节对齐的。在用-O0编译的时候,汇编代码如下:
1 | LDR r0,[r11],#04 |
其中LDR/STR 这一系列的指令是可以用unaligned的地址的,只是速度会变慢。
如果用-O3编译,汇编代码就变成这样:
1 | LDM r0!,{r2} |
编译器认为LDM指令更加高效,替换了LDR指令。 但LDM/STM/LDRD/STRD这几个指令不支持unaligned的访问,所以一定会有UsageFault。
问题的预防
我们可以设置UNALIGN_TRP, 这样即使使用LDR指令,如果有unaligned的访问也会有UsageFault。这用就可以发现代码中的非对齐的问题。
1 | SCB->CCR |= SCB_CCR_UNALIGN_TRP_Msk; |