一个对齐的问题

最近碰到一个问题,有个程序是跑在ARM cortex M4上。 之前用-O0编译的时候运行一切正常, 但用-O3编译就会有unaligned的UsageFault。但因为空间的问题又必须用-O3编译。

问题的原因

跟踪调试了一些,出问题的是下面的代码:

1
2
3
4
5
6
uint32_t *txb = (uint32_t*)buf;
while (len) {
uint32_t data = *txb++;//UsageFault
reg_write(addr, data);
...
}

而这里的buf本来是一个uint8的指针,并且因为上层传输协议的原因,地址并不是4字节对齐的。在用-O0编译的时候,汇编代码如下:

1
2
LDR r0,[r11],#04
STR r0,[sp.#0x10]

其中LDR/STR 这一系列的指令是可以用unaligned的地址的,只是速度会变慢。

如果用-O3编译,汇编代码就变成这样:

1
2
LDM r0!,{r2}
STR r2,{r8,0x60}

编译器认为LDM指令更加高效,替换了LDR指令。 但LDM/STM/LDRD/STRD这几个指令不支持unaligned的访问,所以一定会有UsageFault。

问题的预防

我们可以设置UNALIGN_TRP, 这样即使使用LDR指令,如果有unaligned的访问也会有UsageFault。这用就可以发现代码中的非对齐的问题。

1
SCB->CCR |= SCB_CCR_UNALIGN_TRP_Msk;