前言
STM32F3xx/STM32F4xx(ARM Cortex-M4内核)中集成了FPU,也就是浮点指令单元,可以将浮点运算变得简单快速,但如果想要发挥出这个浮点运算的最大功效,必须使用浮点指令集,开发者可以直接使用浮点指令集,但目前随着系统的集成度更大,开发者还是希望使用C语言进行编程,还要求执行时间短,当调用DSP_Lib库函数方式,时会有执行时间长的问题,本文以浮点开方为例对此类需求做相关说明。
Cortex-M4内核浮点指令集
数**算浮点指令
转移,调用,比较浮点指令
Keil编译器的浮点开方使用
1) 编译器设定
首先选择单精度浮点硬件单元
在Define部分增加ARM_MATH_CM4,__FPU_PRESENT=1,__FPU_USED =1的定义
2) 加入包含文件#include "math.h"
3) 加入测试代码
直接调用内联函数__sqrtf()
汇编代码如下, 可以直观看到VSQRT.F32这条直接使用浮点开方运算的指令
IAR编译器的浮点开方使用
1) 编译器设定
选择单精度浮点硬件单元
2) 加入包含文件#include "math.h"
3) 加入测试代码
需要调用sqrtf这个函数
汇编代码如下,可以看到VSQRT.F32这条直接使用浮点开方运算的指令
值得说明的是IAR浮点开方调用普通函数库sqrtf,这个函数库中做了数据大于0的判断, 从软件角度上更安全, 但时间会长; 而Keil的函数__sqrtf()实际上是类似inline function的属性,并没有函数调用和返回的指令,更为简单,执行时间短。