我正在x86 CentOS 6.3(内核v2.6.32)系统上运行。
我将下面的函数编译成一个简单的字符驱动模块,作为一个实验,看看Linux内核如何对浮点操作做出反应。
static unsigned floatstuff(void){ float x = 3.14; x *= 2.5; return x; } ... printk(KERN_INFO "x: %u", x);
代码编译(这是不期望),所以我插入模块,并与dmesg
检查日志。 日志显示: x: 7
。
这似乎很奇怪, 我以为你不能在Linux内核中执行浮点操作 – 保存一些exception,比如kernel_fpu_begin()
。 模块是如何执行浮点运算的?
这是因为我在x86处理器上吗?
我以为你不能在Linux内核中执行浮点操作
你不能安全地 :使用kernel_fpu_begin()
/ kernel_fpu_end()
失败并不意味着FPU指令将会kernel_fpu_end()
至少不是x86)。
相反,它会默默地破坏用户空间的FPU状态。 这不好; 不要这样做。
编译器不知道kernel_fpu_begin()
是什么意思,所以它不能检查/警告编译到FPU开始区域以外的FPU指令的代码。
可能有一个调试模式,内核会禁用kernel_fpu_begin
/ end
区域之外的SSE,x87和MMX指令,但是速度较慢,默认情况下不会执行。
但有可能:设置CR0::TS = 1
使得x87指令发生故障,所以懒惰的FPU上下文切换是可能的,并且SSE和AVX还有其他位。
错误的内核代码有很多方法会导致严重的问题。 这只是其中之一。 在C语言中,你几乎总是知道什么时候使用浮点数(除非一个错字导致了一个常量或者在实际编译的上下文中的东西)。
为什么FP架构状态与整数不同?
Linux在进入/退出内核时必须保存/恢复整数状态。 所有代码都需要使用整数寄存器(除了一个以jmp
而不是ret
结尾的巨大的FPU计算直线块( ret
修改rsp
))。
但是内核代码一般都会避免FPU,所以Linux在系统调用时将FPU状态保留为未保存状态,仅在实际环境切换到不同的用户空间进程或kernel_fpu_begin
。 否则,通常在同一个内核上返回相同的用户空间进程,所以FPU状态不需要被恢复,因为内核没有触及它。 (如果内核任务实际上修改了FPU状态,这就是腐败发生的地方,我认为这是两种方式:用户空间也可能破坏你的 FPU状态)。
整数状态相当小,只有16×64位寄存器+ RFLAGS和段寄存器。 即使没有AVX:8x 80位x87寄存器,16x XMM或YMM或32x ZMM寄存器(+ MXCSR和x87状态+控制字),FPU状态也是两倍以上。 另外MPX bnd0-4
寄存器与“FPU” bnd0-4
在一起。 此时“FPU状态”仅表示所有非整数寄存器。 在我的Skylake上, dmesg
表示x86/fpu: Enabled xstate features 0x1f, context size is 960 bytes, using 'compacted' format.
请参阅了解Linux内核中的FPU使用情况 ; 现代Linux不会默认执行上下文切换的懒惰FPU上下文切换(仅适用于内核/用户切换)。 (但那篇文章解释了懒惰是什么。)
大多数进程使用SSE在编译器生成的代码中复制/归零小块内存,大多数库字符串/ memcpy / memset实现使用SSE / SSE2。 另外,支持硬件优化的保存/恢复是现在的事情( xsaveopt
/ xrstor),所以如果某些/所有的FP寄存器没有被实际使用,那么“急切”的FPU保存/恢复实际上可能会减少工作量。 例如只保存YMM寄存器的低vzeroupper
,如果它们用vzeroupper
归零,那么CPU知道它们是干净的。 (并且在保存格式中只标记一点)
随着“热切”的上下文切换,FPU指令始终保持启用状态,所以坏的内核代码可能会随时破坏它们。
不要这样做!
在内核空间中FPU模式由于以下几个原因而被禁用:
如果你真的想使用FP编号(你不应该),你必须使用kernel_fpu_begin
和kernel_fpu_end
原语来避免破坏用户空间寄存器,并且在处理FP时应该考虑到所有可能的问题(包括安全性)数字。
不知道这个看法是从哪里来的。 但内核在与用户模式代码相同的处理器上执行,因此可以访问相同的指令集。 如果处理器可以执行浮点操作(直接或通过协处理器),那么内核也可以。
也许你正在考虑在软件中模拟浮点运算的情况。 但即便如此,它也可以在内核中使用(除非禁用)。
我很好奇,这种感觉来自哪里? 也许我错过了一些东西。
找到了这个 。 似乎是一个很好的解释。
OS内核可以简单地在内核模式下关闭FPU。
在FPU操作的同时,浮点运算内核将会打开FPU,然后关闭FPU。
但是你不能打印它。