无法在虚拟地址处理内核分页请求 – 内核OOPS

我有一个内核OOPS有一天在我的飞思卡尔i.MX233上运行扬声器testing。 大概发生在一次关于说话人testing的SIGTERM之后(可能是任何其他时间)。 在OOPS之后,我可以看到等待IO在所有未使用的CPU时间运行。 调用扬声器testing的过程也不能被终止。 也试过SIGKILL。 处决后还挂着“ps斧”。

幸运的是我设法从消息中提取OOPS。 我在互联网上search了所有内容,但是无法真正解释我在这个OOPS中看到的所有内容。

我真正无法弄清楚的是,究竟是什么原因导致了这个问题呢?我怎样才能回溯到一个特定的驱动程序。 内核中内置了mxsaudio驱动程序,因此它在驱动程序列表中不可见。 驱动程序本身已经进行了大量的修改,根据要求我可以分享它的一部分。

所以内核地址是从0xc0000000开始的,但是为什么内核地址区的进程堆栈部分呢? 这是不是应该从内核地址开始向下?

使用的扬声器testing是1.0.11rc2,但是我认为即使程序会突然结束,声音架构会正确地closures所有的东西。 这个版本的扬声器testing不处理信号,并没有试图优雅地closures,只是放弃。

什么区域将0xe1a0a024是? 这可能是ARM指令吗? 这意味着这将是一个堆栈溢出的地方? 我知道内存映射寄存器驻留在0x80000000。 什么地区是“pgd = c39dc000”? 那是内核堆栈?

是否有可能在下一次的OOPS上获得更多的堆栈转储,以便我可以走得更远? 如果有必要,我可以更改内核(我想我应该去OOPS打印机获取更多),但是有没有这样的configuration?

有任何想法吗? 任何帮助,不胜感激,我现在​​看这个2天。

OOPS:

<1>[268811.560000] Unable to handle kernel paging request at virtual address e1a0a024 <1>[268811.560000] pgd = c39dc000 <1>[268811.560000] [e1a0a024] *pgd=00000000 <4>[268811.560000] Internal error: Oops: 5 [#1] PREEMPT <4>[268811.560000] Modules linked in: <4>[268811.560000] CPU: 0 Tainted: P (2.6.31-private #153) <4>[268811.560000] PC is at vma_prio_tree_next+0x3c/0x6c <4>[268811.560000] LR is at update_mmu_cache+0x120/0x1c4 <4>[268811.560000] pc : [<c00b98d8>] lr : [<c00611d4>] psr: a0000093 <4>[268811.560000] sp : c39c5de0 ip : c5cfa8f8 fp : c7ce7d80 <4>[268811.560000] r10: c7ce7d80 r9 : 401fb000 r8 : 401fb000 <4>[268811.560000] r7 : 00000021 r6 : c5c9b478 r5 : 00000000 r4 : 401fad94 <4>[268811.560000] r3 : e08f7007 r2 : ea00014d r1 : c39c5dec r0 : e1a0a000 <4>[268811.560000] Flags: NzCv IRQs off FIQs on Mode SVC_32 ISA ARM Segment user <4>[268811.560000] Control: 0005317f Table: 439dc000 DAC: 00000015 <4>[268811.560000] Process speaker-test (pid: 1823, stack limit = 0xc39c4270) <4>[268811.560000] Stack: (0xc39c5de0 to 0xc39c6000) <4>[268811.560000] 5de0: 401fad94 c00611d4 c5f351c0 c7d34c84 00000080 00000000 00000000 c747d3c0 <4>[268811.560000] 5e00: 00000021 00000021 00000000 00000000 4507630f c04a4ec0 00000000 c5c9b478 <4>[268811.560000] 5e20: 00000000 c00bbc68 c7802060 00000000 00000200 c3a22fec 00000000 00000021 <4>[268811.560000] 5e40: 401fb000 c04a4ec0 c5c9b108 c3a22800 c39dd000 c5c9b478 c5c9b478 401fb000 <4>[268811.560000] 5e60: 00000000 00000000 c7ce7d80 c00bc69c 00000021 00000000 00000000 00000000 <4>[268811.560000] 5e80: 000001fb c39dc000 00000200 000007ec c3a22fec c5c0612c 00000010 00000000 <4>[268811.560000] 5ea0: 00000000 c749b0b0 0000000a c03b030c c5de0c00 c5c9b478 c7ce7db4 401fb290 <4>[268811.560000] 5ec0: c39c5fb0 c7ce7d80 00000017 c0060a30 c7d34cb8 00000000 00000200 00000000 <4>[268811.560000] 5ee0: 00000000 c03b030c 00000006 c03b037c 00000017 c39c5fb0 0000000b 401fb290 <4>[268811.560000] 5f00: be93295c c005a228 00000000 00000000 c7ce7d80 c00bc69c 0000000a 00000000 <4>[268811.560000] 5f20: 00000000 00000000 000001b0 c39dc000 00000200 000006c0 c3a22ec0 401c3000 <4>[268811.560000] 5f40: 00000001 00000000 40025050 c00858f8 00000021 ffffffff c5de0c00 c5c9b948 <4>[268811.560000] 5f60: 00000000 c01697e8 00000200 c5de0c00 c5c9b948 c0060ac4 c005af84 be932c38 <4>[268811.560000] 5f80: 00000008 00000000 c39c4000 ffffffff 00000006 ffffffff 00000006 be9329e8 <4>[268811.560000] 5fa0: be9329e8 0000000c 403004d0 c005ad9c 00000000 00000000 0000000c 00000000 <4>[268811.560000] 5fc0: 0000000c 00000006 be9329e8 be9329e8 0000000c 0000000b 403004d0 be93295c <4>[268811.560000] 5fe0: 0000c718 be9328f8 401fa7bc 401fadb8 20000010 ffffffff 00000000 00000000 <4>[268811.560000] [<c00b98d8>] (vma_prio_tree_next+0x3c/0x6c) from [<c00611d4>] (update_mmu_cache+0x120/0x1c4) <4>[268811.560000] [<c00611d4>] (update_mmu_cache+0x120/0x1c4) from [<c00bbc68>] (__do_fault+0x308/0x3ec) <4>[268811.560000] [<c00bbc68>] (__do_fault+0x308/0x3ec) from [<c00bc69c>] (handle_mm_fault+0x298/0xc14) <4>[268811.560000] [<c00bc69c>] (handle_mm_fault+0x298/0xc14) from [<c0060a30>] (do_page_fault+0xec/0x234) <4>[268811.560000] [<c0060a30>] (do_page_fault+0xec/0x234) from [<c005a228>] (do_DataAbort+0x30/0x90) <4>[268811.560000] [<c005a228>] (do_DataAbort+0x30/0x90) from [<c005ad9c>] (ret_from_exception+0x0/0x10) <4>[268811.560000] Exception stack(0xc39c5fb0 to 0xc39c5ff8) <4>[268811.560000] 5fa0: 00000000 00000000 0000000c 00000000 <4>[268811.560000] 5fc0: 0000000c 00000006 be9329e8 be9329e8 0000000c 0000000b 403004d0 be93295c <4>[268811.560000] 5fe0: 0000c718 be9328f8 401fa7bc 401fadb8 20000010 ffffffff <4>[268811.560000] Code: e2430024 e5903030 e3530000 1a000001 (e5903024) <4>[268811.560000] ---[ end trace c70c22c7b9cf390d ]--- <6>[268811.560000] note: speaker-test[1823] exited with preempt_count 2 

经过一番折磨之后,我们意识到这很可能是内存控制器的一个硬件问题,所以很难理解这里面的内容和发生的事情是因为这是一个随机的内存损坏。