我有一个Linux内核驱动程序和一个与之交互的用户应用程序。 内核驱动程序中有一个死锁。 我在Linux内核中使用了名为“ lockdep ”的function。 我能够configuration它,并重新编译我的内核(我看到/ proc中的lockdep文件夹)。 但是我不知道如何推断这个工具的输出,或者如何去debugging使用这个工具的驱动程序。 任何帮助将非常感激。 谢谢!
要启用lockdep功能,请通过menuconfig编辑.config文件:
make menuconfig
并启用下面的黑客选项:
1. [*] Detect Hard and Soft Lockups 2. [*] Detect Hung Tasks 3. [*] RT Mutex debugging, deadlock detection 4. -*- Spinlock and rw-lock debugging: basic checks 5. -*- Mutex debugging: basic checks 6. -*- Lock debugging: detect incorrect freeing of live locks 7. [*] Lock debugging: prove locking correctness 8. [*] Lock usage statistics
重新编译内核:
make ARCH=i386 -j4 //whatever your arch is
现在,在/ proc下启动新的内核映像,你应该看到下面的新文件夹:
/proc/lockdep /proc/lockdep_chains /proc/lockdep_stat /proc/locks /proc/lock_stats
现在,插入您认为会导致错误的模块,并使用您的用户应用程序(或者您用来运行驱动程序模块的任何方式)访问它。 如果应用程序死锁(挂起),做一个:
ps -aux | grep <app_name>
你应该看到你的应用程序的+ D(不间断睡眠)状态,做一个:
dmesg
它打印的日志将包括导致死锁的函数/文件。
而已!
没有太多的事情 – 当它遇到一个可能发生死锁的锁定序列时,lockdep代码将只是打印一个情况的描述和一个堆栈回溯到内核日志。 你只需要看你的内核输出(通过dmesg
或串行线或任何你使用的)。
lockdep代码只调试锁,它不能警告你由于其他原因而产生的死锁。