我使用Linux内核的v4.0.5开发了一个简单的线条规范,在Mint Linux下运行。
tty_ldisc_ops结构如下所示:
static struct tty_ldisc_ops my_ldisc = { .owner = THIS_MODULE, .magic = TTY_LDISC_MAGIC, .name = "my_ldisc", .open = my_open, .close = my_close, .read = my_read, .write = my_write, .ioctl = my_ioctl, .poll = my_poll, .receive_buf = my_receive, .write_wakeup = my_wakeup, };
该模块通过insmod my_lkm.ko
添加。 我知道它正在被添加正确,因为我用printk来表示它,并可以通过dmesg
看到消息。 此外,在启动时,我的用户空间应用程序使用ioctl,我也已经validation了通过printk工作。
问题是,在my_write中,copy_from_user始终返回一个非零值,表示它以某种方式失败。
这里是my_write():
static ssize_t my_write(struct tty_struct *tty, struct file *file, const unsigned char *buf, size_t nr) { int error = 0; unsigned char data[MAX]; //MAX is 256 if(!my_tty) { return -EIO; } if(nr > MAX) { //too big return -ENOMEM; } error = copy_from_user(data,buf,nr); printk("copy_from_user returned %d\n",error); //here, error is always equal to nr //(which is 12 in my example application) if(error==0) { printk("success\n"); //never get here return nr; } return error; }
从我所研究的内容来看,copy_from_user最终会调用pa_memcpy来validation所使用的指针。 validation失败,但我不知道为什么。 我不知道如何* buf和数据重叠或将导致错误。
输出uname -a
: Linux mint-linux 4.0.5-040005-generic #201506061639 SMP Sat Jun 6 16:40:45 UTC 2015 UTC x86_64 x86_64 x86_64 GNU/Linux
用户空间应用程序的一个片段是:
#define OPEN_FLAGS (O_RDWR|O_NONBLOCK) int main(int argc, char **argv) { int fd=-1; int bytes_written= 0; char device="/dev/ttyUSB0"; unsigned char outbuffer[128]={0}; fd=open(device,OPEN_FLAGS); //set baud rate, etc., switch to my_ldisc (using N_MOUSE) outbuffer[0]=0x01; outbuffer[1]=0x02; outbuffer[2]=0x03; outbuffer[3]=0x04; outbuffer[4]=0x05; outbuffer[5]=0x06; outbuffer[6]=0x07; outbuffer[7]=0x08; outbuffer[8]=0x09; outbuffer[9]=0x0A; outbuffer[10]=0x0B; outbuffer[11]=0x0C; bytes_written=write(fd,outbuffer,12); while(true) { //... sleep(1); } }
另外,在my_write中任何对buf的访问都会导致虚拟机不稳定。 即使遵循o'reilly linux驱动程序书中的tty驱动程序示例,如下所示:
printk(KERN_DEBUG "%s - ", __FUNCTION__); for(i=0;i<nr;i++) { printk("%02x ",buf[i]); } printk("\n");
遵循Tsyvarev的build议,我将指针打印在用户空间应用程序和内核模块中。 他们是不同的,这意味着我应该直接访问传入的缓冲区。 我用printf("%p\n",outbuffer);
在用户空间和内核空间的等效printk中做到这一点。
所以,放慢速度并逐行testing模块帮助我解决了原来的问题,结果是用户空间应用程序中的一个错误。
FWIW,编译器从来没有给我一个关于在原代码中使用__user的警告。 如果Tsyvarev在编译时提出了这个方法,那么这样做会更容易追踪。
与接受指向用户数据的struct file_operations
.write方法不同, struct tty_operations
.write方法接受指向内核数据的指针 ,这些数据通过通常的方法如memcpy
甚至直接访问。
现代内核使用__user
属性标记用户空间数据,并在访问数据时检查(在编译时)该属性。 因此,启用编译器警告将显示错误来源的数据的使用情况。