在测试开发的内核模块时,发现了一个BUG:在模块没有卸载时使用reboot命令重启系统的话,系统重启不了,查看日志发现在创建的内核线程中陷入了死循环,导致系统无法重启。检查了代码,发现产生问题的原因是当系统调用返回-EINTR(也是被信号中断),内核线程中的循环没有退出,而是继续循环操作,这个逻辑跟业务是相符合的并没有错误。问题在于没有检查接收到的是什么信号,如果是在系统重启时发送的信号或者执行关机时发送的信号,应该退出循环。剩下的是找到在内核线程中获取接收的信号的方法。

  在用户态获取阻塞的信号,调用的是sigpending(),因此首先尝试调用sys_sigpending()来获取。sys_sigpending()作为系统调用是没有导出的,因此不能直接调用,但是可以通过/proc/kallsyms文件来获取sys_sigpending()的地址来调用这个函数。在我的测试机上,sys_sigpending()的地址为0xffffffff810802e0。测试代码如下所示:

/*
 * fcluster.c
 */

#include <linux/init.h>
#include <linux/module.h>
#include <linux/signal.h>
#include <linux/spinlock.h>
#include <linux/sched.h>
#include <linux/uaccess.h>

static int remove_mod = 0;

static int my_sigpending(sigset_t *set)
{
    int (*sigpending)(sigset_t *set);
    int ret;
    mm_segment_t old_fs;
  
    sigpending = (typeof(sigpending))0xffffffff810802e0;
  
    old_fs = get_fs();
    set_fs(get_ds());
    ret = sigpending(set);
    set_fs(old_fs);
  
    return ret;
}

static int thread_process(void *arg)
{
    sigset_t *sigset, __sigset;
  
    sigset = &__sigset;
  
    allow_signal(SIGURG);
    allow_signal(SIGTERM);
    allow_signal(SIGKILL);
    allow_signal(SIGSTOP);
    allow_signal(SIGCONT);
  
    printk(KERN_ALERT "the pid of thread_process is %d. ", current->pid);
  
    my_sigpending(sigset);
    printk(KERN_ALERT "Before receive signal, signal map: 0x%lX. ", sigset->sig[0]);
  
    for ( ; !remove_mod; ) {
        /* Avoid infinite loop */
        msleep(1000);
        if (signal_pending(current)) {
            my_sigpending(sigset);
            printk(KERN_ALERT "Received signal, signal map: 0x%lX. ", sigset->sig[0]);
            printk(KERN_ALERT "Receive SIGURG signal ? %s. ",
                sigismember(sigset, SIGURG) ? "true" : "false");
            printk(KERN_ALERT "Receive SIGTERM signal ? %s. ",
                sigismember(sigset, SIGTERM) ? "true" : "false");
            printk(KERN_ALERT "Receive SIGKILL signal ? %s. ",
                sigismember(sigset, SIGKILL) ? "true" : "false");
            printk(KERN_ALERT "Receive SIGSTOP signal ? %s. ",
                sigismember(sigset, SIGSTOP) ? "true" : "false");
            /* Use halt to stop the system */
            printk(KERN_ALERT "Receive SIGCONT signal ? %s. ",
                sigismember(sigset, SIGCONT) ? "true" : "false");
            break;
        }
    }
    return 0;
}

static int __init fcluster_init(void)
{
    kernel_thread(thread_process, NULL, CLONE_FILES);
    return 0;
}

static void __exit fcluster_exit(void)
{
    remove_mod = 1;
    msleep(2000);
}

MODULE_LICENSE("GPL");
module_init(fcluster_init);
module_exit(fcluster_exit);

  内核线程如果想接收用户终端发送的信号,必须在处理函数中调用allow_signal()来指定允许接收哪些信号。my_sigpending()是对sys_sigpending()的简单封装,用来获取当前内核线程阻塞的信号。