多线程编程指南

使用信号进行同步

信号是 E. W. Dijkstra 在二十世纪六十年代末设计的一种编程架构。Dijkstra 的模型与铁路操作有关:假设某段铁路是单线的,因此一次只允许一列火车通过。

信号将用于同步通过该轨道的火车。火车在进入单一轨道之前必须等待信号灯变为允许通行的状态。火车进入轨道后,会改变信号状态,防止其他火车进入该轨道。火车离开这段轨道时,必须再次更改信号的状态,以便允许其他火车进入轨道。

在计算机版本中,信号以简单整数来表示。线程等待获得许可以便继续运行,然后发出信号,表示该线程已经通过针对信号执行 P 操作来继续运行。

线程必须等到信号的值为正,然后才能通过将信号值减 1 来更改该值。完成此操作后,线程会执行 V 操作,即通过将信号值加 1 来更改该值。这些操作必须以原子方式执行,不能再将其划分成子操作,即,在这些子操作之间不能对信号执行其他操作。在 P 操作中,信号值在减小之前必须为正,从而确保生成的信号值不为负,并且比该值减小之前小 1。

PV 操作中,必须在没有干扰的情况下进行运算。如果针对同一信号同时执行两个 V 操作,则实际结果是信号的新值比原来大 2。

对于大多数人来说,如同记住 Dijkstra 是荷兰人一样,记住 PV 本身的含义并不重要。但是,从真正学术的角度来说,P 代表 prolagen,这是由 proberen te verlagen 演变而来的杜撰词,其意思是尝试减小V 代表 verhogen,其意思是增加。Dijkstra 的技术说明 EWD 74 中介绍了这些含义。

sem_wait(3RT) 和 sem_post(3RT) 分别与 Dijkstra 的 PV 操作相对应。sem_trywait(3RT) 是 P 操作的一种条件形式。如果调用线程不等待就不能减小信号的值,则该调用会立即返回一个非零值。

有两种基本信号:二进制信号和计数信号量。二进制信号的值只能是 0 或 1,计数信号量可以是任意非负值。二进制信号在逻辑上相当于一个互斥锁。

不过,尽管不会强制,但互斥锁应当仅由持有该锁的线程来解除锁定。因为不存在“持有信号的线程”这一概念,所以,任何线程都可以执行 Vsem_post(3RT) 操作。

计数信号量与互斥锁一起使用时的功能几乎与条件变量一样强大。在许多情况下,使用计数信号量实现的代码比使用条件变量实现的代码更为简单,如示例 4–14示例 4–15示例 4–16 中所示。

但是,将互斥锁用于条件变量时,会存在一个隐含的括号。该括号可以清楚表明程序受保护的部分。对于信号则不必如此,可以使用并发编程当中的 go to 对其进行调用。信号的功能强大,但是容易以非结构化的不确定方式使用。

命名信号和未命名信号

POSIX 信号可以是未命名的,也可以是命名的。未命名信号在进程内存中分配,并会进行初始化。未命名信号可能可供多个进程使用,具体取决于信号的分配和初始化的方式。未命名信号可以是通过 fork() 继承的专用信号,也可以通过用来分配和映射这些信号的常规文件的访问保护功能对其进行保护。

命名信号类似于进程共享的信号,区别在于命名信号是使用路径名而非 pshared 值引用的。命名信号可以由多个进程共享。命名信号具有属主用户 ID、组 ID 和保护模式。

对于 openretrievecloseremove 命名信号,可以使用以下函数:sem_opensem_getvaluesem_closesem_unlink。通过使用 sem_open,可以创建一个命名信号,其名称是在文件系统的名称空间中定义的。

有关命名信号的更多信息,请参见 sem_opensem_getvaluesem_closesem_unlink 手册页。

计数信号量概述

从概念上来说,信号量是一个非负整数计数。信号量通常用来协调对资源的访问,其中信号计数会初始化为可用资源的数目。然后,线程在资源增加时会增加计数,在删除资源时会减小计数,这些操作都以原子方式执行。

如果信号计数变为零,则表明已无可用资源。计数为零时,尝试减小信号的线程会被阻塞,直到计数大于零为止。

表 4–7 信号例程

操作

相关函数说明

初始化信号 

sem_init 语法

增加信号 

sem_post 语法

基于信号计数阻塞 

sem_wait 语法

减小信号计数 

sem_trywait 语法

销毁信号状态 

sem_destroy 语法

由于信号无需由同一个线程来获取和释放,因此信号可用于异步事件通知,如用于信号处理程序中。同时,由于信号包含状态,因此可以异步方式使用,而不用象条件变量那样要求获取互斥锁。但是,信号的效率不如互斥锁高。

缺省情况下,如果有多个线程正在等待信号,则解除阻塞的顺序是不确定的。

信号在使用前必须先初始化,但是信号没有属性。

初始化信号

使用 sem_init(3RT) 可以将 sem 所指示的未命名信号变量初始化为 value

sem_init 语法

int	sem_init(sem_t *sem, int pshared, unsigned int value);
#include <semaphore.h>



sem_t sem;

int pshared;

int ret;

int value;



/* initialize a private semaphore */

pshared = 0;

value = 1;

ret = sem_init(&sem, pshared, value); 

如果 pshared 的值为零,则不能在进程之间共享信号。如果 pshared 的值不为零,则可以在进程之间共享信号。对于 Solaris 线程,请参见sema_init 语法

多个线程决不能初始化同一个信号。

不得对其他线程正在使用的信号重新初始化。

初始化进程内信号

pshared 为 0 时,信号只能由该进程内的所有线程使用。

#include <semaphore.h>



sem_t sem;

int ret;

int count = 4;



/* to be used within this process only */

ret = sem_init(&sem, 0, count); 

初始化进程间信号

pshared 不为零时,信号可以由其他进程共享。

#include <semaphore.h>



sem_t sem;

int ret;

int count = 4;



/* to be shared among processes */

ret = sem_init(&sem, 1, count);

sem_init 返回值

sem_init() 在成功完成之后会返回零。其他任何返回值都表示出现了错误。如果出现以下任一情况,该函数将失败并返回对应的值。


EINVAL

描述:

参数值超过了 SEM_VALUE_MAX


ENOSPC

描述:

初始化信号所需的资源已经用完。到达信号的 SEM_NSEMS_MAX 限制。


ENOSYS

描述:

系统不支持 sem_init() 函数。


EPERM

描述:

进程缺少初始化信号所需的适当权限。

增加信号

使用 sem_post(3RT) 可以原子方式增加 sem 所指示的信号。

sem_post 语法

int	sem_post(sem_t *sem);
#include <semaphore.h>



sem_t sem;

int ret;



ret = sem_post(&sem); /* semaphore is posted */

如果所有线程均基于信号阻塞,则会对其中一个线程解除阻塞。对于 Solaris 线程,请参见sema_post 语法

sem_post 返回值

sem_post() 在成功完成之后会返回零。其他任何返回值都表示出现了错误。如果出现以下情况,该函数将失败并返回对应的值。


EINVAL

描述:

sem 所指示的地址非法。

基于信号计数进行阻塞

使用 sem_wait(3RT) 可以阻塞调用线程,直到 sem 所指示的信号计数大于零为止,之后以原子方式减小计数。

sem_wait 语法

int	sem_wait(sem_t *sem);
#include <semaphore.h>



sem_t sem;

int ret;



ret = sem_wait(&sem); /* wait for semaphore */

sem_wait 返回值

sem_wait() 在成功完成之后会返回零。其他任何返回值都表示出现了错误。如果出现以下任一情况,该函数将失败并返回对应的值。


EINVAL

描述:

sem 所指示的地址非法。


EINTR

描述:

此函数已被信号中断。

减小信号计数

使用 sem_trywait(3RT) 可以在计数大于零时,尝试以原子方式减小 sem 所指示的信号计数。

sem_trywait 语法

int	sem_trywait(sem_t *sem);
#include <semaphore.h>



sem_t sem;

int ret;



ret = sem_trywait(&sem); /* try to wait for semaphore*/

此函数是 sem_wait() 的非阻塞版本。sem_trywait() 在失败时会立即返回。

sem_trywait 返回值

sem_trywait() 在成功完成之后会返回零。其他任何返回值都表示出现了错误。如果出现以下任一情况,该函数将失败并返回对应的值。


EINVAL

描述:

sem 所指示的地址非法。


EINTR

描述:

此函数已被信号中断。


EAGAIN

描述:

信号已为锁定状态,因此该信号不能通过 sem_trywait() 操作立即锁定。

销毁信号状态

使用 sem_destroy(3RT) 可以销毁与 sem 所指示的未命名信号相关联的任何状态。

sem_destroy 语法

int	sem_destroy(sem_t *sem);
#include <semaphore.h>



sem_t sem;

int ret;



ret = sem_destroy(&sem); /* the semaphore is destroyed */

不会释放用来存储信号的空间。对于 Solaris 线程,请参见sema_destroy(3C) 语法

sem_destroy 返回值

sem_destroy() 在成功完成之后会返回零。其他任何返回值都表示出现了错误。如果出现以下情况,该函数将失败并返回对应的值。


EINVAL

描述:

sem 所指示的地址非法。

使用信号时的生成方和使用者问题

示例 4–14 中的数据结构与示例 4–11 中所示的用于条件变量示例的结构类似。两个信号分别表示空缓冲区和满缓冲区的数目,通过这些信号可确保生成方等待缓冲区变空,使用者等待缓冲区变满为止。


示例 4–14 使用信号时的生成方和使用者问题

typedef struct {

    char buf[BSIZE];

    sem_t occupied;

    sem_t empty;

    int nextin;

    int nextout;

    sem_t pmut;

    sem_t cmut;

} buffer_t;



buffer_t buffer;



sem_init(&buffer.occupied, 0, 0);

sem_init(&buffer.empty,0, BSIZE);

sem_init(&buffer.pmut, 0, 1);

sem_init(&buffer.cmut, 0, 1);

buffer.nextin = buffer.nextout = 0;

另一对二进制信号与互斥锁作用相同。在多个生成方使用多个空缓冲槽位,以及多个使用者使用多个满缓冲槽位的情况下,信号可用来控制对缓冲区的访问。在这种情况下,使用互斥锁可能会更好,但这里主要是为了演示信号的用法。


示例 4–15 生成方和使用者问题:生成方

void producer(buffer_t *b, char item) {

    sem_wait(&b->empty);

    sem_wait(&b->pmut);



    b->buf[b->nextin] = item;

    b->nextin++;

    b->nextin %= BSIZE;



    sem_post(&b->pmut);

    sem_post(&b->occupied);

}


示例 4–16 生成方和使用者问题:使用者

char consumer(buffer_t *b) {

    char item;



    sem_wait(&b->occupied);

   

    sem_wait(&b->cmut);



    item = b->buf[b->nextout];

    b->nextout++;

    b->nextout %= BSIZE;



    sem_post(&b->cmut);



    sem_post(&b->empty);



    return(item);

}