第一句子网 - 唯美句子、句子迷、好句子大全
第一句子网 > Linux网络编程——Unix本地套接字

Linux网络编程——Unix本地套接字

时间:2021-01-14 19:44:24

相关推荐

Linux网络编程——Unix本地套接字

概述

今天给大家讲解网络编程中的一个内容——Unix 本地套接字。

发现很多人不知道或者不太了解 Unix 本地套接字这个概念,这也难怪,socket API 原本就是为多台主机之间网络通信设计的,并且这种网络 socket 同样支持单台主机上的进程间通信,当然这样做的话,仍然需要 IP 地址和端口号(通过 loopback 地址 127.0.0.1)。Unix本地套接字,其实就是一种专门用于本地(也就是单个主机上的)网络通信的一种方法,它所用的 API 跟我们之前用的网络 socket API 是一样的。

本文要介绍的 Unix 本地套接字是在 socket 的框架上发展出一种 IPC 机制,即 UNIX Domain Socket,也就是 UNIX 本地套接字,或者称为 UNIX 域套接字。相比于网络 socket 和 IPC,Unix本地套接字有其自身的特点和优势,下面我们就来看一下吧。

虽然在很多教材中经常把Unix本地套接字放在网络编程里面进行讲解,但实际上,这种通信方式更类似于我们之前所学的IPC(进程间通信)的方式,比如无名管道(pipe)、有名管道(mkfifo)。但是,Unix域套接字所提供的控制方式会更多一些,比如说TCP(字节流套接字)提供等待连接的功能,UDP(数据报套接字)提供帧同步功能,同时也是全双工的(比如使用 socketpair 创建的流管道中的两个描述符都是既可读又可写的)。

TCP 和 UDP

首先,我们回顾一下,TCP 和 UDP 套接字的服务端和客户端,从 socket 的创建,到连接,到数据传输,再到关闭 socket 的整个流程。

TCP 是一种面向连接的字节流套接字,所以服务端需要通过 listen() 转变为被动 socket,通过 accept() 等待连接。

图1. TCP 客户/服务器通信流程

而对于 UDP 来说,就比较简单了,因为它是一种无连接的数据报套接字,实际上,客户/服务端的概念也弱化了。

图2. UDP 通信流程

Unix 本地套接字 API

前面我们说过,Unix 域套接字所使用的 API 其实跟我们之前用的 socket API 是一样的,并且对于 TCP 和 UDP,其工作流程跟上图的网络 socket 完全一样。

那么,下面我们就来看一下如何通过这些 API 来创建并使用我们的 Unix 本地套接字,以及它们之间有什么区别,然后再通过一个简单的示例程序来体验一下。

创建套接字

首先是 socket 的创建。同样使用 socket() 这个函数。

但是它的第一个参数 domain 不再是AF_INET或者PF_INET,而是AF_UNIX,表示的就是 Unix 域本地套接字。那AF_LOCAL又是什么呢?这其实是历史原因造成的,我们的主题是“Unix本地套接字”或者“Unix域套接字”,但实际上我们用是Linux,对吧。那其实,为了消除它对 Unix 操作系统的依赖,在 POSIX 标准中,早就已经将AF_UNIX变成AF_LOCAL了,但是尽管如此,我们依然习惯使用“Unix域”这个称谓,因此,更推荐大家使用AF_LOCAL

第二个参数的话,跟 Internet 域套接字一样,可以是SOCK_STREAMSOCK_DGRAMSOCK_RAW,但实际上,几乎没见过使用原始套接字的。所以一般来说 Unix 提供两类套接字,也就是字节流套接字(类似于TCP)和数据报套接字(类似于UDP)。

第三个参数 Protocol,显然,因为第二个参数 type 不是原始套接字,所以 protocol 一般填 0 就可以了。

绑定地址

创建完套接字,接下来就是通过 bind() 函数绑定地址,但对于 Unix 本地套接字来说,绑定的地址就不是原来的“IP地址 + 端口号”了,而是一个有效的路径。

本地套接字的地址结构体sockaddr_un的后缀是_un,表示 Unix,而不是原来的sockaddr_in(Internet)。我们来看一下这个Unix域套接字的地址结构体中包含哪些内容:

Unix 本地套接字的地址结构体中包含两个成员,其中 sun_family 表示协议族,填AF_LOCALAF_UNIX即可;sun_path 表示一个路径名。

从这里面可以很明显得看出 Unix 域套接字与原来的 网络套接字的区别,Unix 域中用于标识客户和服务器的协议地址是普通文件系统中的路径名,而这个文件就称为套接字文件

这里要强调一下的是,Unix 本地套接字关联的这个路径名应该是一个绝对路径名,而不是一个相对路径名。为什么呢?因为解析相对路径依赖于调用者的当前工作目录,也就是说,要是服务器绑定了一个相对路径名,那么客户端也得在与服务端相同的目录中才能成功调用connect(连接)或者sendto(发送)这样一些函数。显然,这样就会导致程序出现异常情况,所以建议大家最好使用一个绝对路径名。

这个路径名,其实还要分为两种,一种是我们上面所提到的普通路径名,另一种是抽象路径名。普通路径名是一个正常的字符串,也就是说,sun_path字段是以空字符(’\0’)结尾的。而抽象路径名,sun_path字段的第一个字节需要设置成 NULL(’\0’),所以在计算抽象路径名的长度的时候就要特别小心了,否则在解析抽象路径名时就有可能出现异常情况,因为抽象路径名不是像解析普通路径名那样,解析到第一个 NULL 就可以停止了。

使用抽象路径名的好处是,因为不会再在文件系统中创建文件了,所以对于抽象路径名来说,就不需要担心与文件系统中已存在的文件产生名字冲突的问题了,也不需要在使用完套接字之后删除附带产生的这个文件了,当套接字被关闭之后会自动删除这个抽象名。

其他API

其他的一些 API,比如 listen()、accept()、connect(),以及数据通信用的 read()、write()、recv()、send()、recvfrom()、sendto()、recvmsg()、sendmsg(),用法跟网络 socket 基本一样,主要是地址结构体需要注意一下。

另外,在 Unix 本地套接字的使用中,还经常用到这些 API:

(1)用于创建类似于无名管道(pipe)的本地套接字

int socketpair(int domain, int type, int protocol, int sv[2]);

(2)当不再需要这个 Unix 域套接字时,应删除路径名对应的文件

int unlink(const char *pathname);int remove(const char *pathname);

注意,如果是抽象路径名,就不需要在使用完本地套接字后手动删除对应的套接字文件,因为当本地套接字被关闭之后,内核会自动删除这个抽象名。

(3)获取本地套接字的地址信息

int getsockname(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

示例

TCP(字节流套接字)

在这个例子中,我们使用绝对路径名"/tmp/unix.str"来实现一个字节流的本地套接字,服务端接收数据,客户端发送数据。

【unixstr_serv.c】

#include <stdio.h>#include <stdlib.h>#include <unistd.h>#include <sys/types.h>#include <sys/socket.h>#include <sys/un.h>#define UNIXSTR_PATH "/tmp/unix.str"#define LISTENQ 5#define BUFFER_SIZE 256int main(void){int listenfd, connfd;socklen_t len;struct sockaddr_un servaddr, cliaddr;if(-1 == (listenfd = socket(AF_LOCAL, SOCK_STREAM, 0))){perror("socket");exit(EXIT_FAILURE);}unlink(UNIXSTR_PATH);bzero(&servaddr, sizeof(servaddr));servaddr.sun_family = AF_LOCAL;strcpy(servaddr.sun_path, UNIXSTR_PATH);if(-1 == bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr))){perror("bind");exit(EXIT_FAILURE);}listen(listenfd, LISTENQ);len = sizeof(cliaddr);if(-1 == (connfd = accept(listenfd, (struct sockaddr *)&cliaddr, &len))){perror("accept");exit(EXIT_FAILURE);}char buf[BUFFER_SIZE];while(1){bzero(buf, sizeof(buf));if(read(connfd, buf, BUFFER_SIZE) == 0) break;printf("Receive: %s", buf);}close(listenfd);close(connfd);unlink(UNIXSTR_PATH);return 0;}

【unixstr_cli.c】

#include <stdio.h>#include <stdlib.h>#include <unistd.h>#include <sys/types.h>#include <sys/socket.h>#include <sys/un.h>#define UNIXSTR_PATH "/tmp/unix.str"#define LISTENQ 5#define BUFFER_SIZE 256int main(void){int sockfd;struct sockaddr_un servaddr;sockfd = socket(AF_LOCAL, SOCK_STREAM, 0);bzero(&servaddr, sizeof(servaddr));servaddr.sun_family = AF_LOCAL;strcpy(servaddr.sun_path, UNIXSTR_PATH);connect(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));char buf[BUFFER_SIZE];while(1){bzero(buf, sizeof(BUFFER_SIZE));printf(">> ");if(fgets(buf, BUFFER_SIZE, stdin) == NULL){break;}write(sockfd, buf, strlen(buf));}close(sockfd);return 0;}

有兴趣的童鞋可以自己编译、执行,看看运行效果,我们这里来看一下 /tmp/unix.str 这个文件吧。

rudy@ubuntu12:/tmp$ ls -l unix.str srwxrwxr-x 1 rudy rudy 0 10月 26 11:58 unix.str

显然,文件类型为“s”,代表套接字文件,也就是 S_IFSOCK 类型。

UDP(数据报套接字)

类似于上面 TCP 的例子,我们使用绝对路径名"/tmp/unix.dg"来实现一个数据报的本地套接字,一端接收数据,一端发送数据。

【unixdg_serv.c】

#include <stdio.h>#include <stdlib.h>#include <unistd.h>#include <sys/types.h>#include <sys/socket.h>#include <sys/un.h>#define UNIXDG_PATH "/tmp/unix.dg"#define BUFFER_SIZE 256int main(void){int sockfd;struct sockaddr_un servaddr, cliaddr;sockfd = socket(AF_LOCAL, SOCK_DGRAM, 0);unlink(UNIXDG_PATH);bzero(&servaddr, sizeof(servaddr));servaddr.sun_family = AF_LOCAL;strcpy(servaddr.sun_path, UNIXDG_PATH);bind(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));socklen_t len = sizeof(cliaddr);char buf[BUFFER_SIZE];while(1){bzero(buf, BUFFER_SIZE);if(0 == recvfrom(sockfd, buf, BUFFER_SIZE, 0, (struct sockaddr *)&cliaddr, &len)){break;}printf("recvfrom: %s", buf);}close(sockfd);unlink(UNIXDG_PATH);return 0;}

【unixdg_cli.c】

#include <stdio.h>#include <stdlib.h>#include <unistd.h>#include <sys/types.h>#include <sys/socket.h>#include <sys/un.h>#define UNIXDG_PATH "/tmp/unix.dg"#define BUFFER_SIZE 256int main(void){int sockfd;struct sockaddr_un servaddr, cliaddr;socklen_t len;sockfd = socket(AF_LOCAL, SOCK_DGRAM, 0);/* local address */bzero(&cliaddr, sizeof(cliaddr));cliaddr.sun_family = AF_LOCAL;strcpy(cliaddr.sun_path, UNIXDG_PATH);bind(sockfd, (struct sockaddr *)&cliaddr, sizeof(cliaddr));/* remote address */bzero(&servaddr, sizeof(servaddr));servaddr.sun_family = AF_LOCAL;strcpy(servaddr.sun_path, UNIXDG_PATH);len = sizeof(servaddr);char buf[BUFFER_SIZE];while(1){bzero(buf, BUFFER_SIZE);printf(">> ");if(fgets(buf, BUFFER_SIZE, stdin) == NULL){break;}sendto(sockfd, buf, strlen(buf), 0, (struct sockaddr *)&servaddr, len);}close(sockfd);return 0;}

需要注意的是,跟网络套接字不一样,对于 Unix 域套接字的 UDP 客户端,必须 bind 一个路径名到 UDP 套接字,以使得 UDP 服务器有发送应答的目的地。

总结

通过上面简单的示例,我们可以看到 Unix 本地套接字跟 Internet 套接字虽然使用相同的 API,但用法上又有些不同,跟IPC(比如管道、消息队列、共享内存等)相比,也有不同。我们可以简单地把 Unix 本地套接字看成是 socket 和管道的混合体。

可以这么说,Unix 本地套接字的优势体现在它所使用的 API 几乎等同于网络 socket(客户/服务器)使用的 API,但是与客户端和服务端都在同一主机上的 TCP 相比,Unix 本地字节流套接字有性能上的优势。在单个主机,使用 Unix 域套接字来替代 Internet 域套接字是有好处的。

最后,总结一下:

Socket 同样可以用于本地通信。创建套接字时使用本地协议AF_LOCAL。分为流式套接字(SOCK_STREAM)和数据报套接字(SOCK_DGRAM) 。和其他进程间通信方式相比,Unix 本地套接字使用方便,效率也高 。因为它不需要经过网络协议栈、不需要打包拆包、不需要计算校验和、不需要维护序号和应答等、只是将应用层数据从一个进程拷贝到另一个进程…常用于前后台进程通信,比如 X Window。另外,Unix 本地套接字可用于传递文件描述符、传递用户凭证等场景。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。