套接字API是TCP/IP和UDP/IP通信的事实标准(即我们所知的网络代码).然而,它的核心功能之一,accept()
有点神奇.
借用半正式定义:
在服务器端使用accept().它接受从远程客户端创建新TCP连接的接收传入尝试,并创建与此连接的套接字地址对关联的新套接字.
换句话说,accept
返回一个新的套接字,服务器可以通过该套接字与新连接的客户端进行通信.旧套接字(在其accept
上调用)保持打开状态,在同一端口上侦听新连接.
accept
工作怎么样?它是如何实现的?这个话题有很多混乱.许多人声称接受打开一个新端口,并通过它与客户沟通.但这显然不是真的,因为没有新的端口被打开.你实际上可以通过同一个端口与不同的客户端进行通信,但是如何?当多个线程调用recv
同一个端口时,数据如何知道去哪里?
我想这是客户端地址与套接字描述符相关联的内容,每当数据通过时recv
它被路由到正确的套接字,但我不确定.
对这种机制的内部运作进行彻底的解释是很好的.
您的困惑在于认为服务器IP:服务器端口标识了套接字.实际上,套接字由四个信息唯一标识:
Client IP : Client Port
和 Server IP : Server Port
因此,虽然服务器IP和服务器端口在所有已接受的连接中都是常量,但客户端信息可以让它跟踪所有事情的进展.
澄清事情的例子:
假设我们有一个服务器192.168.1.1:80
和两个客户端,10.0.0.1
并且10.0.0.2
.
10.0.0.1
在本地端口上打开连接1234
并连接到服务器.现在服务器有一个标识如下的套接字:
10.0.0.1:1234 - 192.168.1.1:80
现在10.0.0.2
打开本地端口上的连接5678
并连接到服务器.现在服务器有两个套接字,标识如下:
10.0.0.1:1234 - 192.168.1.1:80 10.0.0.2:5678 - 192.168.1.1:80
只是为了添加用户给出的答案"17 of 26"
套接字实际上由5个元组组成 - (源IP,源端口,目标IP,目标端口,协议).这里协议可以是TCP或UDP或任何传输层协议.该协议在来自IP数据报中"协议"字段的数据包中标识.
因此,服务器上的不同应用程序可能必须在完全相同的4元组上与同一客户机通信,但协议字段不同.例如
服务器端的Apache谈论(TCP上的server1.com:880-client1:1234)和魔兽世界谈论(UDP上的server1.com:880-client1:1234)
客户端和服务器都将处理此问题,因为即使所有其他4个字段相同,在两种情况下IP数据包中的协议字段也是不同的.
当我学习这个时,让我困惑的是,这些术语socket
并port
暗示它们是物理的东西,而事实上它们只是内核用来抽象网络细节的数据结构.
因此,实现数据结构以能够保持与不同客户端的连接.至于它们是如何实现的,答案是a.)无关紧要,套接字API的目的正是实现无关紧要或b.)只是看一看.除了强烈推荐的Stevens书籍提供了一个实现的详细描述之外,请查看Linux或Solaris中的源代码或其中一个BSD.