啥叫I/O多路复用?
epoll又是个什么东西?
你或许看过很多文章,但是还是感觉云里雾里的,今天,我们抛开文字,释放动图,或许你就理解了。

I/O多路复用

通常的一次的请求结果如下图所示:

但是,服务器往往不会只处理一次请求,往往是多个请求,这一个请求,这时候每来一个请求,就会生成一个进程或线程。

在这些请求线程或者进程中,大部分都处于等待阶段,只有少部分是接收数据。这样一来,非常耗费资源,而且这些线程或者进程的管理,也是个事儿。

于是,有人想到一个办法:我们只用一个线程或者进程来和系统内核打交道,并想办法把每个应用的I/O流状态记录下来,一有响应变及时返回给相应的应用。

或者下图:

select、poll、epoll

select, poll, epoll 都是I/O多路复用的具体实现,他们出现是有先后顺序的。

select是第一个实现 (1983 左右在BSD里面实现的)。

select 被实现后,发现诸多问题,然后1997年实现了poll,对select进行了改进,select和poll是很类似的。

再后来,2002做出重大改进实现了epoll。

epoll和 select/poll 有着很大的不同:

例如:select/poll的处理流程如下:

而epoll的处理流程如下:

这样,就无需遍历成千上万个消息列表了,直接可以定位哪个socket有数据。

那么,这是如何实现的呢?

早期的时候 epoll的实现是一个哈希表,但是后来由于占用空间比较大,改为了红黑树和链表。

其中链表中全部为活跃的链接,红黑树中放的是所有事件。两部分各司其职。
这样一来,当收到内核的数据时,只需遍历链表中的数据就行了,而注册read事件或者write事件的时候,向红黑树中记录。

结果导致:

  • 创建\修改\删除消息效率非常高:O(logN)。
  • 获取活跃链接也非常快,因为在一个时间内,大部分是不活跃的链接,活跃的链接是少数,只需要遍历少数活跃的链接就好了

更多精彩内容,请关注我的微信公众号 互联网技术窝 或者加微信共同探讨交流:

参考文献: