Fuck me on GayHub

NodeJs中的异步

这篇文章主要讨论NodeJs中的异步问题。使用NodeJs编写程序也一年多了,在公司实习的时候,公司两个项目的后台都是我负责使用NodeJs和Sails框架编写的。工作模式主要是我在服务器端提供RESTful接口,网页端通过AJAX方式获取服务端的数据。在做的过程中,遇到了许多问题,感触最深的是异步编程的思维习惯还不是适应的很好。

异步背景

其实,异步很早都有了,例如在操作系统中就有异步的概念。后来随着Ajax技术的普及,前端的开发人员最了解异步这个概念。随着谷歌的Chrome浏览器的V8的推出,出现了以异步方式处理网络请求的Nginx服务器,时间证明,Nginx的并发性能比Apache,Tomcat等更出色。在V8推出后,Ryan Dahl就推出了NodeJs,第一个在语言平台完全支持NodeJs的技术。当然Java,PHP等也都支持异步方式的编程,但是那都是在Java语言的基础上通过多线程及线程间的通信上实现的。而NodeJs在语言的实现上就是以异步的思想为基础的。

异步的实现

要讲异步,就得了解阻塞IO与非阻塞IO。
阻塞IO我们很好理解,因为在平常的编程中,我们经常读写文件,例如在C语言中我们使用open函数打开一个比较大的文件,那么这个时候程序就会阻塞住,直到文件读取完毕,后续的操作才能继续。

非阻塞IO则是使用另一个线程去读取大文件,主线程的后续操作可以不用等待读取线程而继续运行。但是这个时候我们在主线程中就不知道读取线程何时操作完毕。所以我们就是用轮询的技术,每个一个时间间隔,就去查看读取线程是否操作完毕。在Linux中,这种轮询可以通过read, poll, epoll, kqueue的方式实现,但是轮询技术有个缺点,就是轮询的时候,主线程必须等待,使CPU空置起来了。

最理想的非阻塞IO则是主线程和读取线程基本互不干扰,只有当读取线程操作完毕后,才会通知主线程读取完毕。NodeJs通过libuv来实现异步,而libuv则会根据操作系统平台使用相应的实现方式。如在Linux中,通过线程池的方式实现,在Windows平台则通过调用IOPC实现,其实IOPC也是使用线程池的方式实现,只不过Windows在内核中实现了而已。

总的来说,NodeJs虽然讲是单线程,异步,事件驱动的,但是这里我主要想讲,NodeJs也是通过多线程的方式实现异步的。我们所讲的单线程只是指向NodeJs代码运行的主线程而已,异步的操作都是通过底层线程池完成的。

当然,NodeJs是异步实现,那么我们在编写应用程序的过程中,就尽量使用异步的方式 – callback,这样我们的应用程序才能具有异步的高性能,否则还不如使用同步的方式编写。

NodeJs的多进程(线程)方法

并不是说NodeJs是单线程的就不支持多进程化,我们仍然可以使用NodeJs的child_process来实现多进程操作,这就与Linux的fork, exec等一样了,当然,若你不想使用这么原始的方式实现多进程,那么你可以通过NodeJs的cluster模块简单实现。

参考资料

深入浅出NodeJs - 第三章

深入浅出NodeJs - 第九章

NodeJs child_process

NodeJs cluster