技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 算法 --> Beyond Threading

Beyond Threading

浏览:1499次  出处信息

Java线程模型的优点在于能够清晰的model应用逻辑流,通过对应OS里物理线程,可以利用多个处理器,或者通过切换让CPU利用率不同的线程共享一个处理器。

但是这种把应用的逻辑线程直接搬到OS的物理线程上运行的方式(*)也存在弊端:

  • Heavy weight,每个OS线程都需要内存和自己的堆栈等资源
  • Context switching,及其引起的低效率(cache污染,线程饥饿,优先级逆转..)
  • Synchronization & lock, 需用同步访问share memory和资源,而如何保证安全性,同时取得最大的效率, 如何平衡safety和liveness的关系解决起来绝非易事.

引起这些低效率很大原因是现有线程模式是粗线条的黑箱模式,runtime系统并不知道线程在干什么和它们之间的依赖关系,只是通过强制的方式(time slicing, locks, monitors)来调度协作。

另一种更加透明的方式,即把现有的线程分解成更小,轻量级的单位Task, 显示的描述这些任务单位之间的并行性和相互依赖关系,包括对同一资源的访问,有了这些信息,系统可以更高效的方式来执行这些任务。

具体的实现包括:

  • Apple Grand Central Dispatch
  • Microsoft Task Parallel Library
  • Intel Thread Building Block
  • Google Go Language

这些技术的模型都基于CSP(communicating sequential processing)

CSP模型里每个Process 内部是串行的,而Process和Process之间是并行的。这样overhead最小,更不需要有同步/锁的概念.系统的scheduler把高层模型映射到Runtime运行系统。

Runtime运行系统维护和cpu核数对等的线程池.每一个线程有自己的任务队列- double ended queue。线程从队列的头取得任务并执行,当本地队列为空时,则会从其他队列”偷”任务过来。通常情况下因为只有一个线程会访问队列的头所以不会有竞争,而队列尾出现竞争的情况也是空闲线程完成,实现了动态的自动的负载均衡和最高的CPU运行效率.

如果说GCD等基于task模型还比较低层的话,以Erlang为代表的Actor模型提供了更接近OO的抽象,同样是基于CSP,只不过Actor模型传的是message而不是closure。

Java库/框架推荐:

  • 开源的HawtDispatch库,Apple GCD 的Java实现, 作者也是ActiveMQ的开发人员,这个库短小精悍,可谓是最容易帮助上手Task based programming的工具了. http://hawtdispatch.fusesource.org/
  • 开源的Akka平台,构建于HawtDispatch之上,  功能强大:actor model, STM, 分布式+容错功能(接近Erlang). http://akkasource.org/

(*) Java5引入的Executor框架/ThreadPool只是改进但是没有解决根本的问题,另外Thread pool的queue本身是可能的瓶颈

建议继续学习:

  1. Memcached的线程模型及状态机    (阅读:3241)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
<< 前一篇:几个随机算法
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1