萝卜白菜各有所爱。像我喜欢Java。学无止境,这也是我喜欢它的一个原因。日常工作中你所用到的工具,通常都有些你从来没有了解过的东西,比方说某个方法或者是一些有趣的用法。比如说线程。没错,是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候,通常会面临各种各样的并发编程的问题,不过我们现在所要讲的可能会略有不同。
  从本文中你将会看到线程提供的一些不太常用的方法及技术。不管你是初学者还是高级用户或者是Java专家,希望都能看一下哪些是你已经知道的,而哪些是刚了解的。如果你认为关于线程还有什么值得分享给大家的,希望能在下面积极回复。那我们先开始吧。
  初学者 1.线程名
  程序中的每个线程都有一个名字,创建线程的时候会给它分配一个简单的Java字符串来作为线程名。默认的名字是”Thread-0″, “Thread-1″, “Thread-2″等等。现在有趣的事情来了——Thread提供了两种方式来设置线程名:
  线程构造函数,下面是简单的一个实现:
  class SuchThread extends Thread {
  Public void run() {
  System.out.println ("Hi Mom! " + getName());
  }
  }
  SuchThread wow = new SuchThread("much-name");
  线程名setter方法:
  wow.setName(“Just another thread name”);
  没错,线程名是可变的。因此我们可以在运行时修改它的名字,而不用在初始化的时候指定好。name字段其实是一个简单的字符串对象。也是说它能达到231-1个字符那么长(Integer.MAX_VALUE)。这足够用了。注意这个名字并不是一个性的标识,因此不同的线程也可以拥有同样的线程名。还有一点是,不要把null用作线程名,否则会抛出异常(当然了,”null”还是可以的)。
  使用线程名来调试问题
  既然可以设置线程名,那么如果遵循一定的命名规则的话,出了问题的时候排查起来能更容易一些。“Thread-6″这样的名字看起来太没心没肺了,肯定有比它更好的名字。在处理用户请求的时候,可以将事务ID追加到线程名后面,这样能显著减少你排查问题的时间。
  “pool-1-thread-1″ #17 prio=5 os_prio=31 tid=0x00007f9d620c9800
  nid=0x6d03 in Object.wait() [0x000000013ebcc000]
  “pool-1-thread-1″,这也太严肃了吧。我们来看下这是什么情况,给它起一个好点的名字:
  Thread.currentThread().setName(Context + TID + Params + current Time, ...);
  现在我们再来运行下jstack,情况便豁然开朗了:
  ”Queue Processing Thread, MessageID: AB5CAD, type:
  AnalyzeGraph, queue: ACTIVE_PROD, Transaction_ID: 5678956,
  Start Time: 30/12/2014 17:37″ #17 prio=5 os_prio=31 tid=0x00007f9d620c9800
  nid=0x6d03 in Object.wait() [0x000000013ebcc000]
  如果我们能知道线程在做什么,这样当它出问题的时候,至少可以拿到事务ID来开始排查。你可以回溯这个问题,复现它,然后定位问题并搞定它。。
  2. 线程优先级
  线程还有一个有意思的属性是它的优先级。线程的优先级介于1 (MINPRIORITY)到10 (MAXPRIORITY)之间,主线程默认是5(NORM_PRIORITY)。每个新线程都默认继承父线程的优先级,因此如果你没有设置过的话,所有线程的优先级都是5。这个是通常被忽视的属性,我们可以通过getPriority()与setPriority()方法来获取及修改它的值。线程的构造函数里是没有这个功能的。
  什么地方会用到优先级?
  当然并不是所有的线程都是平等的,有的线程需要立即引起CPU的重视,而有些线程则只是后台任务而已。优先级是用来把这些告诉给操作系统的线程调度器的。在Takipi中,这是我们开发的一错误跟踪及排查的工具,负责处理用户异常的线程的优先级是MAX_PRIORITY,而那些只是在上报新的部署情况的线程,它们的优先级要低一些。你可能会觉得优先级高的线程从JVM的线程调度器那得到的时间会多一些。但其实并都是这样的。
  在操作系统层面,每一个新线程都会对应一个本地线程,你所设置的Java线程的优先级会被转化成本地线程的优先级,这个在各个平台上是不一样的。在Linux上,你可以打开“-XX:+UseThreadPriorities”选项来启用这项功能。正如前面所说的,线程优先级只是你所提供的一个建议。和Linux本地的优先级相比,Java线程的优先级并不能覆盖全所有的级别(Linux共有1到99个优先级,线程的优先级在是-20到20之间)。大的好处是你所设定的优先级能在每个线程获得的CPU时间上有所体现,不过完全依赖于线程优先级的做法是不推荐的。
  进阶篇 3.线程本地存储
  这个和前面提到的两个略有不同。ThreadLocal是在Thread类之外实现的一个功能(java.lang.ThreadLocal),但它会为每个线程分别存储一份的数据。正如它的名字所说的,它为线程提供了本地存储,也是说你所创建出来变量对每个线程实例来说都是的。和线程名,线程优先级类似,你可以自定义出一些属性,好像它们是存储在Thread线程内部一样,是不是觉得酷?不过先别高兴得太早了,有几句丑话得先说在前头。
  创建ThreadLocal有两种推荐方式:要么是静态变量,要么是单例实例中的属性,这样可以是非静态的。注意,它的作用域是全局的,只不过对访问它的线程而言好像是本地的而已。在下面这个例子中,ThreadLocal里面存储了一个数据结构,这样我们可以很容易地访问到它:
  public static class CriticalData
  {
  public int transactionId;
  public int username;
  }
  public static final ThreadLocal<CriticalData> globalData =
  new ThreadLocal<CriticalData>();
  一旦获取到了ThreadLocal对象,可以通过 globalData.set()和globalData.get()方法来对它进行操作了。
  全局变量?这不是什么好事
  也尽然。ThreadLocal可以用来存储事务ID。如果代码中出现未捕获异常的时候它相当有用了。佳实践是设置一个UncaughtExceptionHandler,这个是Thread类本身支持的,但是你得自己去实现一下这个接口。一旦执行到了UncaughtExceptionHandler里,几乎没有任何线索能够知道到底发生了什么事情了。这会儿你能获取到的只有Thread对象,之前导致异常发生的所有变量都无法再访问了,因为那些栈帧都已经被弹出了。一旦到了UncaughtExceptionHandler里,这个线程只剩下后一口气了,能抓住的后一根稻草是ThreadLocal。
  我们来试下这么做:
  System.err.println("Transaction ID " + globalData.get().transactionId);
  我们可以将一些与错误相关的有价值的上下文信息给存储到里面添。ThreadLocal还有一个更有创意的用法,是用它来分配一块特定的内存,这样工作线程可以把它当作缓存来不停地使用。当然了,这有没有用得看你在CPU和内存之间是怎么权衡的了。没错,ThreadLocal需要注意的是会造成内存空间的浪费。只要线程还活着,那么它会一直存在,除非你主动释放否则它是不会被回收的。因此如果使用它的话你好注意一下,尽量保持简单。
  4. 用户线程及守护线程
  我们再回到Thread类。程序中的每个线程都会有一个状态,要么是用户状态,要么是守护状态。换句话说,要么是前台线程要么是后台线程。主线程默认是用户线程,每个新线程都会从创建它的线程中继承线程状态。因此如果你把一个线程设置成守护线程,那么它所创建的所有线程都会被标记成守护线程。如果程序中的所有线程都是守护线程的话,那么这个进程便会终止。我们可以通过Boolean .setDaemon(true)和.isDaemon()方法来查看及设置线程状态。
  什么时候会用到守护线程?
  如果进程不必等到某个线程结束才能终止,那么这个线程可以设置成守护线程。这省掉了正常关闭线程的那些麻烦事,可以立即将线程结束掉。换个角度来说,如果一个正在执行某个操作的线程必须要正确地关闭掉否则会出现不好的后果的话,那么这个线程应该是用户线程。通常都是些关键的事务,比方说,数据库录入或者更新,这些操作都是不能中断的。