快毕业的通信学生,之前正式代码经验几乎零。目前在已经给Offer的公司实习安卓开发。Mentor说先从找code base中bug开始。但是我感觉我们的codebase好复杂,这几天突然没什么进展。uml之类的也画了不少。想问问前辈们有什么建议?
  update:
  感谢各位分享自己的经验。这段时间略有进展,来说说自己的体会吧。
  1、首先,我是很认同mentor让我从修bug开始慢慢掌握codebase的。那些对这个有质疑的前辈们估计是觉得我们的codebase有很大吧。如果codebase到G级我也不会认同从bug入手的。
  2、耐心是第一位的。初的作者都不在,所以想找他们聊也不可能,其他人有的忙,有的又不能对所有细节清楚,所以资源有限情况下特别有抵触情绪。这个真得压制好。
  3、之前一位大神说过我很认同的话:国内程序员都喜欢系统掌握再去使用,而快速掌握并使用的能力欠缺。我在自己身上感受特别身,也是一直下意识去突破这种不足。
  4、但是有些细节真的要掌握清楚,比如framework中并不特别明显(由framework本身“自动管理”)的代码。这个栗子比如android中adapter的重复利用view。在自己的code中很难跟出来。5、或许能跟出来,但这不是新人嘛,工具和技能都不够熟。所以同时新人的同学们要好好注意自己的工具是真。
  后特别感谢大家热心回答,依然期待各种新手老鸟来说说你们的看法。
  姚冬,哥写的不是代码,是梦想
  我曾经做了两年大型软件的维护工作,那个项目有10多年了,大约3000万行以上的代码,参与过开发的有数千人,代码checkout出来有大约5个GB,而且bug特别多,open的有上千,即使高优先级的showstopper也有上百。
  分享下我的debug的经验
  1. 优先解决那些可重现的,可重现的bug特别好找,反复调试测试好了,先把好解决的干掉,这样节约时间。
  2. 对于某些bug没有头绪或者现象古怪不知道从哪里下手,找有经验的同事问一下思路,因为在那种开发多年的大型系统里,经常会反复出现同样原因的bug,原因都类似,改了一处,过一阵子另外一处又冒出来,而且无法根治。
  比如:我那个系统里有个特别危险的API,接口参数比较难用,一旦有人用错了某些情况下会出诡异的现象,解决很简单,找到调用这个API的地方把调用方式写对好了。为什么不根治呢?因为要保持兼容性不能改接口了。Windows系统里好多这种烂API。
  问下老员工吧,说不定他们都遇到过好多次了。
  3. 放大现象,有些bug现象不太明显,那么想办法增大它的破坏性,把现象放大。这只是个思路,具体怎么放大只能根据具体的代码来定。
  比如:美剧《豪斯医生》里有一集,怀疑病人心肺有问题,让病人去跑步机上跑步,加重心肺负担,从而放大症状。
  4. 二分法定位,把程序逻辑一点点注释掉,看看还会不会出问题,类似二分查找的方法,逐步缩小问题范围。
  5. 模拟现场,有时候我会问自己,如果我要实现bug描述的现象我要怎么写代码才行?
  比如:我遇到一个死锁问题,但是检查代码发现所有的锁都是配对的,没有忘记解锁的地方,而且锁很简单是一个普通的临界段,保护几行附值语句而已。这样的代码怎么写才能让他死锁呢?
  我想如果让我故意制造这样一个现象,只有在上锁的时候强制杀掉线程了。
  既然这样可以去看看有谁强杀线程了没有。
  6. 制作工具,针对某些bug编写一些调试辅助工具。
  比如,我那个系统没有完善的崩溃报告,虽然也有dump,但是分析出来的callstack经常不准。于是我为解决崩溃问题编写了个工具,会自动扫瞄代码,在每个函数入口和出口插入log,以此来定位崩溃点。
  7. 掩盖问题,虽然这样做有点不厚道,但是有时不得不这么做。有些bug找不到真正的root cause,但是又要在规定时间内解决,那么我们可以治疗症状而不去找病因。比如用try catch掩盖一些奇怪的崩溃。不到万不得已不要这么干,未来可能会付出更大代价。
  我在做这份工作的时候也在追美剧《豪斯医生》,豪斯大叔解决病症的思路和debug差不多,对我很有启发。