一般来说因为局部变量导致堆栈越界的问题比较难查,因为gdb保存的也不是第一现场。
以我的经验来说,首先应该初步估计出问题的流程,然后在该流程中大量加入打印,通过
打印信息缩小排查范围,然后结合代码走读查找BUG。
阅读代码时重点注意,局部变量中的数组大小,以及memset,memcpy类的系统调用,还有就是循环赋值语句。
如果问题无法复现的话,就要碰运气了。
假设局部变量写越界不严重的话,可以手动推导一部分堆栈中的函数调用关系,要求对C语言的压栈过程比较熟悉。
大致上的做法是:
出现SEGV时,查看寄存器esp的值,在根据esp的值打印出堆栈的信息,如果这部分数据不是全零的话,说明堆栈被写越界的太多;否则的话,还是放弃吧。
另一方面要用nm命令把调试目标的符号表取出,最好按地址排序。
接下来,就是手动对比堆栈中的现场和符号表了