这篇文章主要是针对c++程序中可能出现的内存错误做一些间单的归纳。是看了Rational Purify的使用和分析之后做的提炼。相信很多初级的c++程序员也像我一样曾被这些问题困惑,希望对各位看官有所帮助。
一、内存错误的分类a.内存访问错误对内存进行读或写时发生的错误,可能是读未被初始化的内存单元,也可能是读写错误的内存单元。
b.内存使用错误主要是在动态请求内存之后没有正确释放产生的错误。
二、内存剖析(典型的c++内存模型)
BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。
数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。(其实我不太明白既然都是存全局变量的,那为什么要把已初始化的和未初始化的分开在两个段中进行管理)
代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。
堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)
栈(stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。
c++不同于C#、Java的一个地方是它可以动态管理内存,但鱼与熊掌两者不可兼得,灵活性的代价是程序员需要花费更多的精力保证代码不发生内存错误。
三、常见的内存访问错误和内存使用错误
具体来说,内存访问错误有下面这几种:访问未被初始化的内存单元、数组访问错误、访问无效的内存单元(0x000000,0x000005等)、写无效内存。
而内存使用错误有:1、请求内存之后没有将它释放,使new和delete成对出现可以避免这样的问题。2、释放一块内存后又再释放一次。
四、例子
1 #include <iostream> 2 using namespace std; 3 int main(){ 4 char* str1="four"; 5 char* str2=new char[4]; //not enough space 6 char* str3=str2; 7 cout<<str2<<endl; //UMR 8 strcpy(str2,str1); //ABW 9 cout<<str2<<endl; //ABR 10 delete str2; 11 str2[0]+=2; //FMR and FMW 12 delete str3; //FFM 13 } |
UMR:Uninitialized Memery Read.读未初始化内存
ABW:Array Bound Write.数组越界写
FMR/W:Freed Memery Read/Write.读/写已被释放的内存
FFM:Free Freed Memery.释放已被释放的内存
由以上的程序,我们可以看到:在第5行分配内存时,忽略了字符串终止符"\0"所占空间导致了第8行的数组越界写(Array Bounds Write)和第9行的数组越界读(Array Bounds Read); 在第7行,打印尚未赋值的str2将产生访问未初始化内存错误(Uninitialized Memory Read);在第11行使用已经释放的变量将导致释放内存读和写错误(Freed Memory Read and Freed Memory Write);最后由于str3和str2所指的是同一片内存,第12行又一次释放了已经被释放的空间 (Free Freed Memory)。
这个包含许多错误的程序可以编译连接,而且可以在很多平台上运行。但是这些错误就像定时炸弹,会在特殊配置下触发,造成不可预见的错误。这就是内存错误难以发现的一个主要原因。