C++代码优化思路及27个建议

创作时间:

作者:

@小白创作中心

C++代码优化思路及27个建议

引用

CSDN

https://blog.csdn.net/fanyun_01/article/details/138014888

在软件开发中，代码优化是一项关键活动，尤其是在性能敏感的应用场合，如嵌入式系统、游戏开发、系统级软件以及大数据处理等领域。代码运行效率影响体验度和系统效率。代码优化不仅可以提高程序的执行效率和响应速度，还有助于减少资源消耗（如CPU时间和内存使用）和提升用户体验。本文总结了C++代码优化的一些基本思路和具体建议，希望能对开发人员有所帮助。

代码优化的重要性

性能提升：优化代码可以显著提升程序运行速度，尤其是对于需要高速处理和实时反馈的应用。
资源利用：优化有助于更有效地利用硬件资源，减少内存和CPU的使用，从而降低能耗和成本。
可扩展性和可维护性：良好优化的代码可以更容易地扩展和维护，因为它通常会遵循更清晰的设计和实现原则。
竞争优势：在性能关键型产品中，优化的代码可以为公司或产品提供重要的竞争优势。

代码优化思路

算法和数据结构选择

选择更高效的算法和数据结构：这是提升性能的最直接和最有效的方法。例如，使用哈希表（例如std::unordered_map）而不是树状数据结构（例如std::map）可以在许多情况下提供更快的查找时间。

利用现代编译器优化

编译器优化选项：利用编译器如GCC或Clang的优化选项（如-O2，-O3，-flto (链接时优化)等）。
分析工具：使用性能分析工具（如gprof, Valgrind）来识别热点，即程序中最耗时的部分。

代码层面的优化

循环优化：减少循环开销，例如通过减少循环中的条件判断，合理使用循环展开等。
减少函数调用开销：例如通过内联小函数（使用inline关键字）。
避免不必要的内存分配：例如使用堆栈分配而非堆分配，重用已分配的内存等。

内存访问优化

内存局部性：优化数据的存储和访问模式，以提高缓存命中率。
数据对齐：确保数据对齐，以提升访问速度。

并行编程

多线程和多核利用：利用C++11及以上版本中的线程库（如std::thread），以及并行算法库如OpenMP，利用多核处理器的计算能力。
向量化：利用SIMD指令集（如SSE, AVX）进行数据的并行处理。

编写可预测的代码

减少分支：尽量减少代码中的条件分支，特别是在循环和热点代码段中。

代码重构与设计

模块化和解耦：保持代码的模块化和低耦合，有助于优化和维护。
Profile-Guided Optimization (PGO)：利用实际用户数据来指导编译器优化。

代码优化建议

下面给出一些具体的代码优化建议：

记住阿姆达尔定律：funccost是函数func运行时间百分比，funcspeedup是你优化函数的运行的系数。这意味着不经常使用的代码不需要做较多优化考虑（或者完全不优化）。
代码先保证正确，然后再考虑优化：分多步来做性能优化。先写正确的代码，当你意识到这个函数可能会被经常调用，进行明显的优化。然后再寻找算法的瓶颈，并解决（通过优化或者改进算法）。
优化代码的时间是写代码时间的两倍：这表明优化工作需要投入相当多的时间和精力。
跳转和分支执行代价高：优先使用迭代而不是递归。使用内联函数处理短小的函数来消除函数调用开销。将循环内的函数调用移动到循环外。
仔细思考函数下标的顺序：两阶或更高阶的数组在内存中还是以一维的方式在存储在内存中，这意味着（对于C/C++数组）array[i][j] 和 array[i][j+1]是相邻的，但是array[i][j] 和array[i+1][j]可能相距很远。
使用指令层的并行机制：代码块（在跳转之间的）需要足够的独立指令来允许处理器被充分利用。考虑展开循环来改进这一点。
避免或减少使用本地变量：本地变量通常都存储在栈上。不过如果数量比较少，它们可以存储在CPU寄存器中。
减少函数参数的个数：和减少使用本地变量的理由一样——它们也是存放在栈上。
通过引用传递结构体而不是传值：在射线追踪中，通常不需要将结构体使用传值方式。
如果函数不需要返回值，不要定义一个。
尽量避免数据转换：整数和浮点数指令通常操作不同的寄存器，所以转换需要进行一次拷贝操作。
定义C++对象时需要注意：使用类初始化列表而不是初始化函数。
使类构造函数尽可能轻量：尤其是常用的简单类型（比如，color，vector，point等等），这些类经常被复制。
如果可以的话，使用位移操作>>和<<来代替整数乘除法。
小心使用表查找函数：对于射线追踪功能来说，这通常导致了不必要的内存查找，这很昂贵（并不断增长），并且这和计算一个三角函数并从内存中获取值一样快。
**对大多数类，优先使用+= 、 -= 、 *= 和 /=，而不是使用+ 、 -、 * 、和?/**：这些简单操作需要创建一个匿名临时中间变量。
对于基本数据类型，优先使用+?、?-?、??、?和?/，而不是+=?、?-=?、?= 和 /=。
推迟定义本地变量：定义一个对象变量通常需要调用一次函数（构造函数）。
对于对象，使用前缀操作符（++obj），而不是后缀操作符（obj++）：使用后缀操作符需要执行一次对象拷贝。
小心使用模板：对不同的是实例实现进行不同的优化。标准模板库已经经过良好的优化，不过在实现一个交互式射线追踪算法时避免使用它。
避免在计算时进行动态内存分配：动态内存分配需要获取控制访问分配器的锁。对于多线程应用程序，这会导致性能下降。
找到系统内存cache的信息并利用它们：如果一个数据结构正好适合一个cache行，处理整个类从内存中只需要做一次获取操作。
避免不需要的数据初始化：如果你需要初始化一大段的内存，考虑使用memset。
尽早结束循环和尽早返回函数调用：考虑一个射线和三角形交叉，通常的情况是射线会越过三角，所以这里可以优化。
在稿纸上简化你的方程式：许多方程式中，通常都可以或者在某些条件中取消计算。
整数、定点数、32位浮点数和64位双精度数字的数学运算差异，没有想象的那么大：在现代CPU，浮点数运算和整数运算差不多拥有同样的效率。
不断改进数学计算，以消除昂贵的操作：sqrt()经常可以被优化掉，尤其是在比较两个值的平方根是否一致时。