问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

字符编码引发的乱码现象剖析及解决方案（cpp版）

创作时间:

作者:

@小白创作中心

字符编码引发的乱码现象剖析及解决方案（cpp版）

引用

CSDN

1.

https://m.blog.csdn.net/weixin_55210116/article/details/145401510

在软件开发和文本处理中，字符编码问题是一个常见的技术挑战。本文详细探讨了UTF-8、GBK和ISO8859三种主要编码方式，并通过具体案例分析了不同编码方式下可能出现的乱码现象及其解决方案。

1. 常见编码格式

UTF-8：通用编码方式，跨平台广泛支持。
GBK/GB2312：中国常见的本地编码方式。
ISO8859：常用的西欧语言编码。

UTF-8、GBK、ISO8859 都是字符编码方式，用于将字符（如字母、数字、符号等）转换为计算机可以处理的数字形式。

UTF-8

UTF-8 是一种全球通用的编码方式，支持多种语言和符号，适用于互联网和多语言环境。

GBK

GBK 是一种主要针对中文的编码方式，在中国的旧系统中得到了广泛应用，但不支持 Unicode 中的所有字符。

ISO 8859

ISO 8859 是一系列字符编码标准，由国际标准化组织（ISO）制定，用于西欧语言。它包括多个子集，每个子集针对不同的语言或地区设计，包含特定的字符集。ISO 8859 系列编码的共同特点是与 ASCII 编码兼容，使用一个字节来表示字符，码位都在 0xA1 – 0xFF，每个字符集定义至多 95 个字符。

2. 乱码现象与命名

本文使用的测试程序（VS Code）默认使用 UTF-8 保存和打开。

可以看到下面有选择编码的保存方式和打开方式。

这些就是常见的编码格式，它们的主要区别在于编码范围、兼容性和使用场景。

具体导致乱码的原因、现象和命名如下：

UTF-8 保存，GBK2312 读取

若用 UTF-8 格式保存，GBK2312 格式读取导致的乱码如图所示，我们称之为“古文码”，特点为：大都为不认识的古文，并夹杂日韩文。

GBK2312 保存，UTF-8 读取

若用 GBK2312 格式保存，UTF-8 格式读取导致的乱码如图所示，我们称之为“口字码”，特点为：大部分字符为小方块。

UTF-8 保存，ISO8859 读取

若用 UTF-8 格式保存，ISO8859 格式读取导致的乱码如图所示，我们称之为“符号码”，特点为：大部分字符为各种符号。

GBK2312 保存，ISO8859 读取

若用 GBK2312 格式保存，ISO8859 格式读取导致的乱码如图所示，我们称之为“拼音码”，特点为：大部分字符为头顶带有各种类似声调符号的字母。

错误保存和读取叠加的变种

以下都是错误保存和读取叠加的变种，种类繁多，不过解决方案与上文是相同的，在此不再一一展示。

若用 UTF-8 格式保存，GBK2312 格式读取，然后又用 UTF-8 再次读取导致的乱码“由月要好好学习天天向？？”，特点是字符串长度为偶数时正确，奇数时最后字符变为问号，我们称之为“问号码”。
若用 GBK2312 格式保存，UTF-8 格式读取，然后又用 GBK2312 再次读取导致的乱码全是 “锟斤拷” 字符，我们称之为“锟拷码”。
若 VC Debug 模式下栈内存未初始化导致的乱码全为“烫烫烫”字符，我们称之为“烫烫码”。
若 VC Debug 模式下堆内存未初始化导致的乱码全为“屯屯屯”字符，我们称之为“屯屯码”。

3. 解决方案

统一编码

在编辑器（如 VS Code）或 IDE 中使用 UTF-8 保存、打开，并同样使用 UTF-8 编译。

明确编解码设置

数据库、前端页面、服务端等保持一致编码。

初始化内存

Debug 环境为数组或字符串等内存区域赋初始值，避免随机字符出现。

4. 总结

要避免中文乱码，应始终保持文件的保存格式与读取格式一致，并在可能的情况下使用 UTF-8。若遇到疑似编码问题，先检查文件与编辑器的编码设置，再统一编解码规则，最后排查程序对字符串的处理流程。

提示：若确实需要在不支持 UTF-8 环境下处理中文，可预先使用 GBK 编码，但务必保持一致的编解码模式。

热门推荐

低容量性低钠血症的原因

低容量性低钠血症的原因

垄断是资本主义的最高阶段：法律视角下的分析与解读

垄断是资本主义的最高阶段：法律视角下的分析与解读

眼袋大怎么才能消除

眼袋大怎么才能消除

什么是轮距？详解轮距对汽车性能的影响

什么是轮距？详解轮距对汽车性能的影响

什么是轮距？详解轮距对汽车性能的影响

什么是轮距？详解轮距对汽车性能的影响

中华文化瑰宝：探秘儒家经典“四书五经”

中华文化瑰宝：探秘儒家经典“四书五经”

被告销售侵权产品怎么举证？一文详解应对策略

被告销售侵权产品怎么举证？一文详解应对策略

律师和法律顾问在处理侵权案件中的作用是什么

律师和法律顾问在处理侵权案件中的作用是什么

凝视远邦：1793年马戛尔尼访华使团的视觉文化

凝视远邦：1793年马戛尔尼访华使团的视觉文化

中国研发干细胞的机构有哪些？哪家实力最强？

中国研发干细胞的机构有哪些？哪家实力最强？

汽车补漆的操作方法是怎样的？补漆后怎样进行效果评估？

汽车补漆的操作方法是怎样的？补漆后怎样进行效果评估？

法律移植：概念、方法与挑战

法律移植：概念、方法与挑战

法律移植：概念、方法与挑战

法律移植：概念、方法与挑战

临床个体差异与治疗效果的关系研究

临床个体差异与治疗效果的关系研究

微波测距与光学测距：探索前沿测量技术

微波测距与光学测距：探索前沿测量技术

35条精选励志语录：给心灵注入正能量

35条精选励志语录：给心灵注入正能量

世界乒联官宣！修改明年总决赛规则，引入新排名体系确定选手名单

世界乒联官宣！修改明年总决赛规则，引入新排名体系确定选手名单

《希腊哲学》简明概览：犬儒主义

《希腊哲学》简明概览：犬儒主义

详细解析CPU缓存的作用

详细解析CPU缓存的作用

“九一八”之前，日军在山东早已凶相毕露

“九一八”之前，日军在山东早已凶相毕露

炒面的精准做法

炒面的精准做法

意大利面营养吗？美味与营养的双重探索

意大利面营养吗？美味与营养的双重探索

高等学校毕业生登记表的自我鉴定部分有哪些评分标准？

高等学校毕业生登记表的自我鉴定部分有哪些评分标准？

经济学论文选题方式

经济学论文选题方式

油条面怎么和面又软又酥，只加酵母不好吃，油条酥脆蓬松有妙招

油条面怎么和面又软又酥，只加酵母不好吃，油条酥脆蓬松有妙招

脆皮油条粉配料表解析：选择好配料，做出好油条

脆皮油条粉配料表解析：选择好配料，做出好油条

四人团队如何起名好听

四人团队如何起名好听

口苦口干？这些食物帮你快速缓解

口苦口干？这些食物帮你快速缓解

龙岗观察｜这个工业大区，为何成为消费热门

龙岗观察｜这个工业大区，为何成为消费热门

脑卒中后语言障碍的康复策略与实践

脑卒中后语言障碍的康复策略与实践

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号