问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

中文的熵：从信息论角度解析汉语特点

创作时间:

作者:

@小白创作中心

中文的熵：从信息论角度解析汉语特点

引用

豆瓣

1.

https://m.douban.com/group/topic/308562846/

信息熵是衡量信息不确定性的指标，在语言学领域，信息熵可以反映一种语言的平均信息量。中文信息熵的计算较为复杂，受到多种因素的影响，包括所使用的文本库、统计方法以及是否考虑语言的高阶特征等。本文将介绍一些关于中文信息熵的研究数据，并分析中文信息熵较高的原因。

中文的信息熵难以确定一个精确的值，因为其计算会受到多种因素的影响，例如所使用的文本库、统计方法以及是否考虑语言的高阶特征等。

一些研究和估算给出了不同的结果。例如，在我国文字研究所1989年出版的《现代汉语定量分析》中，汉字的熵被估算为9.6比特。2002年，哈佛大学的 Frederi 等人通过实验得出相似结论。

孙帆和孙茂松基于《人民日报》的11,978,549字语料库，通过建模与平衡测试样本集之间的交叉熵，得到基于字符而直接计算出的一阶熵、二阶熵与三阶熵分别是：9.62、7.15、6.65bit。

需要注意的是，这些数值只是在特定条件下的估算，实际的中文信息熵可能会因具体情况而有所不同。并且，随着研究的深入和更多数据的使用，对中文信息熵的估计也可能会发生变化。

中文信息熵相对较高的原因主要在于汉语的一些特点，例如汉字系统的字素（符号）数目庞大，且存在一符多义的情况；汉语语法相对简单，减少了因语法时态等产生的额外文字；多音字的存在使同样的字词有多个意思，需通过上下文来消除不确定性；中国由字组词的扩展方式也减少了新文字的出现等。这些特点使得在同样的文字长度下，中文能够传达更丰富的信息量。

热门推荐

显卡super和ti有什么区别哪款显卡更值得入手

显卡super和ti有什么区别哪款显卡更值得入手

两轮车还没结束，多家三轮车企业被工信部通报，车主要注意这3点

两轮车还没结束，多家三轮车企业被工信部通报，车主要注意这3点

如何解决备案过程中遇到的问题

如何解决备案过程中遇到的问题

新高考与老高考的位次对比方法、成绩如何换算（2025年必看）

新高考与老高考的位次对比方法、成绩如何换算（2025年必看）

中医科普|学习中药煎煮法：张仲景的古法与现代应用

中医科普|学习中药煎煮法：张仲景的古法与现代应用

停车不小心剐蹭到别人车怎么办

停车不小心剐蹭到别人车怎么办

地铁工作人员休息制度：工作时间长、轮班制度严，休息室成“小确幸”

地铁工作人员休息制度：工作时间长、轮班制度严，休息室成“小确幸”

肩膀疼痛是什么原因引起的

肩膀疼痛是什么原因引起的

美国国家脂质协会ApoB共识发布！关于ApoB检测，这些要点你需要明确？

美国国家脂质协会ApoB共识发布！关于ApoB检测，这些要点你需要明确？

中国式「断舍离」，从扔掉家里的6样东西开始，个个都很常见！

中国式「断舍离」，从扔掉家里的6样东西开始，个个都很常见！

延迟性肌肉酸痛在运动后多长时间

延迟性肌肉酸痛在运动后多长时间

插排有使用年限吗？家庭电气安全不可忽视

插排有使用年限吗？家庭电气安全不可忽视

没签字的合同是否具备有效性

没签字的合同是否具备有效性

果汁机榨果汁食谱大全（14种鲜榨果汁搭配方法）

果汁机榨果汁食谱大全（14种鲜榨果汁搭配方法）

虚拟机文件修复指南：从检查到恢复的全方位解决方案

虚拟机文件修复指南：从检查到恢复的全方位解决方案

支气管肺炎三大症状和体征是什么

支气管肺炎三大症状和体征是什么

临沂市河东区毛官庄遗址入选山东省五大考古新发现

临沂市河东区毛官庄遗址入选山东省五大考古新发现

海报设计中的留白艺术：如何通过留白提升设计高级感

海报设计中的留白艺术：如何通过留白提升设计高级感

打印机显示灰色的原因及解决方法

打印机显示灰色的原因及解决方法

“检查检验太贵了”，期待灵魂砍价再次发力

“检查检验太贵了”，期待灵魂砍价再次发力

王者荣耀：逍遥幻梦-庄周出装推荐

王者荣耀：逍遥幻梦-庄周出装推荐

哪些数据会影响黄金价格？这些数据的影响程度如何？

哪些数据会影响黄金价格？这些数据的影响程度如何？

央行降准降息的影响

央行降准降息的影响

优化NAS文件管理：五大措施提升用户体验

优化NAS文件管理：五大措施提升用户体验

网上办理营业执照年检的入口及步骤

网上办理营业执照年检的入口及步骤

超30家车企推出促销降价，春节买车谁家更划算？

超30家车企推出促销降价，春节买车谁家更划算？

怎么找合租房？掌握这些技巧事半功倍

怎么找合租房？掌握这些技巧事半功倍

汽车油箱容量大小对续航有何影响

汽车油箱容量大小对续航有何影响

六大常见技术指标是哪些？全面了解技术分析指标

六大常见技术指标是哪些？全面了解技术分析指标

胃出血的症状有哪些

胃出血的症状有哪些

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号