资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

浮点数在内存中的储存方式详解

创作时间:

作者:

@小白创作中心

浮点数在内存中的储存方式详解

引用

来源

https://cloud.tencent.com/developer/article/2494026

在计算机科学中，浮点数是一种用于表示实数的数据类型。与整数不同，浮点数可以表示非常大或非常小的数值，并且能够处理小数部分。然而，浮点数在内存中的存储方式与整数有很大的不同，本文将深入探讨浮点数在内存中的存储方式，帮助读者更好地理解这一概念。

1. 题目引入

我们先看这样一个案例，观察一下程序运行的结果：

#include<stdio.h>
int main() {
    int n = 9;
    float* p_float = (float*)&n;
    printf("n的值为：%d\n", n);
    printf("*n_float的值为：%f\n", *p_float);
    *p_float = 9.0;
    printf("n的值为：%d\n", n);
    printf("*n_float的值为：%f\n", *p_float);
    return 0;
}

第一个输出结果比较易懂，但是为什么另外三个的值会是这样的呢？

2. 功能介绍

2.1 浮点数的基本概念

浮点数是一种用于表示实数的数据类型。它由两部分组成：尾数M（mantissa）和指数E（exponent）。尾数表示数值的有效数字，而指数表示数值的缩放比例。通过这种方式，浮点数可以表示非常大或非常小的数值。

2.2 IEEE 754标准

IEEE 754是浮点数表示的国际标准，定义了浮点数在内存中的存储格式。根据IEEE 754标准，浮点数可以分为单精度（32位）和双精度（64位）两种类型。单精度浮点数使用32位存储，其中1位用于符号，8位用于指数，23位用于尾数。双精度浮点数使用64位存储，其中1位用于符号，11位用于指数，52位用于尾数。

2.3 浮点数的存储格式

在IEEE 754标准中，浮点数的存储格式如下：

符号位（Sign Bit）：1位，表示浮点数的正负。0表示正数，1表示负数。
指数位（Exponent）：8位（单精度）或11位（双精度），表示浮点数的指数部分。指数部分采用偏移量表示法，即实际指数值为存储值减去一个固定的偏移量。
尾数位（Mantissa）：23位（单精度）或52位（双精度），表示浮点数的尾数部分。

举个例子，9.5（单精度）在内存中的内容要通过以下方式计算：

将整数和小数部分转化为二进制数：
1001.1
（注意，小数点后的1代表2^0.1,即0.5）；
移动小数点使其变成1.xxxxx的形式：原式 = 1.0011 x 2^3；
此时，尾数部分就是小数点后面的部分，即M = 0011；
指数部分为2^后面的部分，也就是3，加上常数127，得到值130，转换为而二进制：E = 10000010
由于9.5为正数，所以符号位为0，即S = 0；
我们将其按照S-E-M的顺序补位，得到：0-1000 0010-0000 0000 0000 0000 0000 011
也就是说，9.5在内存中的储存内容就是01000001000000000000000000000011

内存映射

单精度和双精度的内存映射如下：

2.4 浮点数的表示范围

由于浮点数的存储方式，其表示范围受到指数和尾数的限制。

单精度浮点数的表示范围约为±3.4×10^38^;
双精度浮点数的表示范围约为±1.8×10^308^。

然而，浮点数的精度受到尾数位数的限制，单精度浮点数的精度约为7位十进制数，双精度浮点数的精度约为15位十进制数。

3. 注意事项

3.1 精度问题

浮点数的精度受到尾数位数的限制，因此在处理非常大或非常小的数值时，可能会出现精度损失。例如，两个非常接近的浮点数相减可能会导致结果不准确。为了避免这种情况，可以使用更高精度的浮点数类型（如双精度浮点数）或采用数值稳定的算法。

我们看下面的代码：

#include<stdio.h>
int main() {
    float a = 3.14;
    printf("%f", a);
    return 0;
}

我们在调试中查看a在内存中的值

其中04 84 5f 3c转换成二进制为0-10010000-1000 1011 1110 0111 100

不难发现，3.14的小数部分无法被精确表示，因为每一个位数，都是2的n次方：2-1、2-2 、2-3……

3.2 特殊值

IEEE 754标准定义了一些特殊值，如正无穷大（+∞）、负无穷大（-∞）和非数字（NaN）。这些特殊值用于表示某些特殊情况，如除以零或无效运算。

3.3 比较浮点数

由于浮点数的精度问题，直接比较两个浮点数是否相等可能会导致错误的结果。通常，可以使用一个很小的阈值（如ε）来判断两个浮点数是否近似相等。例如，判断|a - b| < ε是否成立，而不是直接判断a == b。

4. 题目解答

代码分析

变量声明与初始化

int n = 9;
float* p_float = (float*)&n;

int n = 9;声明了一个整数变量n并将其初始化为9。
float* p_float = (float*)&n;声明了一个指向浮点数的指针p_float，并将其初始化为指向n的地址。这里使用了类型转换(float*)，将n的地址（原本是int类型）强制转换为float类型。

第一次输出

printf("n的值为：%d\n", n);
printf("*n_float的值为：%f\n", *p_float);

printf("n的值为：%d\n", n);输出n的值，此时n的值是9，所以输出为n的值为：9。
printf("*n_float的值为：%f\n", p_float);输出p_float所指向的值。由于p_float是一个float类型的指针，而n是一个int类型的变量，*p_float会将n的内存内容解释为一个浮点数。
n此时在内存中的值为：00000000-00000000-00000000-00001001
按照浮点类型解释：0-00000000-00000000000000000001001，是一个非常小的数。

修改指针指向的值

*p_float = 9.0;

*p_float = 9.0;将p_float所指向的内存位置的值修改为9.0。由于p_float指向的是n的内存地址，因此n的内存内容被修改为浮点数9.0的二进制表示。

第二次输出

printf("n的值为：%d\n", n);
printf("*n_float的值为：%f\n", *p_float);

printf("n的值为：%d\n", n);输出n的值。由于n的内存内容被修改为浮点数9.0的二进制表示，因此n的值现在是一个与9.0的二进制表示相对应的整数。同理，这个值是一个非常大的整数。
printf("*n_float的值为：%f\n", p_float);输出p_float所指向的值。由于p_float指向的内存内容已经被修改为9.0，因此输出为n_float的值为：9.000000。