02_信息的表示和存储

现代计算机存储和处理的信息以二值信号表示，这些二进制数字称为位(bit).把位组合在一起，再加上某种解释，就能够表示任何有限集合的元素。

信息存储

大多数计算机使用8位的块，或者字节(byte),作为最小的可寻址的内存单位，而不是访问内存中单独的位。程序将内存视为一个非常大的字节数组，称为虚拟内存(virtual memory).内存的每个字节都有唯一的数字来标识，称为它的地址(address)，所有可能地址的集合就称为虚拟地址空间(virtual address space).每个程序对象可以简单地视为一个字节块，而程序本身就是一个字节序列。

每台计算机都有一个字长(word size)，指明指针数据的标称大小(nominal size)。字长决定虚拟地址空间的最大大小。对于一个字长为 w 位的机器而言，程序最多访问 2w 个字节。大多数64位机器也可以运行为32位机器编译的程序，这是一种向后兼容。

// 32位程序
linux> gcc -m32 prog.c
// 64位程序
linux> gcc -m64 prog.c

大部分机器上，多字节对象都被存储位连续的字节序列，对象的地址为所使用字节中最小的地址。某些机器在内存中按照从最低有效字节到最高有效字节的顺序存储对象，称为小端法(little endian);另一些机器按照从最高有效字节到最低有效字节的顺序存储，称为大端法(big endian).

假设变量x 的类型为 int，位于地址 0x100 处，它的十进制为 0x01234567，地址范围 0x100~0x103的字节顺序依赖于机器的类型：

在不同类型的机器之间通过网络传送二进制数据时，当小端法机器产生的数据被发送到大端法机器或者反过来时，接收程序会发现字节成了反序的。

#include 
// 指向类型为 unsigned char 的对象的指针
typedef unsigned char *byte_pointer;

void show_bytes(byte_pointer start, size_t len)
{
    size_t i;
    for(i = 0; i < len; i++)
    {
        printf(" %.2x", start[i]);
    }
    printf("\n");
}

void show_int(int x)
{
    // 强制转换成字节序列
    show_bytes((byte_pointer)&x, sizeof(int));
}

void show_float(float x)
{
    show_bytes((byte_pointer)&x, sizeof(float));
}

void show_pointer(void* x)
{
    show_bytes((byte_pointer)&x, sizeof(void*));
}

void test_show_bytes(int val)
{
    int ivale = val;
    float fval = (float)ival;
    int *pval = ival;
    show_int(ival);
    show_float(fval);
    show_pointer(pval);
}

在不同机器上输出结果如下：