哈喽,大家好,我是呼噜噜,前段时间感冒了,好久没更新文章了,今天我们来聊聊计算机储存方式大端小端字节序之分
在计算机中,无论上层是什么开发语言,到了最底层都是以二进制的形式存储运算的;二进制,与我们更熟悉的十进制(由0-9这九个数字组成,逢十进一)不同的是,只有0和1两个数字,逢二进一
如今的主流计算机,是以以储存器为中心,存储器是用来存放数据和程序,下面是架构图:
图片
存储器 包含主存和辅存,其中主存是能直接与CPU交换信息,就是我们熟悉的内存。
计算机以二进制的形式将数据存到内存中,内存的基本单位是字节Byte, 内存以字节为单位来进行读写 。1Byte = 8bit(bit叫位,也叫比特,是用以描述计算机数据量的最小单位)。字节是内存8位为一组,每组比特都会被标记一个数字,这个数字也叫地址,寻址粒度也是字节
一个字节由于8位,如果它只考虑无符号数,它的表示范围0~255;如果考虑符号,并通过补码解决0值的问题,只能表示-128~127这个范围;那么如果超出这个范围,只能将多个字节连在一起来表示数值。比如C语言中char类型是1个字节的,int类型占用4个字节,double类型会占用8个字节等等
那么多个字节依次存到内存中,就会有顺序,这个叫字节序Endianness,也被称为端序,就是 大于一个字节类型的数据在内存中的存放顺序
字节序可以被分为两类:Big-Endian大端和Little-Endian小端(这也意味着单个字节没有大小端之分的),我们下文详细聊聊
大端字节序Big-Endian:数值的高位字节存放在内存的低地址端,低位字节存放在内存的高地址端
本文这里以32位的数0x12345678,来举个例子
图片
在现代计算机中,大多采用小端字节序,比如x86、DEC VAX、PDP-11等等 当然也有采用大端字节序的,比如:IBM、Sun、PowerPC等处理器 另外ARM系列处理器,大小端字节序都支持,可配置
可以写个小代码来快速判断,我们这里以C/C++语言为例:
BOOL IsBigEndian(){ union NUM { int a; char b; }num; num.a = 0x1234; if( num.b == 0x12 ) { return TRUE; } return FALSE;}
这里利用联合体union,所有成员共用同一块内存的特性,可以轻松地判断当前设备是否是大小端字节序
最后补充一个小故事,大端小端名词来源于Jonathan Swift书写的《格列佛游记》,书中描述了小人国,因为吃鸡蛋是从大头的一端剥开还是从小头的一端这个问题,导致教派之间的冲突,连年征战,死战不休
这是不是也暗示大端小端争论,并无较真的意义,怎么好用怎么来,通信交流做好转换的必要措施即可
到如今,从技术上来说,大小端的并无谁有明显的优势,更多的是计算机发展历史的影响。最初设计时,对字节序的选择往往是任意的,但后续技术的发展,需要背上兼容性的包裹。比如ARM明明大小端都支持,为啥大部分是小端,主要是移植x86程序方便;
还有RISC-V手册描述他们选择了小端序的原因:因为小端字节序,目前在商业上占主导地位(所有x86系统、iOS、Android和Windows for ARM)。想拓宽视野地可以去看看The RISC-V Instruction Set Manual Volume I: Base User-Level ISA
当然也有商业竞争的原因,Intel的x86选择小端(可能是为了躲避专利纠纷),最终击败了IBM,导致如今主机领域小端是主流
《深入理解计算机系统》
https://inst.eecs.berkeley.edu/~cs250/fa11/handouts/riscv-spec.pdf
https://www.spiceworks.com/tech/tech-general/articles/big-endian-vs-little-endian
本文链接:http://www.28at.com/showinfo-26-80815-0.html你了解计算机中大端小端之分吗?
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com
上一篇: 一文揭秘向量化编程的高性能魔法世界
下一篇: 探索类中的成员对象与封闭类