最近看了一些 C 语言相关的文章,复习了一些二级制运算相关的知识点,记录一下。
内存中的数据存取与运算是通过硅半导体来实现的,即可以简单理解为内存由无数个二进制单元(即一个比特,bit)构成。但在实际写代码进行运算中,很少有数据可以直接用一个0
或者1
,比如true
或false
来表示,所以通常由内存中 8 个 bit 构成一个 byte 来表示内存的一个最小基本存储单位。
printf("size of int is %lu bytes.\n", sizeof(int));
//输出:size of int is 4 bytes.
执行上述语句,可以知道当前环境int
类型在内存中占用 4 个 byte,即大小为 4*8 = 32 bit。在不考虑正负性的情况下,理论上一个int
类型可以存储0~2^32之间数值。而通常情况下,为了考虑符号,每个int
类型的第一个二进制位填充0代表正整数,1代表负整数,因此int
类型的值范围是 - 2^31 ~ 2^31-1。
真值与源码
真值,即数值的二进制数值。
原码,即在真值的最高位补上0(表示正整数,结果与真值相同)或1(表示负整数)表示符号。
比如值为 -8 的int
类型的原码为:10000000 00000000 00000000 00001000
,值为 16 的int
类型的原码为00000000 00000000 00000000 00010000
。
为了方便后续描述,将数值的int
长度缩小为一个字节(即 8 bit)。
比如用原码计算16 + (-8)
则表示为:
00010000
+10001000
---------
10011000
可以看到,如果计算机按照上述的加法规则,就会得到10011000
的结果,转成十进制就是 -24。显然,这是错误的答案。
补码的思想
我们希望只设计加法运算器,不用减法运算器,即找到一种通用方案,采用该方案计算1 - 1
,可以直接根据二进制的加法规则计算1 + (-1)
得到 0,而不必考虑如何做二进制减法。然而利用原码对16 + (-8)
进行二进制加法运算发现,用原码来表示负整数依然行不通。
现在问题来了:如何用二级制来表示负整数呢?简化一下,即00000001
加上什么样的二进制数 X 可以得到00000000
?
从右向左思考,X 最低位必须是 1,根据二进制加法规则:1 + 1 = 0,进位为 1。再考虑次低位,X 的次低位也必须是 1,然后加上 1 得 0 进一位...,依次类推,X 的所有位数都必须都是 1,才可以得到00000000
,即:
00000000
+11111111
---------
100000000
这在数学上是不可接受的,但是在计算机中却刚好合适,因为在计算机设计中,int 类型长度是确定的,所以无论结果最后是多少位,多余的位会被丢弃,即最终计算结果为00000000
= 十进制 0(我们上述为了方便,int 假设为 8 位),这也是我们预期的结果:1 + (-1) = 0。
因此,问题转化为如何合理地将 -1 变成二级制11111111
。
反码与补码
带符号整数有原码、反码、补码等几种表示方式,反码和补码是对原码进行某种转换后得到的二进制表示。
正整数的原码、反码和补码都一样。
负数的反码是对原码的除符号位外的其他位进行取反后的结果(取反即如果该位为 0 则变为 1, 而该位为 1 则变为 0 的操作);负数的补码是先求其原码的反码,然后在反码的末尾位加 1 后得到的结果,即负数补码是其反码 + 1。
用补码计算16 + (-8)
则表示为:
00010000
+11111000
---------
100001000
最终结果是00001000
= 十进制 8(去掉超出长度的高位)。由此看出,补码就是我们想要的解决方案,利用补码来进行二进制加法运算可以实现加减法用同一种电路 - 与门来计算。
补码的本质
要将正数转成对应的负数,其实只要用 0 减去这个数就可以了。比如,-8其实就是 0 - 8。
已知8的二进制是00001000
,-8就可以用下面的式子求出:
00000000
-00001000
---------
因为00000000
(被减数)小于00001000
(减数),所以不够减。请回忆一下小学算术,如果被减数的某一位小于减数,我们怎么办?很简单,问上一位借 1 就可以了。
所以,0000000
也问上一位借了 1,也就是说,被减数其实是100000000
,算式也就改写成:
100000000
-00001000
---------
11111000
进一步观察,可以发现100000000
= 11111111
+ 1,所以上面的式子可以拆成两个:
11111111
-00001000
---------
11110111
+00000001
---------
11111000
上述通过计算 0 - 8 得到的11111000
。
按照补码的定义,对 -8 的原码10001000
取反得到反码11110111
加 1 最终得到补码10001000
,与我们上述计算结果一致,证明补码就是我们想要的二进制数值表示方案。因此,数值在计算机中一律用补码表示和存储,在计算时可以化减为加,只做加法计算。