文章内容
软件行业非常迅速,以前流行C,C++,java,spring,现在springcloud,docker,微服务,k8s云原生等概念火热,还有各种各样的新技术在不断的涌现出来。但是计算机底层原理 这几十年一直并没有太大的变化。
一、计算机的软硬件概念
计算机系统由”软件”和”硬件”2大部分组成。
1、按应用范围分类
其中软件如果按应用范围分类,一般分为系统软件和应用软件:
- 系统软件是各类操作系统,如windows、Linux、UNIX等,还包括操作系统的补丁程序及硬件驱动程序,都是系统软件类。
- 应用软件可以细分的种类就更多了,如工具软件、游戏软件、管理软件等都属于应用软件类。
2、计算机硬件的发展历程
其中计算机硬件经过发展历程:
- 电子管时代,速度每秒几千次~几万次
- 晶体管时代,速度每秒几万次~几十万次
- 中小规模集成电路时代,速度每秒几十万次~几百万次
- 大规模、超大规模集成电路时代,速度每秒上千万次~万亿次
二、冯·诺依曼体系结构
1946年,第一台计算机ENIAC诞生,人类进入计算机时代,冯诺依曼和其他计算机科学家们 提出了计算机”存储程序”的计算机设计理念,即将计算机指令进行编码后存储在计算机的存储器中,需要的时候可以顺序地执行程序代码,从而控制计算机运行。还定义计算机基本结构为 5 个部分,分别是运算器、控制器、存储器、输入设备、输出设备,这就是冯.诺依曼计算机。
实线箭头表示 数据线,虚线箭头表示 控制线和反馈线
1、冯·诺依曼计算机特点
- 计算机由 运算器、存储器、控制器、输入设备和输出设备 五大部件组成, 侧重于硬件抽象
- 将计算机的计算和记忆分开,负责计算的部分由运算器和控制器组成,负责记忆的部分称为存储器
- 指令和数据均用 二进制数 表示
- 指令和数据以同等地位存放于存储器内,并可 按地址寻访
- 指令由操作码和地址码组成,操作码用来表示操作的性质,地址码用来表示操作数在存储器中的位置
- 指令在存储器内按顺序存放。通常,指令是顺序执行的,在特定条件下,可根据运算结果或根据设定的条件改变执行顺序
- 以运算器为中心
2、现代计算机
现代计算机系统与冯·诺依曼计算机差别不大,最大的区别冯·诺依曼计算机 是 以运算器为中心的,而现代计算机以储存器为中心:
3、现代计算机系统的组成部分
接下来,我们分别介绍一下这几个重要组成部分
1)存储器
存储器是用来存放数据和程序。存储器包含主存和辅存。
- 主存:直接与CPU交换信息,就是我们熟悉的内存。常见的有内存条
- 辅存:辅存可作为主存的后备存储器,不直接与CPU交换信息,容量比主存大,但速度比主存慢。比如机械硬盘、固态硬盘等
注意一下:能和CPU直接交换信息的只有主存,辅存是不直接与CPU交换信息
2)运算器
运算器也叫算数逻辑单元,是进行算数运算和逻辑运算的部件,在控制器的控制下,对取自内存储器的数据进行算术运算或逻辑运算,并将运算的结果送到内存储器。
3)控制器
控制器用来控制、指挥程序和数据的输人、运行以及处理运算结果。计算机在工作时,控制器首先从内存储器中按顺序取出一条指令,并对该指令进行译码分析,根据指令的功能向相关部件发出操作命令,使这些部件执行该命令所规定的任务,执行之后再取出第二条指令进行分析执行。如此反复,直到所有指令都执行完成。
4)输入设备
输入设备用来将人们熟悉的信息形式转换为机器能识别的信息形式,常见的有键盘、鼠标等
5)输出设备
输出设备可将机器运算结果转换为人们熟悉的信息形式,如打印机输出、显示器输出等。
6)中央处理器(CPU)
由于运算器和控制器在逻辑关系和电路结构上联系十分精密,特别是大型集成电路时代的到来,所以现如今往往会将运算器和控制器集成到同一个芯片上,统称 在中央处理器(CPU),其功能是从内存储器中取出指令、解释指令并执行指令。
7)寄存器
现代CPU内部 还有一个常见的组件,寄存器
寄存器是CPU内部用来存放数据的一些小型的存储区域,用来暂时存放参与运算的数据以及运算结果。寄存器由电子线路组成,存取速度非常快,与CPU的速度相当,寄存器的成本较高,因而数量较少。
在CPU中至少要有六类寄存器:
- 指令寄存器(IR)
- 程序计数器(PC)
- 地址寄存器(AR)
- 数据寄存器(DR)
- 累加寄存器(AC)
- 程序状态字寄存器(PSW)
三、总线
总线是贯穿整个系统的是一组电子管道,称作总线,它携带信息字节并负责在各个计算机部件间传递。通常总线被设计成传送定长的字节块,也就是字(word)。字中的字节数(即字长)是一个基本的系统参数,各个系统中都不尽相同。
1、机器字长长度
现在的大多数机器字长要么是4个字节(32位),要么是8个字节(64位)。
2、最小存储单位
另外计算机最小的存储单位是字节(byte),1 字节等于 8 位(1Byte=8bit),而位/比特(bit)是计算机最小的数据传输单位。1 字节等于 8 位(1Byte=8bit)这个换算规则大家需要牢记
3、内存地址
把内存相关的知识串起来:计算机将8个bit归为一组,为字节,每一个字节都对应一个内存地址。内存的地址是从0 开始编号的,然后自增排列,最后一个地址为内存总字节数 – 1。CPU只需要知道某个数据类型的地址, 就可以直接去到对应的内存位置去提取数据了。
4、总线种类
总线可分为 3 种:
- 地址总线,一般用于指定 CPU 将要操作的内存地址;
- 数据总线,一般用于读写内存的数据;
- 控制总线,一般用于发送和接收信号,比如中断、设备复位等信号,CPU 收到信号后,通过控制总线进行响应;
四、计算机为什么普遍采用二进制?
1、“存储程序”的概念
这是一个很常识性但非常重要的问题,冯.诺依曼计算机也叫存储程序 计算机,其中“存储程序”的概念是 指将指令以二进制代码的形式事先输入计算机的主存储器,然后按其在存储器中的首地址执行程序的第一条指令,以后就按该程序的规定顺序执行其他指令,直至程序执行结束。
我们更熟悉十进制的运算,0、1、2、3、4、5、6、7、8、9十个数字,逢十进一。比如中国人从小背的“九九乘法表”其实就是十进制变种。但是计算机中使用二进制,只有0和1两个数字,逢二进一。
2、采用二进制的原因
- 二进制在自然界中最容易被表现出来。自然界中二值系统非常多,电压的高低、水位的高低、门的开关、电流的有无等等都可以组成二值系统,都可以用来做计算机。
- 计算机依靠电力工作,通过电子原件的电压高低反应,很容易就表现出二进制的特性。从某种意义上说,中国古人的八卦是利用符号的二元形态来表示事物,这一点与二进制颇为相同。
五、64位和32位CPU的区别
1、CPU的位宽
64位、32位指的是CPU寄存器的数据宽度,也叫 CPU 的位宽,他们最主要区别在于CPU一次能计算多少字节数据
- 32位CPU,表明处理器 一次可以计算 4 个字节(Byte),即一次可以计算32位(bit)数据。
- 64位CPU,表明处理器 一次可以计算 8 个字节(Byte),即一次可以计算64位(bit)数据。
2、CPU的处理能力
CPU的位数越高也将会使它的寻址范围、最大内存容量、数据传输和处理速度、数值精度等指标成倍增加,也就是CPU的处理能力得到大幅提升
我们都知道,32位CPU最大支持4G内存,这是怎么算出来的? 2^32B = 4GB,2^35b = 4GB,注意B和b的区别 “CPU中32位”中的”位”并不是 内存中的”位bit”的概念,对应到内存中其实是”字节Byte”
由于32位最大内存寻址能力只能达到是4G左右,我们就算给32位的电脑装8G的内存条,也无法提高其计算能力
六、计算机性能
接下来介绍一下关于计算机性能相关的基本概念:
1、储存器的性能指标
储存器的性能指标主要和以下3个方面有关:
1)三个性能指标
a)存储容量
存储容量:存储单元个数 * 储存字长(如1M*8bit)
其中:
- MAR位数反映储存单元的个数,即最多能表示多少个不同的状态
n个2进制位能表示 2^n个状态, 2^10=1 K,2^20=1 M,2^30=1 G,2^40=1 T
- MDR位数=储存字长=每个储存单元的大小
b)单位成本
单位成本:每位价格=总成本/总容量。
c)存储速度
存储速度:数据传输率=数据的宽度/存储周期
2)三个概念
- 存取时间:又称存储器访问时间,是指从启动一次存储器操作到完成该操作所经历的时间。
- 存储周期:又称为读写周期或访问周期。它是指存储器进行一次完整的读写操作所需的全部时间,即连续两次独立地访问存储器操作(读或写操作)之间所需的最小时间间隔。
- 存储器带宽:是单位时间里存储器所存取得信息量。
2、CPU的性能指标
当我们去京东淘宝上去买,CPU的时候,商家一般会写下面的信息:
12代 酷睿 i7-12700KF 处理器 12核20线程 单核睿频至高可达5.0Ghz 25M三级缓存 台式机CPU
其中除了一下CPU的型号,5.0Ghz是表示CPU性能的一个重要的指标
- CPU主频:CPU内核的时钟频率,表示在CPU内数字脉冲信号震荡的频率,常用单位为Hz。平时我们打游戏常说的超频,超的就是这个CPU主频。
- CPU时钟周期:通常为节拍脉冲或T周期,即主频的倒数,它是CPU中基本时间单位。
执行一条指令的耗时 = CPI * CPU时钟周期, 其中CPI表示 执行一条指令所需的时钟周期数 一段程序的耗时=指令数*CPI * CPU时钟周期, 如果我们想要提升CPU性能问题,其实就是要优化这三者。
3、系统整体的性能指标
计算机系统的性能主要受是下面3个指标
- 数据通路带宽:数据总线一次所能并行传送信息的位数(各硬件部件通过数据总线传输数据)
- 吞吐量:指系统在单位时间内处理请求的数量。 它取决于信息能多快地输入内存,CPU能多快地取指令,数据能多快地从内存取出或 存入,以及所得结果能多快地从内存送给一台外部设备。这些步骤中的每一步都关系 到主存,因此,系统吞吐量主要取决于主存的存取周期。
- 响应时间:指从用户向计算机发送一个请求,到系统对该请求做出响应并获得它所需 要的结果的等待时间。 通常包括CPU时间(运行一个程序所花费的时间)与等待时间(用于磁盘访问、存储 器访问、I/O操作、操作系统开销等时间)
跑分软件,像鲁大师等,就是把多个预设好的程序(基准程序)在计算机上运行,然后根据运行需要 的时间,算出一个分数来评估计算机的性能,以便和其他计算机进行比较。
4、计算机功耗
通过上文CPU 执行时间 = 指令数*CPI * CPU时钟周期,我们知道程序的 CPU 的性能 受到 指令数、CPI 以及 CPU 主频 的影响, 指令数或者 CPI 工程师,由于影响条件复杂,没法直接干预,或者可能反向干预。主要手段是提高CPU的主频, CPU 变得更快,程序的执行时间自然就会缩短 ,主频越高越好?
答案是否定的。我们知道现在的计算机里的CPU,都是超大规模集成电路,实际上都是一个个晶体管组合而成的。通过电路的开关的"打开"和"关闭",来实现计算和储存的能力。要想计算得更快,从硬件角度来说,就是单位体积多放一些晶体管。从软件角度,手动将CPU的主频提升。但这2种手段,会增加CPU的耗电和散热,即功耗增加。 虽然可以通过降低电压来缓解功耗的问题,但是一味地提升主频,提升的性能效果日益衰弱。后面为了提升性能,不再依赖堆硬件方面,计算机采用了从单核CPU到多核CPU,将CPU执行任务流水线化,高并发多线程等等更多的手段。