计算机的基本组成是什么样子的?

作者:小牛呼噜噜 | https://xiaoniuhululu.com
计算机内功、JAVA底层、面试相关资料等更多精彩文章在公众号「小牛呼噜噜 」

前言

软件行业非常迅速,以前流行C,C++java,spring,现在springcloud,docker,微服务,k8s云原生等概念火热,还有各种各样的新技术在不断的涌现出来。但是计算机底层原理 这几十年一直并没有太大的变化,与其不断去尝试新技术,不如耐住性子,深入学习底层的知识,好好修炼“内功”。

计算机的软硬件概念

计算机系统由”软件”和”硬件”2大部分组成

其中软件如果按应用范围分类,一般分为系统软件和应用软件

  1. 系统软件是各类操作系统,如windows、Linux、UNIX等,还包括操作系统的补丁程序及硬件驱动程序,都是系统软件类。
  2. 应用软件可以细分的种类就更多了,如工具软件、游戏软件、管理软件等都属于应用软件类。

其中计算机硬件经过发展历程:

  1. 电子管时代,速度每秒几千次~几万次
  2. 晶体管时代,速度每秒几万次~几十万次
  3. 中小规模集成电路时代,速度每秒几十万次~几百万次
  4. 大规模、超大规模集成电路时代,速度每秒上千万次~万亿次

冯·诺依曼体系结构

1946年,第一台计算机ENIAC诞生,人类进入计算机时代,冯诺依曼和其他计算机科学家们 提出了计算机"存储程序"的计算机设计理念,即将计算机指令进行编码后存储在计算机的存储器中,需要的时候可以顺序地执行程序代码,从而控制计算机运行。还定义计算机基本结构为 5 个部分,分别是运算器、控制器、存储器、输入设备、输出设备,这就是冯.诺依曼计算机

实线箭头表示 数据线,虚线箭头表示 控制线和反馈线

冯·诺依曼计算机特点:

  1. 计算机由 运算器、存储器、控制器、输入设备和输出设备 五大部件组成, 侧重于硬件抽象
  2. 将计算机的计算和记忆分开,负责计算的部分由运算器和控制器组成,负责记忆的部分称为存储器
  3. 指令和数据均用 二进制数 表示
  4. 指令和数据以同等地位存放于存储器内,并可 按地址寻访
  5. 指令由操作码和地址码组成,操作码用来表示操作的性质,地址码用来表示操作数在存储器中的位置
  6. 指令在存储器内按顺序存放。通常,指令是顺序执行的,在特定条件下,可根据运算结果

或根据设定的条件改变执行顺序

  1. 以运算器为中心

现代计算机系统与冯·诺依曼计算机差别不大,最大的区别冯·诺依曼计算机 是 以运算器为中心的,而现代计算机 以储存器为中心:

接下来,我们分别介绍一下这几个重要组成部分

  1. 存储器

存储器是用来存放数据和程序。存储器 包含主存和辅存

  • 主存:直接与CPU交换信息,就是我们熟悉的内存
  • 辅存:辅存可作为主存的后备存储器,不直接与CPU交换信息,容量比主存大,但速度比主存慢。比如机械硬盘、固态硬盘等
  1. 运算器

运算器也叫算数逻辑单元,是进行算数运算和逻辑运算的部件,在控制器的控制下,对取自内存储器的数据进行算术运算或逻辑运算,并将运算的结果送到内存储器。

  1. 控制器

控制器用来控制、指挥程序和数据的输人、运行以及处理运算结果。计算机在工作时,控制器首先从内存储器中按顺序取出一条指令,并对该指令进行译码分析,根据指令的功能向相关部件发出操作命令,使这些部件执行该命令所规定的任务,执行之后再取出第二条指令进行分析执行。如此反复,直到所有指令都执行完成。

  1. 输入设备

输入设备用来将人们熟悉的信息形式转换为机器能识别的信息形式,常见的有键盘、鼠标等

  1. 输出设备

输出设备可将机器运算结果转换为人们熟悉的信息形式,如打印机输出、显示器输出等。

  1. 中央处理器(CPU)

由于运算器和控制器在逻辑关系和电路结构上联系十分精密,特别是大型集成电路时代的到来,所以往往会将运算器和控制器集成到同一个芯片上,统称 在中央处理器(CPU),其功能是从内存储器中取出指令、解释指令并执行指令。

  1. CPU中 还有一个常见的组件,寄存器

寄存器是CPU内部用来存放数据的一些小型的存储区域,用来暂时存放参与运算的数据以及运算结果。寄存器由电子线路组成,存取速度非常快,与CPU的速度相当,寄存器的成本较高,因而数量较少。CPU内部的寄存器类型有指令寄存器、程序计数器、数据寄存器、地址寄存器以及状态寄存器等。

总线

总线是贯穿整个系统的是一组电子管道,称作总线,它携带信息字节并负责在各个计算机部件间传递。通常总线被设计成传送定长的字节块,也就是字(word)。字中的字节数(即字长)是一个基本的系统参数,各个系统中都不尽相同。现在的大多数机器字长要么是4个字节(32位),要么是8个字节(64位)。本文我们不对字长做任何固定的假设

另外计算机最小的存储单位字节(_byte_),1 字节等于 8 位(1Byte=8bit),而位/比特(bit)计算机最小的数据传输单位1 字节等于 8 位(1Byte=8bit)这个换算规则大家需要牢记

我们顺便把内存相关的知识串起来:计算机将8个bit归为一组,为字节,每一个字节都对应一个内存地址。内存的地址是从 0 开始编号的,然后自增排列,最后一个地址为内存总字节数 - 1。CPU只需要知道某个数据类型的地址, 就可以直接去到对应的内存位置去提取数据了。

总线可分为 3 种:

  • _地址总线_,一般用于指定 CPU 将要操作的内存地址;
  • _数据总线_,一般用于读写内存的数据;
  • _控制总线_,一般用于发送和接收信号,比如中断、设备复位等信号,CPU 收到信号后,通过控制总线进行响应;

计算机为什么普遍采用二进制?

这是一个很常识性但非常重要的问题,冯.诺依曼计算机也叫存储程序 计算机,其中“存储程序”的概念是 指将指令以二进制代码的形式事先输入计算机的主存储器,然后按其在存储器中的首地址执行程序的第一条指令,以后就按该程序的规定顺序执行其他指令,直至程序执行结束。

我们更熟悉十进制的运算,0、1、2、3、4、5、6、7、8、9十个数字,逢十进一。比如中国人从小背的“九九乘法表”其实就是十进制变种。但是计算机中使用二进制,只有0和1两个数字,逢二进一。

采用二进制的原因:

  1. 二进制在自然界中最容易被表现出来。自然界中二值系统非常多,电压的高低、水位的高低、门的开关、电流的有无等等都可以组成二值系统,都可以用来做计算机。
  2. 计算机依靠电力工作,通过电子原件的电压高低反应,很容易就表现出二进制的特性。从某种意义上说,中国古人的八卦是利用符号的二元形态来表示事物,这一点与二进制颇为相同。

64位和32位CPU的区别

64位、32位指的是CPU寄存器数据宽度,也叫 CPU 的位宽,他们最主要区别在于CPU一次能计算多少字节数据

  • 32位CPU,表明处理器 一次可以计算 4 个字节(Byte),即一次可以计算32位(bit)数据。
  • 64位CPU,表明处理器 一次可以计算 8 个字节(Byte),即一次可以计算64位(bit)数据。

CPU的位数越高也将会使它的寻址范围、最大内存容量、数据传输和处理速度、数值精度等指标成倍增加,也就是CPU的处理能力得到大幅提升

我们都知道,32位CPU最大支持4G内存,这是怎么算出来的? **2^32B = 4GB,2^35b = 4GB,**注意B和b的区别
“CPU中32位”中的”位”并不是 内存中的”位bit”的概念,对应到内存中其实是”字节Byte”
由于32位最大内存寻址能力只能达到是4G左右,我们就算给32位的电脑装8G的内存条,也无法提高其计算能力

计算机性能

接下来介绍一下关于计算机性能相关的基本概念:

储存器的性能指标

储存器的性能指标主要和以下3个方面有关:

  1. 存储容量:存储单元个数 * 储存字长(如1M*8bit)

其中:

  • MAR位数反映储存单元的个数,即最多能表示多少个不同的状态

    n个2进制位能表示 2^n个状态,
    2^10=1 K,2^20=1 M,2^30=1 G,2^40=1 T

  • MDR位数=储存字长=每个储存单元的大小

  1. 单位成本:每位价格=总成本/总容量。
  2. 存储速度:数据传输率=数据的宽度/存储周期

另外还有3个概念,再了解一下:

  • 存取时间 又称存储器访问时间,是指从启动一次存储器操作到完成该操作所经历的时间。
  • 存储周期 又称为读写周期或访问周期。它是指存储器进行一次完整的读写操作所需的全部时间,即连续两次独立地访问存储器操作(读或写操作)之间所需的最小时间间隔。
  • 存储器带宽 是单位时间里存储器所存取得信息量。

CPU的性能指标

当我们去京东淘宝上去买,CPU的时候,商家一般会写下面的信息:

12代 酷睿 i7-12700KF 处理器 12核20线程 单核睿频至高可达5.0Ghz 25M三级缓存 台式机CPU

其中除了一下CPU的型号,5.0Ghz是表示CPU性能的一个重要的指标

CPU主频:CPU内核的时钟频率,表示在CPU内数字脉冲信号震荡的频率,常用单位为Hz。平时我们打游戏常说的超频,超的就是这个CPU主频。
CPU时钟周期:通常为节拍脉冲或T周期,即主频的倒数,它是CPU中基本时间单位。
执行一条指令的耗时 = CPI * CPU时钟周期, 其中CPI表示 执行一条指令所需的时钟周期数
一段程序的耗时=指令数*CPI * CPU时钟周期, 如果我们想要提升CPU性能问题,其实就是要优化这三者。

系统整体的性能指标

计算机系统的性能主要受是下面3个指标

  1. 数据通路带宽

数据总线一次所能并行传送信息的位数(各硬件部件通过数据总线传输数据)

  1. 吞吐量
    指系统在单位时间内处理请求的数量。 它取决于信息能多快地输入内存,CPU能多快地取指令,数据能多快地从内存取出或 存入,以及所得结果能多快地从内存送给一台外部设备。这些步骤中的每一步都关系 到主存,因此,系统吞吐量主要取决于主存的存取周期。

  2. 响应时间
    指从用户向计算机发送一个请求,到系统对该请求做出响应并获得它所需 要的结果的等待时间。 通常包括CPU时间(运行一个程序所花费的时间)与等待时间(用于磁盘访问、存储 器访问、I/O操作、操作系统开销等时间)

跑分软件,像鲁大师等,就是把多个预设好的程序(基准程序)在计算机上运行,然后根据运行需要 的时间,算出一个分数来评估计算机的性能,以便和其他计算机进行比较。

计算机功耗

通过上文CPU 执行时间 = 指令数*CPI * CPU时钟周期,我们知道程序的 CPU 的性能 受到 指令数、CPI 以及 CPU 主频 的影响, 指令数或者 CPI 工程师,由于影响条件复杂,没法直接干预,或者可能反向干预。主要手段是提高CPU的主频, CPU 变得更快,程序的执行时间自然就会缩短 ,主频越高越好?答案是否定的

由本文一开始,我们知道现在的计算机里的CPU,都是超大规模集成电路,实际上都是一个个晶体管组合而成的。通过电路的开关的”打开”和”关闭”,来实现计算和储存的能力。要想计算得更快,从硬件角度来说,就是单位体积多放一些晶体管。从软件角度,手动将CPU的主频提升。但这2种手段,会增加CPU的耗电和散热,即功耗增加。
虽然可以通过降低电压来缓解功耗的问题,但是一味地提升主频,提升的性能效果日益衰弱。后面为了提升性能,不再依赖堆硬件方面,计算机采用了从单核CPU到多核CPU,将CPU执行任务流水线化,高并发多线程等等更多的手段


参考资料:

深入理解计算机系统

计算机组成原理

计算机组成原理(第2版)-唐朔飞

深入浅出计算机组成原理

https://blog.csdn.net/ZCMUCZX/article/details/80026508

https://www.zhihu.com/question/309983509

https://cpu.zol.com.cn/445/4453295.html


本篇文章到这里就结束啦,很感谢你能看到最后,如果觉得文章对你有帮助,别忘记关注我!更多精彩的文章