世间本没有魔法,只是我们还不了解,导致让它看起来像有魔法一样。

参考资料:芯片相关-- Cpu历史--intel系列 - 杨华的文章

一、各代计算机主要软、硬件方面的变化

1946年,宾夕法尼亚大学(University of Pennsylvania)研制出的世界上第一台数字计算机,这台计算机的名字为ENIAC,即电子数值积分和计算机。它采用了18000个电子管,30吨,占地170平方,投资超过48万美元。字长10位,十进制,计算机速度每秒5000次。每次最多能储存20个字节长为10位的十进制数。因为它是最早诞生的一台计算机,所以我们称之为计算机的鼻祖。
在ENAC研究的同时,冯诺依曼与莫尔提出了全新的储存程序的通用计算机方案。 他们首先提出了计算机采用二级制代码表示数据和指令,并突出程序存储的概念,为现代计算机奠定了基础。
自1946年第一台电子计算机问世以来,以计算机硬件的逻辑元件为标志,经历了从电子管,晶体管,中小规模集成电路到超大规模集成电路等4个发展阶段。
第一代计算机:1946-1956电子管数字计算机。逻辑元件采用电子管,储存采用磁芯,程序采用机器语言和汇编语言。以科学计算为主,体积大,功耗大,价格昂贵,可靠性差,但奠定了以后计算机科学的基础。
第二代计算机:1957-1964晶体管数字计算机。逻辑单元件用晶体管,出现操作系统,用Cobal,Fortran 等高级语言。
第三代计算机:1964-1970集成电路计算机。逻辑元件采用小规模的集成电路,用半导体储存件,采用流水线,并行多道处理技术。采用高级语言,提出模块化和结构化的程序设计。计算机向多元化方向发展,体积更小,速度更快,功能强大。
第四代计算机:1971年超大规模的集成电路计算机出现,软件硬件技术日益完善,应用开始进入科学,军事,空间和大型事务处理和社会各个领域。

二、Intel微处理器的发展历程

4004

4004是美国英特尔公司(Intel)推出的第一款微处理器,也是全球第一款微处理器;1971年11月15日发布。4004处理器的尺寸为3mm×4mm,外层有16只针脚,内有2300个晶体管,采用五层设计,10um的制程工艺。4004的最高时脉有0.74MHz,能执行4位元运算,支援8位元指令集及12位元位址集。当时钟频率仅为108KHz时,可以每秒运算6万次。

v2-cafe7050c1fe3c71637ea0daf149ab1f_1440w.jpg
第一款4位处理器

8086

1978和1979年,Intel公司先后推出了8086和8088芯片,它们都是16位微处理器,内含29000个晶体管,时钟频率为4.77MHz,地址总线为20位,可使用1MB内存。内部数据总线是16位,外部数据总线8088是8位,8086是16位。1981年8088,芯片首次用于IBMPC机中,开创了全新的微机时代。

v2-5a55432f8c98c72edf9d92bb9fb20827_1440w.jpg
8086的dip40封装
v2-599f77ae030f63b45b2631b62c037e8c_1440w.jpg
8086的die shot

外形和课本上的8051芯片很像,功能性能都类似,但8051更像一颗SOC。1981年INTEL推出的MCS-51单芯片,数据是8bit,8051是其中一种,后来授权给其它芯片公司开发出各种形态的51单片机产品。

80286 

1982年,Intel推出了80286芯片,该芯片含有13.4万个晶体管,时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位,地址总线24位,可寻址16MB内存。80286有两种工作方式:实模式和保护模式。

v2-04049c7a3b1efdafb34548125522da47_1440w.jpg
80286(PLCC封装)

80286的指令流水线有3级:取指,译码和执行。比8086多了一级译码。

80386

1985年,Intel推出了80386芯片,它是80X86系列中的第一种32位微处理器,内含27.5万个晶体管,时钟频率为12.5MHz,后提高到20MHz,25MHz,33MHz。其内部和外部数据总线都是32位,地址总线也是32位,可寻址4GB内存。80386的广泛应用,将PC机从16位时代带入了32位时代。比80286更多的指令集。

v2-fe776d69e9cf1d3d11d3d330191de84d_1440w.jpg
386陶瓷封装

这种陶瓷封装很有质感,成本估计不菲,现在估计只有在军品中可以看见身影了。

80486

1989年,Intel推出了80486芯片,这种芯片实破了100万个晶体管的的界限,集成了120万个晶体管。其时钟频率从25MHz逐步提高到33MHz、50MHz。80486是将80386和数学协处理器80387以及一个8KB的高速缓存集成在一个芯片内,并且在80X86系列中首次采用了RISC技术,可以在一个时钟周期内执行一条指令。

v2-bb489d2d02a1654f3631795f50c29098_1440w.jpg
v2-b5cadbd7f54d8c2cadcc307248d3d548_1440w.jpg
v2-aceec6bc6d9deab123bcda16f7d0f827_1440w.jpg
v2-e17977d9560260e1df8e7ff128ab13b5_1440w.jpg

80486的性能比带有80387数学协处理器的80386DX提高了4倍。

1989年上市时价格为950美元,这时CISC中也加入了RISC技术,其实后来大家都在互相借鉴,都不适合简单粗暴的用cisc和risc来区分了。

Intel Pentium

Intel公司于1993年03月22 日,发布了P5架构的80586,其正式名称为PENTIUM。PENTIUM含有310万个晶体管,L1为16KB(8+8)时钟频率最初为60MHZ和66MHZ,Socket 4 ( 273 針腳 PGA 封裝),电压5V,采用0.8um BiCMOS工艺制造。

v2-371ac48ca855c4bd742107bea2a7338e_1440w.jpg
Intel Pentium (P5, 80501)两种不同封装
v2-c963696ecb221fc7ca1b9ef2bfab8118_1440w.jpg
Intel Pentium (P5) Die shot

奔腾后续还有出几代强化版本。1994 年 10 月 10 日P54C Microarchitecture,75 MHz ~ 120 MHz,电压降低为3.3V,Socket 5 ( 273 針腳 PGA 封裝) / Socket 7 ( 321 針腳 PGA 封裝),320万

v2-7a5514f1c8b26119c86232cda3f2bb2d_1440w.jpg
Intel Pentium (P54C, 80502)

1995 年 06 月 10 日P54CS Microarchitecture,133 MHz ~ 200 MHz,Socket 7 ( 321 針腳 PGA 封裝),330万,提升到0.35微米

v2-0ab6b7ea4d9a02a6e557f1c56e7c03c0_1440w.jpg
Intel Pentium (P54CS, 80502)

1997 年 01 月 08 日P55C Microarchitecture,120 MHz ~ 233 MHz,L1 快取大小:32 KB (資料與指令快取各 16 KB) 4-way,Socket 7 ( 321 針腳 PGA 封裝),450,采用0.35和0.25um工艺,首次映入MMX指令集

v2-c7d777b9c6fb4588d4da770335a09e19_1440w.jpg
v2-edb8df901da8ebc6c4eeaf2f2eaa7ffc_1440w.jpg
Pentium MMX
v2-dde7c176a62514adc6d154fef4db540f_1440w.jpg
四種 Intel Pentium OverDrive左而右依序為 Socket 4、Socket 3、Socket 5、Socket 5 或 Socket 7 (MMX) 四種

1997 年 08 月筆電專屬版本:Tillamook, 166 MHz ~ 300 MHz, 32 KB (資料與指令Cache各 16 KB) 4-way, 插槽:MMC-1 (280 針可攜式電腦專用處理器卡匣),2.5v,450万,采用0.25um工艺。

v2-e8b53d6faca5dcfcf9381c22071aa37e_1440w.jpg
Tillamook 的 MMC-1 模組的外型

Intel Pentium Pro

1995年11月1日,Intel推出了Pentium Pro处理器。Pentium Pro的工作频率有150/166/180和200MHz四种,都具有16KB的一级缓存和256KB的二级缓存。它是基于Pentium 完全相同的指令集兼容性,达到了440 MIPs 的处理能力和5.5 M个晶体管。这几乎相当于比4004处理器的晶体管提升了2400倍。值得一提的是Pentium Pro采用了“PPGA” 封装技术。即一个256KB的二级缓存芯片与Pentium Pro芯片封装在一起 ,两个芯片之间用高频宽的内部总线互连,处理器与高速缓存的连接线路也被安置在该封装中,这样就使高速缓存能更容易地运行在更高的频率上。TDP:31.7 W ~ 44 W,16 KB (資料與指令快取各 8 KB) 4-way,L2 快取大小:256 KB / 512 KB / 1 MB,Socket 8 ( 387 針腳 PGA 封裝),550万晶体管。

例如Pentium Pro 200MHz CPU的L2 Cache就是运行在200MHz,也就是工作在与处理器相同的频率上,这在当时可以算得上是CPU技术的一个创新。Pentium Pro的推出,为以后Intel推出PⅡ奠定了基础。

v2-0b5f342a966d91c327d589ded70e3ba0_1440w.jpg
v2-dbeae55f2e3ec7efb332a1c1633de11b_1440w.jpg
Intel Pentium Pro L2 Cache区域和CPU逻辑区域

PENTIUM引起的轰动尚未结束,Intel公司又推出了新一代微处理器——P6。P6含有550万个晶体管,时钟频率为133MHZ,处理速度几乎是100MHZ的PENTIUM的2倍。

P6的一级(片内)缓存为8KB指令和8KB数据。值得注意的是在P6的一个封装中除P6芯片外还包括有一个256KB的二级缓存芯片,两个芯片之间用高频宽的内部通讯总线互连。P6最引人注目的是具有一项称为“动态执行”的创新技术,这是继PENTIUM在超标量体系结构上实现实破之后的又一次飞跃。

1997年,在奔腾(P54C)和P6的基础上又有了新的发展,一块奔腾(P54C),加上57条多媒体指令,就得到了多能奔腾(P55C),相对P54C,P55C在以下几方面做了改进:(1)支持称为MMX多媒体扩展的新指令集,有57条新指令,用于高效地处理图形、视频、音频数据;(2)内部Cache从16KB增加到32KB。(3)优化了CPU的执行核心。

v2-3a35f95d1fb657491e1542a849aaf7d7_1440w.jpg
大小对比从左到右Pentium Pro (Socket 8)Xeon E7420 (PGA604)Xeon E5-2690 (LGA2011)Core i7-2820QM (PGA988)

金灿灿的年代到奔腾pro就结束了,后续的cpu封装感觉少了一份豪华感,据说这种封装里有价值上百的黄金。

Intel Pentium II

为了弥补P6的某些缺陷,Intel在P6基础上开发了两个变体:Klamath(即PentiumⅡ)和Deschutes来补充完善它。

PentiumⅡ使用MMX和AGP技术,其系统总线速度达到66MHz,一级Cache含16KB指令Cache和16KB数据Cache,二级Cache为512KB,采用了0.35微米的工艺,CPU工作电压为2.8V。203平方毫米.

Deschueses(PII350以上的CPU)是PentiumⅡ的一个0.25微米版本,具有更低的电源电压,外频为100MHz。

PentiumII改变了以往的PGA陶瓷封装,而把处理器芯片、L2高速缓存以及TAGPAM(用来管理L2高速缓存)集成在一块电路板上,然后封装在新的SEC(SingleEdgeContact,单边接触盒)内。由于采用了新的SEC封装,PentiumII必须插在242线的SLOT1插槽内,也就是说,PentiumII不兼容Socket7结构。

v2-c224252d0a3013206ea1b446a13610cc_1440w.jpg
v2-b950d24a71cf2f6d542b95b95e87558a_1440w.jpg
Intel Pentium II(32KB L1)和外置512KB L2高速缓
v2-6e1af083cdbfebf31cb5f679db7d1eff_1440w.jpg
v2-495ed6e02e8db01131b361d85c767695_1440w.jpg
Intel® Pentium® II(Slot 1)
v2-e30cb8be788a60cc8497ca57c9ab75a8_1440w.jpg
v2-ac351121cab164dd221e6a30dcceb251_1440w.jpg
v2-edc9e7216571b21a09c8585c9fc10b2f_1440w.jpg
v2-7cf2fda28a3e5034fb5ff0fb553aae46_1440w.jpg
移动版本的Pentium II处理器(MMC封装)
v2-0537d53fbc689b17e71b3c41ba6a20ed_1440w.jpg
Die shot(https://encyclopedia2.thefreedictionary.com/Intel+Pentium+II)
v2-4c74cb68ff24846b9ed4a6b95b4d96bf_1440w.jpg
v2-900fce6243cc0092b09ff4f9fc257f69_1440w.jpg
1998年去掉L2缓存的Celeron
处理器型号:
核心代号:接口类型:指令集:封装形式:频率:系统前端总线速度:晶体管数目:L1 Cache:L2 Cache:制程工艺:在产:生产日期:
Intel® Pentium® II Xeon™
DrakeSlot 2IA32 (x86), MMXSECC400MHz-450MHz100MHz~7.5 Million32KB512KB-2MB (Full Speed Off Die)0.25微米No1998
v2-ea79237b10e068f71c7520bce6fcd30d_1440w.jpg
v2-5371e22db05f6ffb5f31dda887926946_1440w.jpg
Intel® Pentium® II Xeon(正面和背面) 512KB-2MB (Full Speed Off Die)L2
v2-24b37a2298bd3cbd398cc81f8df1904c_1440w.jpg
Pentium II OverDrive(左侧处理器),带有 512KB 的 L2 缓存(右侧)
v2-6f5b5c7a3eabfb2cdbbba291c698ffd2_1440w.jpg
Intel Pentium II OverDrive PODP66X333

当时的减配版本,L2缓存减半的超频神器赛扬300A,当时由于cpu功耗大约20W,不像现在动辄一百多瓦,稍微改善一下散热就有超频环境,当时这颗CPU也成为经典,特别是370封装的,主板芯片组跨度大,实惠的选择很多。

Intel Pentium III

1999年2月26日推出奔腾III 处理器 800MHz、256K高速缓存、133MHz FSB ,TPD20.8 瓦,180纳米,与Pentium II相同,也有低阶的Celeron版本和高阶的Xeon版本。

最初版本Katmai与Pentium Ⅱ均使用0.25μm制程,唯一的差别是加入了SSE,改进一级缓存控制器,效能有所提升。

第二个版本Coppermine(铜矿)开始普遍采用了新的Socket 370(FC-PGA)接口,由于使用了0.18μm制程,INTEL能够在CPU芯片内集成了低延迟性全速256KB第二级缓存。

Coppermine-T:FC-PGA2封装的Coppermine CPU针脚与Coppermine不同,无法与FC-PGA兼容。

最后一个版本Tualatin只是实际上英特尔的0.13μm制程试验。在2001年至2002年早期推出,主频分别为1.0、1.13、1.2、1.26、1.33和1.4 GHz,同样采用了256K二级缓存。但由于使用FC-PGA2封装而无法与之前的主板兼容。针对桌面市场的Tualatin产量很少,大部分Tualatin特别是512KB二级缓存的衍生版本(称为 Pentium Ⅲ-S)用于服务器市场。

v2-b489b18d82a9c374e71abce389b0238e_1440w.jpg
Katmai核心Pentium III(slot封装)
v2-056a4b1c5e00408322a66833f61bfe4c_1440w.jpg
Socket 370封装的Pentium III(Coppermine核心)

Intel Pentium 4

英特尔公司于2000年11月发布的第7代x86微处理器。是继1995年出品的Pentium Pro之后的第一款重新设计过的处理器,这一新的架构称做NetBurst。首款产品代码为:Willamette,拥有1.4GHz左右的内核时钟,并使用Socket 423脚位架构,首款处理器于2000年11月发布。开启频率大战,性能却没有大幅度提升。到4GHz时,功耗问题止步,2005年年中放弃了Pentium 4,并转向升温更少的Pentium M。

v2-39abe9bc8194931a08bb6ded9ab178f4_1440w.jpg
v2-b4840a95612f3a4378654feba3f2d2ff_1440w.jpg
v2-fa5a111405af2dd786c4e8fdb3bfd64c_1440w.jpg
Intel Pentium 4 不同规格

当前Intel 在售cpu

v2-5bad1b2af66acbc1d2fe5451f302bc52_1440w.jpg
Intel处理器清单
v2-2f5b77c9b0e21bed63ae7088c8b0b843_1440w.jpg
Intel 处理器品牌和简要说明

酷睿(Core)是英特尔公司推出的面向中高端消费者、工作站和发烧友的一系列CPU。酷睿替代了曾经是中高端的奔腾(PenTium),将奔腾移至入门级,并将赛扬(Celeron)处理器推向低端。当前常见的I3I5I5就是这个系列,I7还出过至尊版Intel Core i7 Extreme EdiTIon,还有I9处理器。

奔腾(PenTium)是英特尔公司的一个注册商标,作为其x86处理器品牌之一,于1993年推出。之前奔腾是英特尔的唯一的x86处理器产品线,后来随着其产品线的扩展衍生出低端的赛扬(Celeron)系列、供服务器以及工作站使用的至强(Xeon)系列。2006年英特尔推出酷睿(Core)系列处理器产品线,取代原奔腾处理器系列的市场定位。如今奔腾定位中端系列,介于赛扬和酷睿之间。

赛扬(Celeron)是英特尔公司中央处理器的一个注册商标。赛扬处理器是Intel旗下经济型产品,于1998年推出。

至强(Xeon)是Intel的一个中央处理器品牌,主要供服务器及工作站使用,亦有超级计算机采用此处理器。Intel XeonE3-1230曾因高性价比而受到电脑DIYer的热捧,有“i5的价格,i7的性能”的美誉。

安腾(Itanium),是英特尔安腾架构(IA-64)的64位处理器。第一款安腾于2001年推出,该处理器的市场定位是在于企业服务器与高性能运算系统。

凌动(Atom)开发代号Silverthorne,是Intel的一个超低电压处理器系列。该处理器的市场定位是在于智能手机、平板电脑和低成本PC,上网本等。

Quark是英特尔的32位x86 SoC和μCs系列,专为小尺寸和低功耗设备而设计,并面向包括可穿戴设备在内的新市场。该处理器虽然比 Atom处理器更慢,但体积和功耗更小。

Adler Lake

在2021的Hot Chips大会上,英特尔详细解读了高性能处理器——Alder Lake的架构。Alder Lake是英特尔的桌面级CPU架构,英特尔放弃了同构CPU核的设计,转向了大小核。P系列大核专注单线程性能,其中有两个新的东西:一个是Matrix Engine,作为AI协处理器;另外一个是PM Controller,负责细粒度的功耗管理。

E系列小核专注多线程吞吐(Throughput),所以小核的Front-End更深,Back-End更宽。另外小核和大核的ISA是兼容的,且四核共享MLC。

除此之外,Alder Lake为了大小核的调度,引入了Thread Director。工作原理是先根据应用部署在大核或小核上的IPC差异,对应用进行分类,然后OS根据应用类型进行调度。

v2-b0e852b444d9e986b1bcd30a4e172855_1440w.jpg
v2-51fd8cb9bded68585ba0fa66e4c033aa_1440w.jpg

CPU-Z软件所识别的参数,分别是关闭AVX-512与开启AVX-512

v2-53083bc8949badc40e84195333ba03f2_1440w.jpg
v2-28f75ec877fcaba1d7b4ebca8c912488_1440w.jpg

ITD,全称硬件线程调度器(Interl Thread Director),是一个全新的硬件资源调度方式。Alder Lake架构中将包含两种不一样的处理器核心:P-Core和E-Core。就像ARM架构SoC中的大小核一样,P-Core和E-Core在性能与能耗上也有自己的差异。因两种核心在结构、能耗与擅长的运算种类上有所差异,如何调度两种核心,将用户的操作分配到适合的核心就成了Alder Lake要面对的首要难题。

ITD的出现为的就是解决硬件资源分配的问题。在ITD出现之前,Windows采用的是一个比较简单的硬件资源分配方式:Windows 10认为哪个软件在前台,哪个软件拥有最高的优先级,就能分配到最强的核心。同时,过去处理器与操作系统之间的信息汇报也较为单一,操作系统并不能详细了解各个核心的工作状况。

v2-c0619d74c3f7c4b21bab8522751e1b80_1440w.jpg

根据英特尔公布的数据,Alder Lake最高可以支持16个混合内核、24个线程、以及30MB的L3缓存,同时支持DDR5-4800、16通道PCIe 5.0、Thunderbolt 4、Wi-Fi 6E等等这些最新的接口、存储和数据传输技术。

看到这里,应该对通用cpu的主力厂家之一intel有了一个初步的印象。Cpu的大厦也是从简单的4004一步一步发展到如今的程度,每一步的变化都是有历史原因的,是有迹可循的。


A Student on the way to full stack of Web3.