※ 本文轉寄自 ptt.cc, 文章原始頁面
Re: [情報] Core i7之父回歸!研發全新高性能CPU架構
※ 引述《KotoriCute (Lovelive!)》之銘言:
: Intel酷睿i7之父回歸!研發全新高性能CPU架構
: Glenn Hinton曾經領導研發了Nehalem架構(玩家戲稱“你喝了嗎”),2008年誕生,當時與Conroe(“扣肉”)齊名,是Intel在經歷了奔騰4的挫折之後,重回王者地位的力作。
https://web.stanford.edu/class/ee380/Abstracts/100217-slides.pdf
Nehalem,2003年就開始設計,但構想要更早,當然大部分真正工作在05/06/07年。
當初必須要做非常重要的決定,2 Cores+VSSE+SMT vs 4 Cores。
Intel 選擇2 Cores+VSSE+SMT。 那就是Nehalem
AMD 選擇 修改版的4 Cores。 那就是Bulldozer
https://i.imgur.com/HXZSBti.png
其實Bulldozer並不差。但Bulldozer有個致命的缺陷,兩個Cores分享一個 4-wide decoder
: 有趣的是,Jim Keller這位赫赫有名的CPU架構大神,被很多人視為AMD Zen架構之父,在Intel短暫停留2年後已經離開,但至今不知道他在Intel做了哪些工作。
JK應該有很多設計。但目前我們可以看到的是他給Tremont(Atom)2x3wide decoder但沒有uop快取。那是很特別的設計,當初一堆人傻眼不明白
之前realworldtech在討論為什麼M1這麼快。
https://www.realworldtech.com/forum/?threadid=198791&curpostid=198791
主要就是統一的超大L2,還有超快的DDR4。就像Zen3 統一L3就飛快起來。
後來有討論出還有M1超寬的8-wide decoder也有幫助。
由冷門Kernel的Linus Torvalds來解釋
https://www.realworldtech.com/forum/?threadid=198791&curpostid=199302
因為實際世界的IPC其實是很低的0.5~2之間。pipeline restart其實蠻常見的,所以fast fetch/decode其實非常重要。
這是Bulldozer失敗的一個重要原因,也是Pentium IV(還加上trace cache)無法達到目標的原因。
CPU設計是一大堆的取捨,看看Nehalem的簡報。
big.LITTLE可以更好分配不同的取捨。AMD沒有big.LITTLE讓我很擔心。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.97.207 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1611294449.A.332.html
59 則留言
oopFoo 作者的近期文章
Re: [情報] 英特爾認錯…擴大釋單台積 操刀範圍擴及
※ 引述《AquaChen1012 (阿扁)》之銘言: : 英特爾執行長基辛格在法人會議中表示,英特爾晶片代工業務受到決策錯誤的拖累,包括 : 一年前反對使用荷蘭ASML的EUV設備。基辛格說,部分由於這些失誤,英特爾已將晶圓總 : 數的約
Re: [閒聊] 現在橫空出世的NPU
NPU還是很有用的,以後應用會越來越多。 我舉個遊戲應用的例子。 現在遊戲對話都是固定死的。但用現代ai可以活潑很多。我大概解釋一下技術流程。 玩家用語音跟遊戲角色對話。 用Whisper轉換語音到文字。 用bert/gpt來分析文字的情緒
Re: [閒聊] 現在橫空出世的NPU
※ 引述《wahaha99 (我討厭人類)》之銘言: : 以這個評測為例, 讓我有點霧裡看花, 不是很能明白: : Intel Ultra 7 155H : CPU分數 67 : GPU分數 413 : NPU分數 282 : 嗯....這
推
推
推
→
→
→
→
→
推
→
推
推
→
推
→
→
→
→
→
推
推
→
→
→
→
推
→
→
→
→
→
→
→
推
推
推
→
推
推
推
推
→
推
→
→
推
→
→
→
→
→
推
→
→
→
推
→
→
→