※ 本文轉寄自 ptt.cc, 文章原始頁面
標題

[情報] AMD承認EPYC Rome伺服器晶片有個奇妙Bug

時間
最新2023-06-06 10:02:00
留言98則留言,51人參與討論
推噓41 ( 41057 )
看了一下好像沒人貼,雖然我只是用5600的小咖,這種高貴的u跟我沾不上邊 但看在這bug還蠻特別的就貼上來了 有高手可以說明一下這到底什麼Bug嗎? https://www.techbang.com/posts/106924-amd-admitted-that-the-epyc-rome-server-chip-will-crash-afterhttps://bit.ly/3IW4dB2 AMD 承認 EPYC Rome 伺服器晶片有個奇妙Bug:運行 1044 天會當機、暫無計畫修復 AMD 在近日發佈的 EPYC 7002 「Rome」伺服器晶片指南中,承認由於時鐘倒計時器存有 個BUG,導致第二代 EPYC 晶片正常運行 1044 天後出現核心卡死情況。 使用這款 EPYC 晶片的伺服器,需要每隔 2.93 年時間重新啟動一次,但AMD 官方表示不 會修復上述 BUG。 AMD 在指南中表示,導致這個問題的原因是核心無法脫離 CC6 省電模式(Core C6 State ),進入該模式之後,會降低電壓和時脈頻率。AMD 澄清說,誤差的時間可能取決於擴頻 調製和 REFCLK 頻率參考。 AMD 承認 EPYC Rome 伺服器晶片有個奇妙Bug:運行 1044 天會當機、暫無計畫修復 Reddit 使用者 acid_migrain 經過詳細的演算,認為實際導致卡死的時間並非 1044 天 ,而是 1042 天 12 個小時。 AMD 於 2018 年推出 EPYC “Rome”系列伺服器晶片,部分客戶已經向 AMD 反應遇到了 這個問題。 AMD 表示沒有計畫修復該漏洞,外媒 technewsspace 判斷,不修復的理由原因之一是修 復成本太高,不然就是受影響用戶規模不大。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.46.215 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1685969842.A.5F6.html

98 則留言

※ 編輯: filiaslayers (220.133.46.215 臺灣), 06/05/2023 20:57:52

dos01, 1F
所以到底為什麼是144天?182.155.78.98

dos01, 2F
*1044182.155.78.98

oppoR20, 3F
[情報] AMD承認EPYC Rome伺服器晶片有個奇妙Bug

luvstarrysky, 4F
唉 賺最多的市場 結果客戶遇到bug218.172.87.54

luvstarrysky, 5F
還直接說不修理 有夠誇張218.172.87.54

oppoR20, 6F
因為修復成本太高114.137.75.2

oppoR20, 7F
而且人家不修財報也是繼續噴114.137.75.2

luvstarrysky, 8F
不過這個問題 重開就好了吧218.172.87.54

tacoclement, 9F
幾乎所有公司都會定期重開,大多是每1.161.180.113

tacoclement, 10F
個月至一季1.161.180.113

luvstarrysky, 11F
對阿 就算是伺服器電腦也不可能完218.172.87.54

luvstarrysky, 12F
全不維護吧218.172.87.54

oppoR20, 13F
然後a黑:有夠誇張der AMD趕快倒一倒啦114.137.75.2

eric13141230, 14F
特級A黑又來見獵心喜了218.172.8.155

fujisawa, 15F
真正會受影響的客戶很少吧 就算真的有114.43.118.172

fujisawa, 16F
用專案的方式解決應該都比較省114.43.118.172

abc21086999, 17F
那就在那天安排個系統維護就好了ㄅ220.136.186.78

toodoo, 18F
正常啊, 像Windows 95連續開機49.7天也會114.24.179.99

toodoo, 19F
因為計時器溢位而BSOD而要重開機 XD114.24.179.99

kimula01, 20F
怕啥 年度高裝檢就會重開機了啦1.200.246.77

BDrip, 21F
GPS已經溢位歸零兩次了122.117.184.144

tacoclement, 22F
不過想想也很有趣,因為內容寫到是部1.161.180.113

tacoclement, 23F
分客戶反應問題的,表示這些客戶仍屬1.161.180.113

tacoclement, 24F
於超長時間不關機XD1.161.180.113

MK47, 25F
那你加一個沒1042天重啟的task吧 不過能發223.141.171.183

MK47, 26F
現這bug的機房很猛耶 三年多都沒有重開XD223.141.171.183

lazioliz, 27F
1.200.141.53

Amulet1, 28F
你倒是關機阿lol122.116.74.69

comipa, 29F
3年多連fw update都沒有...蠻屌的XD220.133.98.140

ChangWufei, 30F
2年10個月又10天不重開就會遇到 好喔114.27.207.236

zxzx8059, 31F
公司每季都會斷電檢查高壓設備,根1.161.69.220

zxzx8059, 32F
本沒機會開三1.161.69.220

zxzx8059, 33F
年XDD1.161.69.220

lc85301, 34F
A黑集合,集合了36.231.90.248

stepnight, 35F
三年早該碰到歲修了吧49.217.197.40

giancarlo82, 36F
3年不重開 這公司的工程師心臟真大106.107.240.161

basacola, 37F
重開機不就好了 公司買來都沒有有伺服118.165.47.89

basacola, 38F
器維護時間可以搞嗎118.165.47.89

mrme945, 39F
真的有公司可以這麼久不重開耶好猛111.71.212.31

demon159000, 89F
阿就放出個維修時間 給他重開機 遊戲42.76.101.1

demon159000, 90F
不也是週期性維修時間42.76.101.1

yys310, 91F
都不用維修的嗎?140.114.235.115

b325019, 92F
你VM沒重開不代表host沒重開啊w1.161.30.11

mainsa, 93F
可以這麼久不重開我反而比較佩服欸101.12.93.199

chenchunjui, 94F
沒防斷電的話 挺厲害的 我們沒這問題1.163.119.144

TFnight, 95F
都不update的嗎…114.42.100.39

jeta890119, 96F
欸.. 我們機房真的有主機連開超過三年49.216.24.166

jeta890119, 97F
不關的49.216.24.166

jbuilder1022, 98F
除非有ha不然server重開都是風險111.71.15.5

MrDisgrace, 99F
三年不重開才碰的到XDD59.124.162.227

MisterSmile, 100F
媒體搬文章也不把原文解釋寫清楚27.52.94.43

filiaslayers 作者的近期文章

Re: [請益] 有沒有那種一鍵切換啟動系統的設備呀
看到推文有人提到PVE,那原po的要求其實還是可行的,但你要找的不是硬體的解法,而是軟體 你要用純硬體的解法,就是兩台主機+KVM切換,這應該是最簡單的 其中硬體KVM可以考慮用軟體KVM像免錢的Barrie然後搭配VNC來替代螢幕,這稍微
Re: [請益] 有沒有那種一鍵切換啟動系統的設備呀
一般的主機版會記憶你的開機順序(聽起來像廢話orz) 舉例來說:如果你今天把usb隨身碟放在開機第一順位 那你把隨身碟拔掉後,原本的第二順位會變成第一順位,直到你把隨身碟插回來 他不會因為你把隨身碟拔掉這個順位就跑掉 所以你可以用這個方法,
更多 filiaslayers 作者的文章...