Board logo

主題: [求助] [求助]只要開機一段時間就會掛!! [打印本頁]

發表人: polarstar    時間: 2006-12-4 08:56 AM     主題: [求助]只要開機一段時間就會掛!!

小弟有一台伺服器主機HP ML350,記憶體四條共2G ecc ,外接了Adaptec 2120s SCSI卡做RAID 5(四顆硬碟)
作業系統是2000 server
只要開機一段時間後,重新開就會掛掉
會出現藍底白字,如下:
====================
STOP:c0000218 Unknown Hard Error
Unkmown Hard Error
Beginning dump of physical memory
Dumping physical memory to Disk:xx(xx表會從1數到100然後就重開)
====================

想說可能是記憶體的問題,有一隻一隻的試,結果還是一樣
也不太可能是硬碟壞掉

因為有做備份,只要用True image一還原就正常可以開機
剛還原時,怎麼重開都正常不會有問題~
但是只要開機一段時間後,重開就會出現上面的訊息!!

不知道各位有遇過類似的問題嗎?可以幫幫我的~~謝謝!!

[polarstar 在  2006-12-5 10:19 AM 作了最後編輯]
發表人: beam    時間: 2006-12-4 10:53 AM

熱?
監控一下溫度
風扇?
發表人: shiuh    時間: 2006-12-4 11:28 AM

先試試看 系統在沒做Raid的情況下會不會當掉
之前我有遇過類似的狀況,那時我在Raid 0 的系統下
當我把CPU衝到100%在使用下,沒多久就會跟我說我的Hard error然後當掉
當時我並沒記下錯誤碼,但我想可能是同樣情況

因為當初我在裝Raid的時後,我把不相關的Driver也裝下去了
但我的HD並無支援那種裝置,所以當用一陣子就會掛掉

不曉得你是不是這個情況
但我想把系統測試一下...所有的配備都一樣 軟體都一樣
但是就是沒有Raid 5 , 我想當機情況可能會有所改善

如果是這樣,就可能要請你換裝正確的Raid驅動程式,
有可能也得重頭裝一次...
發表人: polarstar    時間: 2006-12-4 12:36 PM


引用:
beam寫到:
熱?
監控一下溫度
風扇?


過熱的現在我之前也有考慮到!!
有試過機殼打開~~用一隻電扇在吹~但還是一樣!!
機房內還有冷氣在吹!!應該不至於太熱
不過還是感謝你提供意見~~
發表人: polarstar    時間: 2006-12-4 12:57 PM


引用:
shiuh寫到:
先試試看 系統在沒做Raid的情況下會不會當掉
之前我有遇過類似的狀況,那時我在Raid 0 的系統下
當我把CPU衝到100%在使用下,沒多久就會跟我說我的Hard error然後當掉
當時我並沒記下錯誤碼,但我想可能是同樣情況


謝謝你提供意見!!

可是當初第一次掛點的時候,我重新安裝一次系統
掛的驅動,是raid卡所附的驅動!!也只有在安裝2000系統的時候驅動,也沒灌其他的驅動了!!

而且我的系統並不會當機,只是重開的時候就會掛!!(快得重開機恐懼症了!!)

要是真的沒辦法解決~可能才會考慮把raid關掉重做系統試看看吧!!
因為裡面的東西還算滿重要的!!
發表人: missholiday    時間: 2006-12-4 02:24 PM

我個人不覺得是溫度的問題:O
基本上就算是70度也不會崇開機
我個人有三科P42.8/3.0/3.2
我倒覺得比較有可能是電源的問題
建議你先測試RAM還有PRIME95
也有可能是主機板但我個人覺得是電源有很大的關係RAM的錯誤也有可能
所以你可以現從側RMA開始之後都沒有問題就RUN PRIME95
要試過不暸:O你可以試著看看拔掉硬碟和光碟機另外你的主機板是什麼?電源是什麼幾瓦?多少記憶體有沒有雙通?有沒有同廠牌?還有很多細節可以注意
也有可能是IRQ問題
發表人: polarstar    時間: 2006-12-4 04:14 PM


引用:
missholiday寫到:
我個人不覺得是溫度的問題:O
基本上就算是70度也不會崇開機
我個人有三科P42.8/3.0/3.2
我倒覺得比較有可能是電源的問題
建議你先測試RAM還有PRIME95


他並不會自動重開!!
你說的ram如何測?
我想先試你說的PRIME95來跑跑看!!
不知有無使用教學?
我的主機版跟電源都是hp_ML350原廠的!!伺服器的板子不是一般pc的版子

[polarstar 在  2006-12-4 04:42 PM 作了最後編輯]
發表人: missholiday    時間: 2006-12-4 10:22 PM

喔?你試用ECC的RAM:O
看你這樣的設置覺得是RAID的機率比較大了
個人覺得你要崇RAID的驅動持式和他的BIOS下手
可以看看有沒有新的RAID的FIRMWARE可以更新還有DRIVER最好也在找過:O
勝制可以自己看一下晶片去晶片的觀網自己找驅動
http://www.mersenne.org/
上面那個就是我說的PRIME選DOWNLOAD 下載  p95v2414.exe(1.1MB HTTP) 安裝然後跑就OK
RAM測試是下面這個
http://www.memtest.org/
不過建議你看一下DRIVER問題把RAID DRIVER在安全模式減除乾淨之後去找新的在裝過:O
發表人: polarstar    時間: 2006-12-5 10:26 AM


引用:
missholiday寫到:
不過建議你看一下DRIVER問題把RAID DRIVER在安全模式減除乾淨之後去找新的在裝過:O


昨天讓主機跑PRIME了,好像要跑24小時才能確定機器的穩定度
等結果出來在跟大家報告吧!!

raid的驅動要換~~
問題是我在安裝2000系統的時候,他一開始是抓不到我raid的硬碟
是安裝的過程中,按f6用他附的驅動下去安裝的!!
那我現在到安全模式移除後,會不會重開就抓不到,進不了系統~就沒辦法更新!!
還是我直接在windows底下更新raid的驅動!!
發表人: wugen    時間: 2006-12-5 10:53 AM

c0000218 是Registry corruption問題.  有可能是RAID(如果win2k是在那裡), 也有可能是RAM.
先整理一下Registry再看看
發表人: missholiday    時間: 2006-12-5 11:24 AM

你可以在WINDOWS底下更新
只是我好奇如果DRIVER已經有問題這樣你的RAID應該也有問題了也就是你的REGISTRY有問題:O
這樣好像看起來DRIVER修復使解決了根本可是REGITRY問題還是存在:O
我的看法是:O要是你確定你的主機BIOS後期更新裡面沒有提到這種BUG我建議你可以看一下主機板說明書確定一下RAID卡有獨立IRQ然後在你崇裝WINDOWS的時候用心的驅動做出的RAID磁碟片安裝:O我想可能才也辦法解決根本的問題:O
不過這是因為我對於REGISTRY只要有問題= =就想要崇貫的原因我不專業總覺得那個用的不好結果這個問題解決別的問題出來好麻煩:O
不知道有沒有人在這方面是專長:O這樣就不用用我的土方法><
另外PRIME95RUN6小時就有一定程度12小時代表穩定24小時你要是有遇到問題%95-98式軟體問題:O或是軟體相容的問題:O
另外也建議你跑一下MEMTEST那個測試很快而且可以馬上知道記憶體是否有硬體錯誤錯誤在哪
雖然機率很低可是還是建議測試一下:O因為要是有的話我想你什麼堧體都最新安裝的時候還是會有瑕疵
助你好運!!!基本上我的認知是這樣通常是RAID DRIVER需要更新:O或是RAM給予的錯誤指示針對你的CASE好像RAM錯誤機率比較低:O
發表人: polarstar    時間: 2006-12-5 11:32 AM


引用:
wugen寫到:
c0000218 是Registry corruption問題.  有可能是RAID(如果win2k是在那裡), 也有可能是RAM.
先整理一下Registry再看看


你所謂的Registry整理,是如何整理?
是否有教學?
發表人: polarstar    時間: 2006-12-5 11:49 AM


引用:
missholiday寫到:
你可以在WINDOWS底下更新
只是我好奇如果DRIVER已經有問題這樣你的RAID應該也有問題了也就是你的REGISTRY有問題:O
這樣好像看起來DRIVER修復使解決了根本可是REGITRY問題還是存在:O
我的看法是:O要是你確定你的主機BIOS後期更新裡面沒有提到這種BUG我建議你可以看一下主機板說明書確定一下RAID卡有獨立IRQ然後在你崇裝WINDOWS的時候用心的驅動做出的RAID磁碟片安裝:O我想可能才也辦法解決根本的問題:O
不過這是因為我對於REGISTRY只要有問題= =就想要崇貫的原因我不專業總覺得那個用的不好結果這個問題解決別的問題出來好麻煩:O


我了解你的意思,就算更新了驅動,原來的registry還是可能有問題!!
重灌太沉重,重灌完所有的iis設定又要重設~~暈倒

還有你說raid有沒有獨立的irq有什麼差別勒?
http://www.litz.com.tw/product_main.asp?PID=ASR-2120S%20128MB
這張就是我在用的!!
發表人: missholiday    時間: 2006-12-5 12:04 PM

我個人每次都發現一個問題就是CREATIVE的音效卡和RAID卡都需要有獨立的IRQ
一般來說IRQ會互相分享:O好比說插槽1和插槽5分享插槽2和USB分享或是和MODEM
可是你不一定會同時用到這兩樣東西:O這時候電腦就會讓兩樣東西輪流使用IRQ
所以我建議你可以找到比方說插槽1和插槽5然後你不用插槽1然後再5上面裝RAID這樣就完全獨立了
這個問題不大:O不過當你遇到非常特殊的問題或是很奇怪的錯誤又找不到原因常常這樣一換之後就解決
你也可以看看可不可以用WINDOWS光碟再開機一次然後放入新的DRIVER
進去之後選折修復WINDOWS
這樣也可能可以解決:O
你不怕麻煩或是怕以後又有麻煩:O因為我相信你的硬體不是拿來一個月崇灌一次的:O
最好還是重新裝過然後一一確定都沒有錯誤之後財開始安裝你要的東西只是不知道你是不是還有時間壓力= =
T T崇冠是真的很麻煩
可是看你的用途還有需要多大的穩定性個人還是請向崇灌多依點
等都找到沒有問題了才凱使你的IIS設定吧.....你要公司內部網站還是Storage
T T住好運
你的RAID卡很棒喔!!!!
不過我個人喜歡PROMISE多點^^||||
不知道有沒有差呵呵
加油你可以的@O@你比我還專業放心吧
對了位啥你不用2003 :O?
我看2003慢慢成熟了不像剛出來那樣了好很多說
不過你用哪個習慣就用哪個:O
比較心也不一定比較好= =

[missholiday 在  2006-12-4 11:13 PM 作了最後編輯]
發表人: missholiday    時間: 2006-12-5 12:17 PM

對了我發現你的這台主機:O好像很多人遇到問題他們都是開機一段時間之後就庭住
你的是G3還是G4:O
XEON多少CPU:O?還是?
好奇了一下
對了還有你可能會需要這個
http://www.adaptec.com/en-US/sup ... firmware_update.htm
更新一下吧
裡面有新的DRIVER還有FIRMWARE!!!!更新一下:O我大概看了一下挖~~修改了不少東西:O
喝喝看樣子你距離崇貫的路更進了XD要是你想要你的系統距離下次問題更遠XD


這個是你的卡對嗎?
http://www.adaptec.com/en-US/products/raid/ultra320/ASR-2120S/

[missholiday 在  2006-12-4 11:25 PM 作了最後編輯]
發表人: polarstar    時間: 2006-12-5 12:25 PM

其實這個問題六月發生了第1次!!
那時候也是找了一堆方法,最後還是重灌!!
重灌完後,也重開了好幾次,都沒什麼問題!!以為只是單純的系統壞掉!!
但是後來陸陸續續發生二三次~只要重開就掛,才覺得出問題了!!
因為第1次掛點後,學乖了,重灌後!有將系統用true image備份(很好用!!推薦~)
所以這段其間還原了二三次!!!幾分鐘就完成了~還滿快的!!
只要不重開就不會有事,但就像你說的~這樣也不是辦法

這次在發生時,就有考慮到插槽的問題!!
所以有將卡插至另外一個插槽了,就看下次的重開會不會掛了(快得到重開機恐懼症了!!)

因為那台有各單位的網頁,目前還不能關掉一陣子重灌來測機器

謝謝你!!提供那麼多的解決辦法~
發表人: missholiday    時間: 2006-12-5 12:29 PM

果然:O那就只好等囉:O
要是有控建議你先更新一下FIRMWARE這東西滿重要= =應該說非常重要我覺得再來就是DRIVER:O
這兩個都用完你就讓他跑吧:O其實這種類型的機器通常都要更新FIRMWARE和BIOS半年才可以問題少依年才可以穩定要是你很崔毛球雌@O@跟我一樣龜毛
不過我看我朋友都跟我輸= =你別鬧了不可能的
只能就沒有問題就不要去動他= =就這樣lol看你了
發表人: polarstar    時間: 2006-12-6 08:33 AM

PRIME95跑了39小時了~~0 error 0 warning
發表人: missholiday    時間: 2006-12-7 12:16 AM

那很好:O阿那你就真的崇軟體下手吧
有控測一下MEMTEST那個針對你的記憶體作測試可以粉明確說出錯誤位置藥事都沒有你真的載有機會把軟體整理過找到最穩定的軟體應該這樣就OK了記得更新的時候靜量看一下它更新內容要是修改的東西你並沒有發生問題或是你用不到的功能要是當下軟體跑的好好就不要更新除非你有時間去確定
PRIME95很好用:O你在跑的過程還可以繼續做其他的事情:O那軟體會把資源用的滿滿可是要是你有中意檔案在處理他也會把空間都讓出來要是你主要軟體都跑了還有空間她會把剩下空間用玩^^




歡迎光臨 TWed2k (http://twed2k.org/) Powered by Discuz! 4.1.0