發(fā)布時(shí)間:2020-09-23

“運(yùn)維實(shí)戰(zhàn)家”專(zhuān)欄,從技術(shù)到實(shí)踐,
和您聊聊運(yùn)維的那些事兒,講述運(yùn)維人的“昨天、今天和明天”

本文作者 黃小湘
剛開(kāi)學(xué)不久,最近小銳遇到老師在使用云桌面辦公教學(xué)時(shí)候出現(xiàn)系統(tǒng)藍(lán)屏問(wèn)題,有的老師第一時(shí)間重啟系統(tǒng)恢復(fù)了,有的老師電腦反復(fù)藍(lán)屏重啟,心情特別郁悶,我們?cè)撊绾慰焖俳鉀Q呢?

01
藍(lán)屏問(wèn)題是這樣發(fā)生的!
小銳接到問(wèn)題反饋是這樣的:老師反饋近期VDI云桌面系統(tǒng)使用中經(jīng)常出現(xiàn)藍(lán)屏,重啟能恢復(fù)。
藍(lán)屏問(wèn)題經(jīng)常是因?yàn)閃indows因系統(tǒng)環(huán)境安全問(wèn)題、軟件故障、硬件故障、驅(qū)動(dòng)程序故障、網(wǎng)絡(luò)故障等各種類(lèi)型的故障產(chǎn)生了嚴(yán)重的錯(cuò)誤,無(wú)法繼續(xù)維持正常運(yùn)行,系統(tǒng)為避免用戶(hù)數(shù)據(jù)丟失及損壞計(jì)算機(jī)的考慮,將自動(dòng)停止運(yùn)行并顯示“藍(lán)屏”錯(cuò)誤信息。
小銳第一點(diǎn)排查懷疑是否Window系統(tǒng)中毒導(dǎo)致藍(lán)屏。小銳遠(yuǎn)程客戶(hù)電腦,使用360安全衛(wèi)士和殺毒軟件掃描木馬和病毒,掃描結(jié)果電腦沒(méi)有中毒。
排除電腦中毒影響后,小銳也排除了硬件故障,VDI個(gè)別用戶(hù)賬號(hào)藍(lán)屏不具備單體硬件故障條件。由于藍(lán)屏故障原因復(fù)雜,軟件故障,驅(qū)動(dòng)異常等都無(wú)法直接判斷,但是可以通過(guò)藍(lán)屏事件生成的dmp文件分析具體是哪個(gè)程序或進(jìn)程崩潰卡死。接著小銳工程師從客戶(hù)電腦收集了C:\Windows\Minidump目錄的藍(lán)屏事件生成的dmp文件,使用常見(jiàn)簡(jiǎn)單版工具BlueScreenView進(jìn)行初步分析原因。
打開(kāi)工具BlueScreenView,選擇“選項(xiàng)”->“高級(jí)選項(xiàng)”。

選擇“加載單個(gè)MiniDump文件”,“瀏覽”保存的MiniDump文件(藍(lán)屏MiniDump默認(rèn)路徑是C:\Windows\Minidump),這里文件夾dmp文件是基于系統(tǒng)默認(rèn)小內(nèi)存轉(zhuǎn)儲(chǔ)模式記錄的內(nèi)存數(shù)據(jù)。

查看調(diào)用堆棧開(kāi)頭幾個(gè)組件名,分析引發(fā)原因。

從圖上我們可以看到引起藍(lán)屏的程序進(jìn)程是i8042prt.sys,通過(guò)百度查詢(xún)確認(rèn)是鍵盤(pán)驅(qū)動(dòng)崩潰導(dǎo)致藍(lán)屏。

遇到如上這種第三方外設(shè)驅(qū)動(dòng)異常,我們一般是建議向廠(chǎng)商確認(rèn)外設(shè)驅(qū)動(dòng)版本和Windows版本、位數(shù)是否兼容,或嘗試更新這些設(shè)備驅(qū)動(dòng)(通過(guò)廠(chǎng)商、廠(chǎng)商網(wǎng)站、驅(qū)動(dòng)精靈等)。
通過(guò)minidump文件分析,小銳工程師把故障原因縮小到第三方外設(shè)驅(qū)動(dòng)導(dǎo)致異常,且老師反饋是近期頻繁出現(xiàn)故障,小銳工程師懷疑老師近期是否新增使用了外設(shè)或者更新了不穩(wěn)定的外設(shè)驅(qū)動(dòng)造成沖突。經(jīng)過(guò)與老師了解,老師近期的確安裝了多個(gè)外接硬件設(shè)備驅(qū)動(dòng),并通過(guò)一些驅(qū)動(dòng)軟件進(jìn)行安裝。
證實(shí)了用戶(hù)行為后,明確了問(wèn)題原因,小銳工程師卸載了這些新增外設(shè)驅(qū)動(dòng),通過(guò)從外設(shè)官網(wǎng)提供的最新驅(qū)動(dòng)進(jìn)行更換安裝后,云桌面使用不在出現(xiàn)藍(lán)屏。
02
如何高效解決藍(lán)屏問(wèn)題?
云桌面藍(lán)屏問(wèn)題原因分類(lèi)如下幾類(lèi):
1) Window系統(tǒng)應(yīng)用異常,常見(jiàn):中毒,安全防護(hù)不足,驅(qū)動(dòng)異常,軟件沖突,補(bǔ)丁沖突等;
2) 第三方外設(shè)設(shè)備或驅(qū)動(dòng)影響;
3) 硬件故障;
4) GT組件兼容問(wèn)題影響。
方法一
云桌面出現(xiàn)藍(lán)屏情況,優(yōu)先推薦使用HALO工具->工具商店->千里眼定位工具方法排查或者使用工具箱屏蔽GT腳本驗(yàn)證測(cè)試。

方法二
可通過(guò)收集藍(lán)屏dump文件分析精確分析定位原因。系統(tǒng)默認(rèn)“小內(nèi)存轉(zhuǎn)儲(chǔ)模式”文件收集(C:\Windows\Minidump)簡(jiǎn)單分析藍(lán)屏故障觸發(fā)進(jìn)程,以及設(shè)置“核心內(nèi)存轉(zhuǎn)儲(chǔ)模式”文件收集(C:\Windows\MEMORY.dmp)深入分析故障環(huán)境下內(nèi)存狀態(tài)和卡死原因。
設(shè)置核心內(nèi)存轉(zhuǎn)儲(chǔ):控制面板>系統(tǒng)和安全>系統(tǒng)>高級(jí)系統(tǒng)設(shè)置>高級(jí)>啟動(dòng)和故障恢復(fù)選項(xiàng),寫(xiě)入調(diào)試信息設(shè)定“核心內(nèi)存轉(zhuǎn)儲(chǔ)”。

注:
1、 如果引發(fā)藍(lán)屏的組件是第三方軟件,如360FsFlt、qqfrmmgr.sys等。卸載或升級(jí)該第三方軟件。
2、如果引發(fā)藍(lán)屏的組件是系統(tǒng)組件,如ntoskrnl、hal等。使用360安全衛(wèi)士進(jìn)行全盤(pán)殺毒和補(bǔ)丁修復(fù),或者重新制作Windows鏡像系統(tǒng)。
3、如果引發(fā)藍(lán)屏的組件是云桌面相關(guān)組件,如RjDirProtect, RjProcessProtect, RjRegProtect, RjUsbFilter, HideUsbDev, qxl, VDFileFilter、RegFilter等。則聯(lián)系4008111000熱線(xiàn)進(jìn)一步查證原因改善方案。
重點(diǎn)總結(jié)

