计算机硬件排障总结
1   PC组件常见品牌质保信息查询
2   PC组件常见品牌驱动下载
3   CPU
3.1   CPU超频超频的设置
- Multi Core Enhancement:强制所有核心运行在最高频率,关闭这个选项可以省电
- PU Ratio:CPU倍频,通常会有几个选项,Auto,AllCore,Per Core,Specific Per core;Auto就是默认的CPU倍频变化,可以再AIDA64中的CPUID子页面中看到单核最大睿频,双核最大睿频,四核最大睿频等。All Core 对于超频用户来说是经常选择的选项,也就是所有核心同时设定倍频的频率。PerCore就可以设置在不同的负载下有多少核心的倍频有多大,就像Auto一样。Specific Per Core是给极限玩家用的,你可以分别尝试并分配每个独立核心最高可以达到多少倍频。
- CPU Cache Ratio:CPU环形总线倍频,也是CPU缓存频率,北桥频率。
- 注:环形总线是所有核心L3缓存沟通的桥梁,通常不需要太高频率,够用就好。也就是CPU-Z当中的NB Frequency。
- Minimum CPU Cache Ratio:最低CPU缓存倍频。如字面意思,防止CPU缓存自动降低。
- BCLK Frequency:外频。 CPU与缓存的频率=外频*倍频。
- BCLK Spread Spectrum:外频扩展频谱,超频请务必关闭。
- 注:当主板上的时钟发生器工作时,脉冲的峰值会产生电磁干扰(EMI),展频技术可以降低脉冲发生器所产生的电磁干扰。在没有遇到电磁干扰问题时,应将此类项目的值全部设为“Disabled”,这样可以优化系统性能,提高系统稳定性;如果遇到电磁干扰问题,则应将该项设为“Enabled”以便减少电磁干扰。在将处理器超频时,最好将该项设置为“Disabled”,因为即使是微小的峰值飘移也会引起时钟的短暂突发,这样会导致超频后的处理器被锁死。
- Boot Performance Mode:进入Windows之前的CPU性能。通常会有Max Battery也就是CPU最节能性能,通常CPU会工作在最低倍频的状态下,直到进入Windows,设置为Max Non-Turbo时CPU就会工作在自动倍频下,设置为Turbo Performance时CPU会运行在最大速度下。
- Reliability Stress Restrictor:可靠性应力限制。CPU会提交给Windows一些参数被记录在日志,通常用来防止损坏的主板或CPU运行。而Windows会将某些CPU超频现象归类为“错误”从而扼杀CPU速度。
- FCLK Frequency:System(Home) Agent频率。CPU系统代理通常运行在800Mhz,如果CPU外频设置在200Mhz,那么这个参数一般设置为400Mhz,因为200*4=800Mhz。最高可以运行在1Ghz。(Intel也曾经建议Skylake以上的台式机最好提高FCLK到1Ghz)
- System(Home) Agent是什么东东呢? 它包含PCIE、DMI总线、内存控制器、显示引擎等,它还包含CPU电力管理单元,与CPU环形总线智能集成。
- AVX Ratio Offset:AVX倍频补偿。超频玩家最喜闻乐见的参数,可以大幅度提高超频稳定性,建议设置在3。设置在1可以让CPU在浮点运算的时候比整数低100Mhz,比如你的CPU一般情况下跑在4.5Ghz,那么在跑AVX指令集时就会降低到4.4Ghz,如果设置为3就会降低300Mhz,以此类推。这个选项对于超频十分重要,因为AVX指令集调用时,CPU的功耗发热都非常大,适当降低AVX频率有助于超频成功率的提升。
- BCLK Aware Adaptive Voltage:外频/电压比率调整。当启用时,CPU通常会小心计算外频与电压之间的比率,这个选项通常适用于外频超频而防止电压过高。
- Ring to Core Ratio Offset:环形总线与核心倍频比自动调整。如果你手动设置了缓存频率,这个选项通常不管用。
- Intel SpeedStep Technology:Intel CPU节电技术。CPU会根据处理器任务量自动调整频率和电压。如果禁用,那么Windows电源管理的“最小CPU速度”不起作用。
- Intel Turbo Boost Technology:CPU睿频。一般超频的时候这个选项不起作用。
- Intel Speed Shift Technology:Intel CPU 节电技术、状态调整。启用后会暴露CPU的CPPC接口给Windows,出现在第六代酷睿上。以前CPU核心从深度睡眠的C7状态下激活需要很长时间,这个延迟通常比内存延迟要大得多,至少需要30毫秒。而这个技术可以大大提高响应速度,官方介绍只需要说1毫秒。
- 一般推荐可以禁用Speed shift,因为实际没啥用(详见What does Intel Speed Shift do?),但SpeedStep需要开启,因为是重要的性能和功率调整选项。
- Long Duration Power Limit:长期CPU功耗限制。对于超频来说,有多大调多大(直接无限输入数字9)。
- Long Duration Maintained:当CPU长期功耗限制的周期时间。对于超频来说,同样是有多大调多大。
- Short Duration Power Limit:短时间CPU功耗限制。对于超频来说,还是有多大调多大。
- CPU Core Current Limit:CPU核心电流限制。对于超频来说,一样,有多大调多大。
3.2   ZEN3的whea18错误
系列通病,也看批次,若测试频繁复现whea18,建议走售后换新。
4   Intel 13/14代高端U的缺陷
关于问题原因可详看Intel官方公告内容。
Intel官方公告:
- July 2024 Update on Instability Reports on Intel Core 13th and 14th Gen Desktop Processors
- Additional Warranty Updates on Intel Core 13th/14th Gen Desktop Processors:延长2年质保的公告(包括盒装、散片、OEM)
相关网络报道:
- 「[CPU] 英特尔第 13/14 代处理器设备运行虚幻引擎游戏崩溃?原因找到了」
- 「Intel is finally investigating reports of high-end 13th/14th-gen CPUs causing game crashes」
- 英特尔第13、14代CPU不稳定的问题迫使Alderon Games改用AMD,并建议客户也这么做
- Intel’s 14th Gen & 13th Gen CPU Instability Issues Forces Game Studio “Alderon Games” To Switch To AMD, Advises Customers The Same
- [CPU] 现阶段避坑intel 13 14代处理器不稳定问题的,针对游戏用户intel处理器选购和使用建议
原因:RAD 公司隶属于 Epic Games 公司,负责开发 Bink 视频编解码器和 Oodle 数据压缩技术。RAD 公司表示,导致游戏崩溃的原因并非 Oodle 或 Unreal,而是过于乐观的 BIOS 设置,导致一小部分处理器在高负载情况下超出预设的时钟频率和功耗上限,并错误地执行指令。
解决方法:需要锁倍频到54x或者53x。(非最终解决手段,原因可详看Intel官方公告内容)
5   内存
5.1   关于内存的术语
1DPC的意思是,每个通道1根内存
2DPC的意思是,每个通道2根内存
1R的意思是,单面颗粒内存
2R的意思是,双面颗粒内存
5.2   内存超频
5.3   AM5平台内存自检慢
主要问题是在于memory context restore这个选项,大部分主板默认是disable。
解决方法:一般是设置开启「memory context restore」即可,如有异常或者华硕主板,可能需要设置「power down enable」(华硕主板设置memory context restore时会自动设置power down enable)。以下是微星AMD主板的设置位置:
- overclocking->memory context restore=auto改为enabled
- overclocking->advanced dram configuration->misc item->power down enable=auto改为enabled
P.S. 以MAG B650M MORTAR WIFI主板实测,「power down enable」不设置,保持「auto」自动值使用也未遇到问题。
6   不开机/自检不过
6.1   华硕主板Power LED功能排查自检状况
- 开机后Power LED快闪,1秒闪烁4次(提示没有内存或内存错误)
- 开机后Power LED慢闪,2秒闪烁1次(提示没有显示适配器或显示适配器错误)
- 开机后Power LED超慢闪,灯亮4秒,灯灭4秒(提示无开机设备或开机设备错误)
6.2   部分华硕混血ROG主板的自动掉电状态
部分华硕混血ROG主板搭配华硕雷神/雷鹰电源系列,可能出现突然掉电,按开机键无任何反应。甚至于拔电源线,扣电池都无任何反应(cmos设置甚至都无法清除,拔插24pin供电恢复正常供电后可观测到CMOS设置无变化)。
解决方法:若拔电源线扣电池都无任何反应的话,可尝试拔插主板24pin。拔插后主板即可恢复正常上电。
目前观测到存在该现象的主板型号:
- z790-h
- z790-a s
6.3   内存接触不良导致自启后直接掉电
老式机子不亮机:大多是内存条接触不良引起,可尝试重新拔插(擦拭金手指)
6.4   机箱前置IO跳线反接引起的无线重启,无法通过主板自检
部分机箱前置IO跳线设计方面不合理,前置重启键跳线一旦反接(即文字丝印朝上),可能会引起主板无线重启,无法正常通过自检,在华硕主板的powerled功能上可观测到电源指示灯表现为:开机后Power LED快闪,1秒闪烁4次,闪烁4次后会灭灯停顿约半秒,之后重复这个闪烁状态(有点类似无内存自检不过的情况)。
解决方法:按照正规方式,连接前置IO跳线,即文字丝印朝下。
7   主板
7.1   华硕主板的CPU_FAN接口和CPU_OPT接口的区别
CPU_FAN是CPU风扇,CPU_OPT则是备选接口,一般是给双风扇散热器的第二个风扇使用(例如双风扇的塔式风冷,而且没有一分二线)。CPU_FAN和CPU_OPT的转速策略是相同的,共享控制,OPT是optional(可选)的缩写,OPT的转速不能单独设置,在Q-Fan控制中,都是由CPU_FAN接管设置,详见《ROG MAXIMUS Z790 HERO 用户手册》的P29。备选的也可以插水冷头的供电,但是一般来说这两个口的供电都只有1A。部分高端主板会有W_PUMP接口,这个是专门给水冷头用的,能提供3A的供电。
8   华硕奥创
关于系统残存的奥创配置影响吹雪主板的灯光闪烁,使用新系统的奥创配置(比如利用新硬盘的系统)先设置无灯光初始化硬件参数。
8.1   完整清除奥创的步骤
- 使用奥创官方卸载工具执行卸载操作。
- 手动移除奥创残留的服务进程和残留文件夹。
regedit
打开注册表:搜索「Asus」(注意选择全字匹配),删除搜索到的结果项目。(BIOS选项底下和硬件底下都不用删除)- 使用奥创在线安装包安装或者奥创官方离线包重新安装。(如果这步执行到最后显示安装不完成,直接打开Amoury Crate的UWP应用进行更新安装即可)
可以解决的问题:
- 离线包安装没有主板选项可勾选(奥创扫描硬件信息并在注册表中保存,如果没清除干净,奥创安装会校验已有信息,认为之前已经安装过的)
- 各种离奇的安装报错
8.2   无法识别内存组件
安装其他的内存灯控软件,比如芝奇灯控Trident Z Lighting Control。设置开机自启,然后奥创就可以识别。
8.3   无法识别正确的主板型号
故障原因:使用改机器码的工具修改了主板名称,比如AMIBIOS DMI EDITOR。
解决方法:使用工具改回原来的值。
8.4   奥创同步海盗船内存灯光
- BIOS设置关闭SPD保护
- BIOS高级模式(F7切换模式)->AI Tweaker/Extreme Tweaker->Tweaker's Paradise->SPD Write Disable->FALSE
- 卸载奥创本体(如果提前有安装)
- 安装iCue奥创插件
- 安装iCue本体
- 安装奥创本体
9   显卡
9.1   专业检测工具-MASTS
工具官方论坛链接:MATS/MODS 400/455/520 Тест видеопамяти nVidia для флешки
直接下载最新的ISO镜像,用Rufus直接写入U盘即可。
9.2   13/14代酷睿CPU搭配显卡出现显卡驱动掉驱现象
故障原因:CPU的pcie控制器有瑕疵,导致显卡驱动掉驱现象。
10   无线网卡
10.1   2.4GHz无线设备的频率干扰问题
具体故障表现:无线鼠标会有停顿感,或是无线键盘输入的速度变慢或无反应,甚至是无线传输的距离缩短。
可能存在的干扰源:
- 接收器附近的USB3.0设备(参阅同时使用USB3.0和2.4GHz的USB无线设备可能会发生频率干扰的问题和USB 3.0 对无线鼠标的干扰问题)
- 解决方案:远离usb3.0的接口,换接到usb2.0的接口上,或者usb延长器延展出来再连接无线键鼠的接收器。
- WIFI:因为无线路由器发射的功率较之无线键鼠更大,因此一般是2.4GHz的WiFi会对其进行干扰,部分好的无线设备可以屏蔽WiFi的干扰。(参阅「老哥们的无线鼠标会影响wifi吗?」)
- 解决方案:关闭路由器WiFi的2.4GHz频段或者更换WiFi信道。
小记:在无线信号覆盖范围内的各种无线网络设备应该尽量使用不同的信道,以避免信号之间的干扰。
11   有线网卡
11.1   常规网卡设置
网卡品牌 | 参数名称(中英文对照) | 设置建议 | |
---|---|---|---|
Realtek | EEE | 建议关闭 | |
巨型帧/Jumboframe | 建议关闭 | ||
流控制/FlowControl | 建议关闭 | ||
大量传送负载/OffloadLargesend | 建议关闭 | ||
环保节能/GreenEthernet | 建议关闭 | ||
硬件效验和/OffloadChksum | 建议关闭 | ||
Intel | TCP/IP分载选项 | 分载接收IP效验和/ChecksumRxIp | 建议关闭 |
分载接收TCP效验和/ChecksumRxTcp | 建议关闭 | ||
分载传输IP效验和/ChecksumTxIp | 建议关闭 | ||
分载传输TCP效验和/ChecksumTxTcp | 建议关闭 | ||
分载TCP分段/TcpSegmentation | 建议关闭 | ||
流程控制/FlowControl | 建议关闭 | ||
适应性帧间距调整/AdaptiveIFS | 建议关闭 | ||
中断节流率/InterruptThrottleRate | 建议关闭 | ||
巨帧数据包/JumboPacket | 建议关闭 | ||
Marvell | 巨帧包/JumboPacket | 建议关闭 | |
卸载 TCP/UDP 校验和(IPv4)/TCPUDPChecksumOffloadIPv4 | 建议关闭 | ||
大量传送负载 (IPv4)/LsoV1IPv4 | 建议关闭 | ||
中断模式/InterruptModeration | 建议默认 | ||
流控制/FlowControl | 建议关闭 | ||
能量之星/WakeUpSpeed | 建议关闭 | ||
Atheros | 流控制/Flow Control | 建议关闭 | |
中断调整/Interrupt Moderation | 建议默认 | ||
每秒最大中断/Max IRQ per Second | 30000 | ||
接收缓冲区/Number of Receive Buffers | 512 | ||
任务卸载/Task Offload | 建议关闭 | ||
Broadcom | 硬件效验和/ChksumOffload | ||
流控制/FlowControl | 建议关闭 | ||
大量发送卸载/Large Send Offload | 建议关闭 |
Marvell网卡关闭中断模式后可能会出现客户机开机后出现白色箭头。但是由于每款主板或驱动可能会有细微差别,因此对于中断模式方面设置,建议保持默认。如果出现问题了,可以首先对该选项进行调整,例如关闭或开启。
12   电源
12.1   PC电源的保持时间
- 英特尔制定的ATX 12V规范,其要求PC电源在100%负载的情况下,各路输出保持时间不低于16毫秒
- SSI EPS12V 2.92服务器电源设计指导,其要求电源在75%的负载下各路输出的保持时间应该大于18毫秒,而Power-OK信号的保持时间则是大于17毫秒。
12.2   异常断电的硬盘断电保护措施
一般硬盘的断电保护通常是企业级的专利,部分消费级硬盘也具备断电保护,但只具备基本的保护功能,无法保护内存中的用户数据。
PC电源的保持时间只是提供一个缓冲的时间告诉各个硬件要断电了,具体的断电保护措施还是需要看硬件自身的设计。
12.3   关于线材的拔插寿命
线材协议的制定者是PCI-SIG联盟,其相关测试寿命是在30次左右。其实8pin寿命也只有30次的,超过只是达不到初始稳定性,PCI SIG测试报告拔插超过40次可能就有风险。
12.4   冗余电源
- ATX规格冗余电源设计:银欣Gemini 900A Gold
- 1U电源
13   屏幕
屏幕不断闪,并且可以看到总是选定一个东西:键位被卡住,一直在输入键值
屏幕的常见故障:
- 竖线:一般是脱焊。
- 束带:坏cof,压屏更换。
13.1   AC97与HD-Audio前置音频连接针脚定义
https://www.docin.com/p-2418893040.html
14   硬盘
14.1   测试工具
固态:
- CrystalDiskInfo和CrystalDiskMark
- AS SSD Benchmark
- 三星固态:三星魔术师软件(Magician)
- 系统自带工具winsat:测试C盘:
winsat disk -drive C
。WinSAT 工具运行整体系统测试命令:winsat formal -v
。
14.2   固件更新:
14.3   硬盘/系统启动项
华硕主板有Hard Drive BBS Priorities(硬盘BBS属性,需要开启CSM保存重启进入BIOS界面才能看到),专门针对硬盘设置启动项,若不开启CSM,只能识别到UEFI的系统windows boot manager项(UEFI需要安装好系统和创建好引导,BIOS才能正常识别到)。
USB设备也有BBS设置。
14.4   磁盘分区表格式
一般来说,磁盘分区表有两种格式:MBR和GPT。
14.4.1   MBR
MBR分区表在windows操作系统下最多支持4个主分区或3个主分区+1个扩展分区(包含多个逻辑分区),扩展分区必须划分为逻辑分区才能使用,1个扩展分区可以划分多个逻辑分区。MBR分区表不支持容量大于2.2TB的分区(一些硬盘制造商将他们的容量较大的磁盘升级到了4KB的扇区,这意味着MBR的有效容量上限提升到了16 TB)
14.4.2   GPT
GPT分区表对分区数量没有限制,没有主分区和逻辑分区之分,但在windows系统上最多只能读取128个分区。
14.5   引导模式
UEFI的引导文件为winload.efi,而Legacy的引导文件为winload.exe。
14.5.1   UEFI BIOS
基本引导原理:UEFIBIOS->EFI系统分区(FAT32格式的分区)->\efi\Microsoft\boot\bootmgfw.efi->efi\Microsoft\BCD->\Windows\system32\winload.efi
14.5.2   Legacy BIOS
基本引导原理:LegacyBIOS->MBR->“活动的主分区”->\bootmgr->\Boot\BCD->\Windows\system32\winload.exe
14.6   磁盘分区表和引导模式的组合
- Legacy BIOS+MBR:传统引导最常见的组合方式。
- UEFI BIOS+GPT:UEFI引导最常见的组合方式。
- UEFI BIOS+MBR:windows镜像自带的安装引导工具不支持。开启CSM模式或者将UEFI设置成Legacy模式(传统模式),调整设置后本质上就是Legacy BIOS+MBR组合。
- Legacy BIOS+GPT:windows镜像自带的安装引导工具不支持。windows不可用,无法正常引导开启系统,本质上是bootmgr读不了GPT格式,其实可以通过更换三方引导工具实现引导。Legacy BIOS + GPT + GRUB + Linux是可行的。
14.7   无分区直接使用硬盘
- windows10/11:无法实现。
- linux:直接mkfs使用就是无分区格式化,并且常见win pe内部工具均无法识别这种形式的数据,会被认为无数据盘。
术语概念:
- MBR - Master Boot Record,在硬盘的0扇区,包含引导程序和分区表;
- PBR - Partition Boot Record,在分区的0扇区,是文件系统的起点,也包含一定的引导程序。
无分区情况。在U盘上,是比较常见的。U盘启动的时候,会有HDD和FDD两种模式:
- HDD - Hard Disk Drive,硬盘驱动器
- FDD - Floppy Disk Drive,软盘驱动器(软盘的0扇区就是PBR)
14.8   数据恢复
专业数据恢复软件:PC3000
- 机械盘:删除后无写入操作大多可正常恢复。
- ssd:因为存在trim机制。基本很难恢复。SSD TRIM一个过程,有助于随着时间的推移继续保持固态硬盘的性能。Trim的工作原理是定期擦除不再使用的数据块。标记TRIM后的数据并不总是直接删除,因为需要一个复杂的过程来确定何时删除(由硬盘GC机制控制)。而定期trim,不仅可以释放硬盘空间,还可以帮助SSD性能更好,寿命更长(固态的设计结构所致)。
15   打印机
15.1   安装打印机驱动
部分hp高端型号,比如打印机扫描机一体的大型机,安装驱动时,可以直接点击设置主页->设备->打印机和扫描机->添加打印机或者扫描机(windows会自动安装驱动,包括扫描机驱动)
16   其它类别
16.1   电脑维修级别
计算机维修可分为两个级别,即一级维修和二级维修。一级指替换配件测试维修,二级指芯片级维修。
17   参考文献
[1] 華碩電腦股份有限公司. ROG MAXIMUS Z790 HERO 用户手册[M/OL]. 第三版. 2022: 29. https://dlsvr04.asus.com.cn/pub/ASUS/mb/LGA1700/ROG_MAXIMUS_Z790_HERO/C21512_ROG_MAXIMUS_Z790_HERO_V3_WEB.pdf?model=ROG%20MAXIMUS%20Z790%20HERO.
[2] 回复:cup‑fan 和 cpu‑opt 有啥区别???[EB/OL]. https://tieba.baidu.com/p/6018187267?pn=2.
[3] No q‑fan control for cpu_opt R4BE[EB/OL]. https://rog.asus.com/forum/showthread.php?43080‑No‑q‑fan‑control‑for‑cpu_opt‑R4BE.
[4] zen3的whea18错误个人见解[EB/OL]. https://tieba.baidu.com/p/7213032582#/.
[5] 网卡参数设置建议与各个网卡参数含义详解[EB/OL]. https://blog.csdn.net/Windgs_YF/article/details/104893741.
[6] 无需三方工具,Windows 命令行轻松实现 SSD 测速[EB/OL]. https://www.sysgeek.cn/windows-ssd-speed-test/.
[7] 硬盘不分区,直接格式化,硬盘第一个扇区里面会变成什么样子?还存在分区表吗?[EB/OL]. https://www.zhihu.com/question/531775025.
[8] [显卡] ATX3.0 16pin的供电线插拔寿命真的只有30次吗?[EB/OL]. https://www.chiphell.com/thread-2453340-1-1.html.
[9] 微星Z490-A PRO每个内存槽支持不同最高频率的疑惑. https://nga.178.com/read.php?tid=22378405&rand=676.
[10] 华硕奥创软件重新安装无法识别主板问题解决.[EB/OL]. https://zhuanlan.zhihu.com/p/672994457.
[11] 华硕奥创中心无法识别主板问题.[EB/OL]. https://zhuanlan.zhihu.com/p/576492004.
[12] [主板] 开新帖说明AM5开机自检慢的解决方法.[EB/OL]. https://www.chiphell.com/thread-2504587-1-1.html.
[13] Memory Context Restore. Causing blue screens?.[EB/OL]. https://forum-en.msi.com/index.php?threads/memory-context-restore-causing-blue-screens.388576/.
[14] [硬件求助] 开机一分钟,自检50秒,DDR5的锅还是主板的锅?(已解决,快了1倍).[EB/OL]. https://g.nga.cn/read.php?tid=36577093&rand=242.
[15] 华硕主板如何设置开机第一启动项方法大全[EB/OL]. https://www.zhihu.com/tardis/zm/art/67107055.
[16] 小科普 | BIOS设置选项详细解释①——CPU核心篇[EB/OL]. https://www.bilibili.com/read/cv253846/.
[17] UEFI+GPT、Legacy+MBR引导模式介绍 & 引导修复[EB/OL]. https://blog.csdn.net/dglxlcl/article/details/85085901.
[18] BIOS + GPT + GRUB + Linux + Windows 折腾笔记[EB/OL]. https://blog.csdn.net/o_alpha/article/details/102959192.
[19] [主板]华硕 Power LED故障排除不上电/不开机/无显示[EB/OL]. https://rog.asus.com.cn/support/faq/1046157/.