Qualcomm 最近向 Linux 社区提交了一套针对 RISC-V 平台的 RAS(Reliability、Availability、Serviceability)支持补丁,这是基于 RISC-V 的 RERI(Error-record Register Interface)规范 所做的首次非 RFC 正式补丁系列,旨在让 RISC-V Linux 系统能够 标准化地捕获和上报硬件错误。
这组补丁让内核通过 RERI 定义的内存映射寄存器接口来记录来自 PCIe、CXL 等设备或总线的错误事件,并将这些错误传递给用户态工具,有助于提高服务器级系统的健壮性与可维护性 。目前该补丁已基于 OpenSBI 等基础设施实测成功,并可在如 QEMU 模拟平台上测试。
核心意义
- 对未来 RISC-V Linux 服务器来说,RAS 错误上报是构建可信赖运维与监控体系的基础。
- 体现了开放 ISA 的生态正在逐步补齐企业级平台所需的关键功能。
原文链接:https://www.phoronix.com/news/RISC-V-RAS-RERI-Linux-Patches