问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

"Failed to Power On"虚拟机问题:PCI直通与MMIO分配不足

创作时间:
作者:
@小白创作中心

"Failed to Power On"虚拟机问题:PCI直通与MMIO分配不足

引用
1
来源
1.
https://knowledge.broadcom.com/external/article/323402/failed-to-power-on-virtual-machines-with.html

问题/简介

在为虚拟机(VM)中的GPU配置PCI直通时,正确的内存映射I/O(MMIO)分配对于VM的成功启动和运行至关重要。MMIO是PCI规范的基本组成部分,它通过将I/O设备映射到系统内存空间,使CPU能够直接访问这些设备。这种方法消除了对专用I/O端口的需求,允许CPU使用标准内存访问指令与设备交互。

具体来说,对于GPU直通,MMIO对于将GPU的帧缓冲区内存映射到VM的内存空间至关重要。这使得CPU能够高效地在CPU和GPU之间传输数据,从而实现正确的图形渲染和整体VM性能。

计算MMIO值

MMIO值是基于分配给VM GPU的总帧缓冲区内存的简单计算得出的。为了确保兼容性,该值必须是2的幂。2的幂包括2、4、8、16、32、64、128、256、512、1024等。

例如:一个NVIDIA H100 PCIe 80GB = 80GB(介于64GB和128GB之间),因此向上取整到下一个2的幂(128GB),然后再次向上取整到下一个2的幂(256GB)以获得正确的设置。如果设置得太低,VM将无法启动。

错误信息

在启动带有PCI设备的VM时出现错误信息:

Module DevicePowerOn power on failed

VM在"Power on virtual machine"任务完成后掉线。

在vmware.log文件(/vmfs/volumes/datastore/vmdirectory/vmware.log)中,有类似的条目:

YYYY-MM-DDTHH:MM:SS In(05) vcpu-0 - PCIPassthru: successfully created the IOMMU mappings
YYYY-MM-DDTHH:MM:SS In(05) vcpu-0 - Guest: EFI ROM version: VMW71.00V.21100432.B64.2301110304 (64-bit RELEASE)
YYYY-MM-DDTHH:MM:SS In(05) vcpu-0 - BIOS-UUID is 42 3e 61 c2 32 fc f5 37-1c 79 d0 ee 3c 29 e2 4a
YYYY-MM-DDTHH:MM:SS In(05) vcpu-0 - Msg_Post: Error
YYYY-MM-DDTHH:MM:SS In(05) vcpu-0 - [msg.efi.pciMmioError] The firmware could not allocate xxxxxxx KB of PCI MMIO. Increase the size of PCI MMIO and try again.

本文原文来自Broadcom

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号