先说下事情的由来,这个功能很少被提到。
我们在搭建vSAN服务器的时候,如果严格按VMware的最佳实践,用于vSAN磁盘的存储控制器,是不建议再用作启动盘,而且不少存储控制器不支持混合模式(同时支持RAID和直通),如果配置成了直通模式,就无法再配置RAID 1,用于安装esxi,这时的一种折中的方案,就是将esxi安装在其中一块直通的硬盘上,当然这样是没有冗余的,而且带来维护上的不便,就是容易在维护的时候,错误插拔了这块特殊的启动盘。
如果你去问服务器厂商,他会建议你再配置一个存储控制器,而且甚至要牺牲掉一个磁盘框(一般是8块磁盘的空间),也有通过增加NVME的板卡,但这些都无疑会带来额外的成本或者资源的浪费,如果就是不想增加这些费用,那么用USB启动是个不错的选择,其实大部分服务器都已经为此做了设计,为什么几乎所有的服务器内部都预留了USB插槽。
但是如果esxi采用USB启动,esxi会认为USB不是持久耐用的介质,日志会写到一个RAMDisk中,而如果esxi发生紫屏,就会没有地方写dump, 所以会有这样的报错:
啰嗦了这么多,终于要请出主角了,这时你只需要配置好dump collector这个服务,就可以让esxi紫屏的时候将dump通过网络写到vCenter中,这个报警也会消失,下面我将配置过程分享给大家。
1.需要访问vCenter的后台管理界面
https://vcenter-hostname or IP :5480
找到ESXi Dump Collector这个服务
将其启动,如果不是临时,就需要点击“设置启动类型”,改为自动
配置完成后应该是这样
2.下一步需要在esxi上用命令行进行配置
esxcli system coredump network set -v vmk0 -i 192.168.0.250
esxcli system coredump network set -e true
可用下面命令检查
esxcli system coredump network check
详细的说明,可以参考:
https://docs.vmware.com/cn/VMware-vSphere/7.0/com.vmware.esxi.install.doc/GUID-85D78165-E590-42CF-80AC-E78CBA307232.html
我们可以测试下,可以用下面的命令模拟PSOD的状况
vsish -e set /reliability/crashMe/Panic 1
可以观察到esxi已经发生了紫屏故障,而且正在将日志写到我们预设的192.168.0.250 (vCenter)上
dump写完后的屏幕
那么这个dump文件在vCenter的什么位置呢,我把位置告诉大家
这个绿色的就是这台主机的dump文件。
明眼人马上就可以发现这个方法的一些弊端,就是依赖管理网,依赖vCenter,如果恰好是vCenter所在的esxi主机紫屏了,可能就无法获取dump文件,但我觉得可能不必那么担心,毕竟紫屏现在发生的很少,而且即使获得dump文件,如果没有原厂的支持,也未必能进行分析。
其实在vSphere 4.1的时候,就已经有通过windows 部署的dump collector服务,我测试过,esxi7仍然是可以使用这种windows版本的dump collector,如果哪位有这方面的需求,可以私信给我。
如果您觉得有用,请点赞,分享和关注。
原文始发于微信公众号(vExpert):配置esxi 7.0 dump collector
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论