问题背景
物理机,系统为Centos7,升级默认的openssh为openssh-8.8p1版本,升级步骤与以前一致
问题现象
与其他若干机器使用批量命令同时升级后,只测试了几台机器都可以正常登录就没管了,几个小时后被告知有两台物理机使用普通用户和root用户均无法登录
排查解决
- 首先排除了端口问题,因为客户端是能ssh,只是登录提示密码错误,但也能肯定密码是没有修改过。怀疑是ip有冲突导致登录错了机器,云平台通过kvm检查了ip等配置后否定了,这两台机器ping网关之类的不会掉包并且机器接入的网络存储服务都正常。
- 继续排查了openssh的配置文件,也无任何错误,于是从日志入手,而/var/log/secure内的记录寥寥无几,又查看/var/log/messages,这回有了收获,通过测试登录终于有了明显的报错信息
几个文件内容权限等也无异常。但有了线索终于可以向百度求助了,搜索一下才知道原来是selinux没有关闭导致的,顺利解决!Could not get shadow information for user
`根据报错内容猜测是密码或者密码文件有问题,但也能确定是没有人为修改过的,检查了
`/etc/passwd,/etc/shadow,/etc/shadow-
感想
此次事件有以下几个经验:
- 虽然同时批量安装升级openssh,但基础环境不同还是可能导致出现问题
- selinux这个东西太烦了,必须要在以后的各种维护操作之前确认已关闭