每天开机后的第一件事
很多人一上班就急着回邮件、开会议,但做网络维护的人不一样。早上打开电脑,第一件事是登录路由器后台或者网管系统,看看昨晚有没有异常告警。比如某台交换机端口突然断了,或者带宽使用率冲到90%以上,这类问题越早发现,越能避免下午全员上不了网的尴尬。
检查日志不能偷懒
日志不是出了事才翻的。每天花十分钟扫一遍核心设备的日志,能提前揪出不少隐患。比如防火墙频繁拦截某个IP,可能是内网有设备中招;又比如DHCP分配失败次数增多,说不定是地址池快满了。这时候赶紧扩容,比等用户打电话投诉要强得多。
定期更新和补丁管理
很多单位怕更新出问题,干脆好几个月不动系统。可不更新更危险。建议把更新安排在周五下班前,先在测试设备上跑一遍,没问题再推到正式环境。像Windows Server的补丁、交换机固件升级,最好列个清单,按月打勾,谁也赖不掉。
配置备份要自动化
手动备份容易忘,还可能存错版本。用脚本定时拉取设备配置才是正道。比如通过Python调用Netmiko库,自动登录几十台设备抓配置:
from netmiko import ConnectHandler
for device in device_list:
connection = ConnectHandler(**device)
output = connection.send_command('show running-config')
with open(f"{device['host']}_config.txt", 'w') as f:
f.write(output)
connection.disconnect()
配上cron每天凌晨跑一次,配置丢不了。
无线信号巡查别落下
办公室装修完、隔断一改,Wi-Fi就可能出盲区。每周拿手机或笔记本走一圈,测测各区域信号强度。特别是会议室、茶水间这种高密度区域,RSSI低于-70dBm就得考虑加AP。用户抱怨“连得上但卡”,八成是信号弱或者信道挤。
用户报修先查三层
有人喊上不了网,别急着重启设备。先确认是不是他自己电脑的问题:网线插紧没?IP是不是自动获取?能不能ping通网关?这三步走完,大概率能分清是个人故障还是网络故障。省得白跑机房一趟。
月底做一次流量复盘
打开PRTG或者Zabbix,看看这个月流量峰值出现在哪天,是谁占的带宽。要是发现某台电脑整天跑满下行,得找IT同事查查是不是有人下片或者同步大文件。内部资源滥用,迟早拖垮整个网络。