PXE+Kickstart:无人值守批量装机实战指南
1. PXE与Kickstart技术解析第一次接触批量装机是在2015年当时公司采购了200台新服务器老板要求三天内全部部署完毕。看着堆满机房的设备我差点崩溃。幸好老同事教我用了PXEKickstart组合最终只用了一个通宵就完成了所有服务器的系统安装。这种效率让我彻底爱上了这项技术。PXEPreboot eXecution Environment是Intel设计的网络引导协议它允许计算机在没有本地存储设备的情况下直接从网络启动并加载操作系统。想象一下就像给电脑装了个云启动盘只要网卡支持开机就能连上服务器获取系统镜像。Kickstart则是Red Hat开发的自动化安装工具它通过预设的应答文件ks.cfg实现无人值守安装。这就好比给系统安装过程写了个剧本从分区方案到软件包选择所有操作都能自动完成。二者结合使用时PXE负责把电脑叫醒并连上安装服务器Kickstart则接管后续的所有安装步骤。这种组合特别适合以下场景数据中心批量部署服务器学校机房系统统一安装企业办公电脑标准化配置云计算平台主机初始化2. 环境准备与网络配置记得第一次搭建时我犯了个低级错误——直接用办公网段做测试结果导致整个办公室断网。这个教训让我明白实验环境隔离至关重要。2.1 硬件需求清单准备以下设备PXE服务器建议4核CPU/8GB内存/100GB存储需要两个网卡目标客户机支持PXE启动的任意x86设备网络设备千兆交换机如果超过50台设备建议用万兆2.2 网络拓扑设计推荐两种安全方案物理隔离单独准备测试交换机与生产网络完全分离逻辑隔离在现有网络划分VLAN通过DHCP中继实现跨网段部署这是我的常用配置示例CentOS 7环境# 启用IP转发 echo net.ipv4.ip_forward 1 /etc/sysctl.conf sysctl -p # 配置防火墙规则 firewall-cmd --permanent --add-servicedhcp firewall-cmd --permanent --add-servicetftp firewall-cmd --permanent --add-serviceftp firewall-cmd --reload2.3 系统基础配置先完成这些基础操作# 关闭SELinux生产环境建议保持开启并正确配置策略 setenforce 0 sed -i s/SELINUXenforcing/SELINUXdisabled/g /etc/selinux/config # 停止防火墙测试环境方便调试 systemctl stop firewalld systemctl disable firewalld # 配置yum源以阿里云为例 mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo yum makecache3. PXE服务部署详解三年前给某高校部署机房时我遇到个奇葩问题部分电脑总是获取不到IP。后来发现是网线质量问题导致DHCP包丢失。这个案例告诉我网络质量直接影响PXE成功率。3.1 DHCP服务配置DHCP服务有两个关键作用分配IP地址告知客户端TFTP服务器位置这是我的优化版配置模板/etc/dhcp/dhcpd.confoption domain-name example.com; option domain-name-servers 8.8.8.8; default-lease-time 600; max-lease-time 7200; subnet 192.168.100.0 netmask 255.255.255.0 { range 192.168.100.50 192.168.100.200; option routers 192.168.100.1; next-server 192.168.100.10; # TFTP服务器IP filename pxelinux.0; }启动服务时的小技巧# 检查配置文件语法 dhcpd -t # 调试模式运行查看详细交互过程 dhcpd -d -f3.2 TFTP服务搭建TFTP用于传输引导文件注意这些要点目录权限必须设为777需要正确配置SELinux上下文建议使用最新版tftp-server完整部署流程yum install -y tftp-server syslinux # 准备引导文件 cp /usr/share/syslinux/pxelinux.0 /var/lib/tftpboot/ cp /mnt/images/pxeboot/{vmlinuz,initrd.img} /var/lib/tftpboot/ # 创建菜单目录 mkdir -p /var/lib/tftpboot/pxelinux.cfg # 配置默认菜单 cat /var/lib/tftpboot/pxelinux.cfg/default EOF default menu.c32 prompt 0 timeout 30 menu title PXE Boot Menu label linux menu label ^Install CentOS 7 kernel vmlinuz append initrdinitrd.img inst.repoftp://192.168.100.10/centos7 EOF3.3 安装源准备推荐三种存储方案FTP传统稳定适合内网环境HTTP配置简单支持代理缓存NFS性能最好适合大规模部署以FTP为例的配置步骤yum install -y vsftpd mkdir -p /var/ftp/centos7 mount /dev/cdrom /mnt cp -r /mnt/* /var/ftp/centos7/ # 解决文件权限问题 chmod -R 755 /var/ftp restorecon -Rv /var/ftp systemctl start vsftpd systemctl enable vsftpd4. Kickstart自动化配置曾有个项目要求给300台服务器装不同配置的系统。通过动态生成ks.cfg文件我们实现了批次化差异部署。这让我意识到Kickstart的灵活性远超想象。4.1 应答文件生成三种创建ks.cfg的方法手动编写适合高手灵活性最高system-config-kickstart图形化工具参考现有配置复制/root/anaconda-ks.cfg推荐的基础模板#platformx86, AMD64, or Intel EM64T #versionDEVEL # Install OS instead of upgrade install # Use FTP installation media url --urlftp://192.168.100.10/centos7 # System language lang en_US.UTF-8 # Keyboard layouts keyboard us # Network information network --onboot yes --device eth0 --bootproto dhcp # Root password rootpw --plaintext yourpassword # System authorization information auth --useshadow --passalgosha512 # SELinux configuration selinux --disabled # Firewall configuration firewall --disabled # System timezone timezone Asia/Shanghai # System bootloader configuration bootloader --locationmbr # Partition clearing information clearpart --all --initlabel # Disk partitioning information part / --fstypexfs --size20480 part swap --size4096 part /var --fstypexfs --size10240 %packages ^minimal core vim-enhanced wget %post # 安装后脚本 echo Hello from Kickstart /etc/motd %end4.2 高级定制技巧分享几个实用技巧动态参数在%post阶段通过解析内核参数实现差异化配置加密密码使用openssl passwd -1生成加密密码软件包组用^指定环境组如^web-server示例根据MAC地址设置主机名%post MAC$(cat /sys/class/net/eth0/address | sed s/://g) hostnamectl set-hostname node-${MAC} %end4.3 服务集成测试最终整合测试步骤将ks.cfg放到FTP目录修改PXE菜单添加ks参数重启所有服务cp ks.cfg /var/ftp/ systemctl restart dhcpd tftp vsftpd调试技巧在客户端按Esc查看详细启动日志检查/var/log/messages中的DHCP分配记录使用tcpdump抓包分析网络交互5. 企业级优化方案去年为某电商平台设计部署方案时我们遇到了并发性能瓶颈。通过以下优化最终实现了每小时500节点的部署能力。5.1 性能调优参数关键优化点DHCP调整租约时间和地址池大小TFTP启用多线程和块大小优化存储使用RAM磁盘缓存常用文件具体配置# 优化TFTP传输/etc/xinetd.d/tftp server_args -s /var/lib/tftpboot -B 1468 -v -m 5 # 创建RAM磁盘缓存 mount -t tmpfs -o size512M tmpfs /var/lib/tftpboot/cache5.2 高可用架构生产环境建议采用DHCP集群通过主备方式避免单点故障负载均衡多台PXE服务器分担请求镜像同步使用rsync实时同步安装源示例keepalived配置global_defs { router_id PXE_HA } vrrp_instance VI_1 { state MASTER interface eth0 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.100.254/24 } }5.3 安全加固措施必须注意的安全事项网络隔离PXE网络与生产网络物理分离访问控制配置防火墙白名单日志审计记录所有安装操作安全配置示例# 限制FTP访问/etc/vsftpd/vsftpd.conf anonymous_enableNO local_enableYES chroot_local_userYES allow_writeable_chrootYES userlist_enableYES userlist_file/etc/vsftpd/user_list userlist_denyNO # 启用TFTP日志/etc/xinetd.d/tftp log_on_success USERID log_on_failure USERID6. 常见问题排查八年运维经验中我整理了几个典型问题案例6.1 客户端无法获取IP排查步骤检查网线连接和交换机端口状态确认DHCP服务正常运行使用tcpdump抓包分析tcpdump -i eth0 port 67 or port 68 -vv常见原因防火墙阻止了DHCP请求网卡未启用PXE ROMVLAN配置错误6.2 启动过程中断典型错误现象卡在TFTP传输阶段引导菜单显示不全内核panic报错解决方法检查TFTP目录权限验证镜像文件完整性增加TFTP超时时间# 在PXE菜单追加参数 append initrdinitrd.img inst.repoftp://192.168.100.10/centos7 inst.xshell1 inst.nokill6.3 Kickstart执行异常调试技巧在%pre和%post阶段添加日志输出检查/root/ks-post.log文件使用--debug参数启动安装示例调试脚本%post exec /root/ks-post.log 21 echo Starting post-installation # 你的脚本内容 %end7. 扩展应用场景除了常规系统安装这套方案还能实现更多自动化功能7.1 批量固件升级通过PXE引导专用镜像可以更新BIOS固件刷新RAID卡固件批量修改硬件配置7.2 自动化测试平台结合CI/CD系统自动部署测试环境运行硬件诊断执行基准测试7.3 混合云部署在云环境中快速初始化虚拟机统一本地与云环境配置实现跨平台镜像分发实际案例某游戏公司使用PXE在30分钟内完成了200台物理服务器和500台云主机的统一部署将新版本上线时间缩短了80%。