如何优化您的Linux服务器以支持高性能应用程序？

在Linux上运行高性能应用程序不仅需要强大的硬件，还需要对操作系统、内核参数和软件堆栈进行仔细调整。适当的优化确保了更低的延迟、更高的吞吐量和更好的可靠性，这在托管数据库、Web应用程序或计算密集型工作负载时至关重要。

保持系统精简

高性能服务器应仅运行必要的服务。额外的守护进程会消耗CPU周期、内存和I/O带宽，从而减少可用于关键工作负载的资源。首先审计已启用的系统服务：

systemctl list-unit-files --state=enabled

禁用不必要的服务，例如蓝牙、打印系统或自动发现守护进程：

systemctl disable bluetooth.service
systemctl disable cups.service
systemctl disable avahi-daemon.service

仅保留不可或缺的组件，例如SSH、防火墙服务、监控代理和应用程序守护进程。这将最小化性能开销和攻击面。

优化CPU调度

Linux默认使用完全公平调度器（CFS），在进程之间平衡CPU时间。对于对延迟敏感或实时的工作负载，请考虑：

使用
renice
调整进程优先级：
```
renice -n -10 -p <PID>
```
使用
chrt
分配实时调度：
```
chrt -f 99 <command>
```
将进程绑定到特定的CPU核心：
```
taskset -c 0-3 <command>
```

这些方法提高了CPU的可预测性，并减少了数据库、VoIP或流媒体应用程序等工作负载的延迟变化。

调整内存管理

高效的内存利用对性能至关重要：

减少交换：
```
sysctl -w vm.swappiness=10
```
调整文件系统缓存压力：
```
sysctl -w vm.vfs_cache_pressure=50
```
配置HugePages（并单独处理THP）：
```
sysctl -w vm.nr_hugepages=1024
```
控制内存超分配：
```
sysctl -w vm.overcommit_memory=1
```

在

/etc/sysctl.conf

或

/etc/sysctl.d/

中持久化这些设置，以确保重启后保持一致。

增强磁盘和I/O性能

磁盘I/O通常是高性能应用程序的主要瓶颈。

选择合适的I/O调度程序（SSD：
none
或
mq-deadline
）：
```
echo none > /sys/block/sda/queue/scheduler
```
注意：在具有blk-mq的系统上，调度程序在
/sys/block/<device>/mq/
下配置。

使用以性能为导向的选项挂载：

mount -o noatime,nodiratime /dev/sda1 /data

使用高性能文件系统：
XFS用于并发密集型工作负载，ext4针对吞吐量进行了调优。
考虑RAID：
RAID 10用于数据库，RAID 0用于临时计算工作负载。

网络堆栈优化

高性能和网络密集型应用程序需要TCP/IP堆栈调优：

增加文件描述符：
```
ulimit -n 65535
```
通过编辑
/etc/security/limits.conf
使其持久化。

增加TCP缓冲区大小：

sysctl -w net.core.rmem_max=268435456
sysctl -w net.core.wmem_max=268435456
sysctl -w net.ipv4.tcp_rmem="4096 87380 268435456"
sysctl -w net.ipv4.tcp_wmem="4096 65536 268435456"

启用TCP快速打开：
```
sysctl -w net.ipv4.tcp_fastopen=3
```
启用IRQ平衡（通常用于多核NIC）：
```
systemctl enable irqbalance
systemctl start irqbalance
```
注意：对于超低延迟网络（DPDK工作负载），通常禁用irqbalance，并手动固定IRQ。
调整其他内核参数：
net.core.netdev_max_backlog
，RSS/RPS用于在核心之间平衡数据包处理。

内核和系统级调优

现代应用程序从更深层次的内核调整中受益：

增加共享内存限制：

sysctl -w kernel.shmmax=68719476736
sysctl -w kernel.shmall=4294967296

提高最大打开文件描述符：
```
sysctl -w fs.file-max=2097152
```
使用cgroups和命名空间：
在容器化或多租户环境中分配和隔离资源。
考虑低延迟内核：
PREEMPT_RT用于极端响应性（交易、通信）。

应用程序级优化

系统级调优必须与应用程序特定的调整相结合：

数据库（MySQL/PostgreSQL）：调整缓冲池、检查点、缓存、连接池。
Web服务器（Nginx/Apache）：调整工作进程、保持活动、缓存、压缩。
Java：调整堆大小，使用G1GC/ZGC，调整JVM标志。
虚拟化：调整虚拟机监控器的I/O和网络，仔细分配vCPU/vRAM。

监控和基准测试

优化只有在测量后才有效。

实时监控使用
htop
、
iotop
和
vmstat
。
基准测试系统组件：
- 使用
  sysbench
  基准测试CPU和数据库。
- 使用
  fio
  基准测试磁盘。
- 使用
  iperf3
  基准测试网络吞吐量。
实施持续监控，使用Prometheus并通过Grafana可视化指标。