本文共 1524 字,大约阅读时间需要 5 分钟。
在Spark集群、Hadoop集群等大数据环境中进行调优时,Linux系统层面的优化同样不可或缺。以下是三种常见的系统调优方法。
Linux系统在两个层面对文件句柄进行限制:系统层面和进程层面。
/proc/sys/fs/file-max来配置系统能够打开的最大文件数。ulimit -a查看当前限制值。在生产环境中,默认值通常不足以满足需求。可以通过ulimit -n临时修改文件句柄的最大数目。若需要永久生效,需在/etc/security/limits.conf中追加配置,如soft nofile 10000和hard nofile 10000。
max user processes限制了单个用户能够启动的进程数。通过ulimit -u可以临时更改此值。若需要永久生效,需在/etc/security/limits.conf中追加配置,如soft nproc 10000和hard nproc 10000。
swap分区(交换分区)用于将部分数据临时存储在磁盘,以释放内存空间。设置swap分区时,可以优先使用物理内存,避免频繁磁盘IO操作。建议通过echo vm.swappiness=0 >> /etc/sysctl.conf禁用swap分区,以提高性能。
可以使用以下命令查询:
netstat -npta | grep 100
使用以下命令:
find /home -size 10K
命令如下:
find . -name Main.java | xargs grep -n "keywords" >> main.txt
使用以下命令:
tar -zcvf testDir.tar.gz testDir/
命令如下:
tar -zxvf testDir.tar.gz -C /home/user
使用以下命令:
df -h
命令如下:
free -mt
使用以下命令:
chown -R tom:group-t ./testDir
命令如下:
chmod 755 testDir
命令如下:
cat app.log | tail -n +3000 | head -n 1000
命令如下:
cat app.log | head -n 3000 | tail -n +1000
命令如下:
ll ./app | grep "^-" | grep js | wc -l
^-表示匹配文件,grep js表示匹配.js文件,wc -l表示统计数量。
关注微信公众号:大数据学习与分享,获取更多技术干货!
转载地址:http://rnvkz.baihongyu.com/