网站授权系统怎么用,个人网站设计论文怎么写,百度学术论文查重免费检测,wordpress视频悬停数据库管理-第115期 too many open files#xff08;202301107#xff09;
这是我上周末帮朋友站台过程中处理的一个问题。
1 背景
其实这是别人搭的一个使用CentOS 7.8系统安装的一套11.2.0.4#xff08;无补丁#xff09;的双节点RAC#xff0c;用于迁移以前运行在So…数据库管理-第115期 too many open files202301107
这是我上周末帮朋友站台过程中处理的一个问题。
1 背景
其实这是别人搭的一个使用CentOS 7.8系统安装的一套11.2.0.4无补丁的双节点RAC用于迁移以前运行在Solaris小机上的同版本数据库当然这个迁移操作也不是我来做我只是在迁移完成后看看数据库有没有啥问题。其实之前就帮忙过一次把AMM从64G改到了200G也不晓得256G的机器开那么低内存干啥。这盘最大的问题其实是迁移过程中parallel没开并行度就1到了统计信息更新的时候就非常的慢object有丢丢多而且只剩下了统计信息和JOBJOB也就几个了因此就尝试改了parallel并重启导入进程结果挂了报了以下的错
ORA-39097: Data Pump job encountered unexpected error -xxxx
ORA-39065: unexpected master process exception in DISPATCH
...经过基本检查应该是dump相关组件出现了一些问题因此就运行了下面的脚本进行处理
?/rdbms/admin/catmeta.sql
?/rdbms/admin/catmet2.sql
?/rdbms/admin/utlrp.sql在执行完最后脚本后发现集群数据库挂了同时有一个节点都重启。检查告警日志就是一大把的
too many open files2 处理过程
首先统计信息和剩下的JOB就想着手工迁移了但是得先处理跑utlrp.sql的问题这个脚本是处理数据库的失效对象会调用比较多的CPU线程虽然CPU占用率不会上去但是对操作系统压力也不小。数据库因为too many open files的问题造成关键进程挂掉引起数据库挂掉crs进程也因为这个原因挂掉而重启操作系统。 经过多次尝试问题依旧因此重新检查了sysctl.conf和limit.conf。首先grid和oracle的nofile限制soft是1024hard是65535就一般情况来说是足够的而kernel.shmmax对应则大概是40G左右。查了一些相关资料做了一些调整
/etc/sysctl.conf
kernel.shmmax225485783040210G大于AMM配置的200G/etc/security/limit.conf
oracle soft nofile 10240
oracle hard nofile 131070
grid soft nofile 10240
grid hard nofile 131070完成后为避免异常分节点重启了整个集群然后再尝试执行utlrp.sql多次尝试后没有再出现问题。同时utlrp.sql脚本的执行速度也比之前快。
3 怀疑
首先就一般Oracle安装配置来说是足够的遇到too many open files的问题结合没有打任何补丁CentOS 7上11g的支持可能也不是太好姑且当是一个bug吧。以后遇到装数据库nofile还是都弄到40000一体机是这么配置的shmmax都整到内存80%以上。
总结
老规矩知道写了些啥。