假链接制作网站,做软件用什么编程语言,创建网站根目录,怎么创建一个网址本文仅针对台式机与工作站进行Fluent和Rokcy仿真的建议#xff0c;仅供参考。硬件型号信息截至于2025年6月。 1 基础原则
硬件选型#xff0c;各硬件的限制性因素总结如下#xff1a;
CPU决定计算速度内存容量决定可计算模型规模磁盘容量决定数据存储规模与数据读写时间 1…本文仅针对台式机与工作站进行Fluent和Rokcy仿真的建议仅供参考。硬件型号信息截至于2025年6月。 1 基础原则
硬件选型各硬件的限制性因素总结如下
CPU决定计算速度内存容量决定可计算模型规模磁盘容量决定数据存储规模与数据读写时间 1.1 CPU
对于CPU重点参考因素包括
核心架构核心数量与频率缓存容量 CPU建议买新不买旧优先选择核心架构发布时间较近的新款CPU通常单核性能更快。
从实际运行表现而言更推荐AMD的CPU。英特尔的大小核架构CPU极不推荐因为可能会使部分负载任务放置于效能核心导致运算耗时过长。 AMD近期的CPU如下表所示。截至发文时ZEN 5 核心的线程撕裂者暂未上市。 1.2 内存
若内存容量过小会因为内存不足而导致程序崩溃。内存用量由单元数量与类型、物理机理、算法设置等多种因素决定。
由于Fluent计算特性建议所有问题均使用双精度计算。双精度相对单精度内存需求量多50%。
对于纯多面体网格若使用单精度计算Fluent的内存用量预估
两方程湍流模型k-epsilon和k-omegaSIMPLE、PISO 速度-压力耦合格式大约 2GB/百万单元两方程湍流模型k-epsilon和k-omegaCOUPLED 速度-压力耦合格式大约 3GB/百万单元 若开启传热、多相流等其他物理模型则内存需求量更大同一模型若调用更多核心数进行计算也需要更多内存量因为需要一部分内存空间用于核心间数据传递 内存传输速率和内存条数量会影响数据传递进而影响计算速度。建议尽量采用高频多通道 DDR5 内存条数据传输速率更快。
内存也采用 MT/smillion transfer/second作为数据传输速率单位其数值上约为 MHz为单位的内存频率两倍。 1.3 磁盘
磁盘读写速度可以显著影响运算用时特别是瞬态问题。磁盘建议使用固态硬盘读写速度越高越好并注意磁盘写入寿命。 1.4 主板
主板是每个CPU都有对应支持的主板型号需要注意对应。不同主板之间主要差异除了尺寸之外包括可支持的内存容量与频率、可扩展插槽数量、无线网络等。 1.5 显卡
目前Fluent和Rocky均支持GPU运行。受限于硬件支持情况建议使用英伟达显卡可使用游戏卡或工作站专业卡。
Fluent只有部分模型支持GPU运算具体支持GPU运算的功能列表参考帮助文档每个版本均有区别。Rocky所有模型均支持GPU运算。
英伟达近期的GPU如下表所示。 对于GPU运算显存作用和内存相同。但是GPU由于显存无法自行扩展因此需要优先考虑显存的限制性。
由于Fluent计算特性建议所有问题均使用双精度计算。双精度相对单精度显存需求量多50%。
对于纯多面体网格若使用单精度计算Fluent的显存用量预估
两方程湍流模型k-epsilon和k-omegaSIMPLE、PISO 速度-压力耦合格式大约 1.4GB/百万单元两方程湍流模型k-epsilon和k-omegaCOUPLED 速度-压力耦合格式大约 3.4GB/百万单元若开启传热、多相流等其他物理模型则内存需求量更大 Rocky的显存用量预估
非球形颗粒3.2GB/百万颗粒球形颗粒2GB/百万颗粒 目前Fluent仅能支持AMD的部分显卡Rocky未见支持AMD显卡的消息。 1.6 其他部件
电源搭配注意功率合理性与工作范围适度保留冗余。功率不足或电压波动可能导致系统运行不稳定、死机等问题。
建议使用水冷散热避免长时间高负载运行导致过热和硬件寿命缩减。 1.7 系统环境
及时对硬件驱动、主板BIOS、MPI组件、某些编译库等组件进行升级更新以优化程序加速运算。
若出现蓝屏死机现象需要及时根据DUMP文件中的记录定位问题发生根源。 2 测试数据
硬件性能常用的数据常用指标包括MIUPS、加速倍率、并行效率。
MIUPSmillion-cell iteration updates per second通常用于CFD评估数值越大越好。
加速倍率speedup指相对于基准硬件测试硬件计算耗时缩短倍数。基准硬件计算耗时 A加速倍率 N 的测试硬件计算耗时 A/N。
并行效率parallel efficiency定义为加速倍率/核心数。通常并行效率小于1且核心数越多并行效率越低。并行效率等于1称为线性加速大于1称为超线性加速。 AMD官方发布的CPU在不同CPU上的测试结果横轴为各个测试模型纵轴为两款AMD CPU相对于英特尔的CPU的加速倍率。从数据上来看AMD的两款CPU均远快于英特尔的测试款。第五代EPYC相对于测试型号提升大约50%。 图源https://www.amd.com/content/dam/amd/en/documents/epyc-technical-docs/performance-briefs/amd-epyc-9005-pb-ansys-fluent.pdf ANSYS官方的模型测试数据横轴为各款显卡纵轴为显卡相对于CPU的加速倍率。从数据上来看即使工作站专业卡相对CPU多核心都有较大提升。 图源https://innovationspace.ansys.com/knowledge/forums/topic/fluent-gpu-solver-faq/ CADFEM欧洲区的ANSYS代理商对某款阀门在不同硬件条件下的计算耗时统计。很明显GPU运算速度远超过CPU。 图源https://blog.cadfem.net/en/ansys-fluent-gpu-performance-testing-use-case 贝克休斯ANSYS客户在超算上的模型测试数据横轴为显卡数量纵轴为显卡相对于CPU的加速倍率GPU型号 AMD Instinct MI250X。从数据上来看即使调用1024个GPU依旧可以保证近乎于线性加速。 图源https://www.ansys.com/blog/ansys-baker-hughes-groundbreaking-cfd-simulation Mechanical和Fluent在不同内存频率的计算效率对比横轴为各个测试模型纵轴为内存频率 3200MHz 相对于 2933MHz 的加速倍率。从数据上来看即内存频率的提升可以显著提升运算速度。 图源ANSYS官方PPT 《HPC Best Practices for Ansys Simulations》 是否安装AOCLAMD Optimizing CPU Libraries组件的计算效果对比横轴为各个测试模型纵轴为安装AOCL后的加速倍率。从数据上来看安装AOCL可显著提升AMD CPU的运算速度。 图源ANSYS官方PPT 《HPC Best Practices for Ansys Simulations》 3 注意事项
1 使用多核心CPU或者GPU加速对于网格数量过低的模型意义不大。多核心CPU运算建议平均每个核心不低于数千单元。使用GPU计算建议模型单元数量不低于100万。
2 在Windows中提交计算建议实际使用的核心数略少于CPU的物理核心数否则可能因为系统读写、图形渲染等占用系统资源导致计算速度变慢。