24小时热门版块排行榜    

查看: 1143  |  回复: 4

Ray williams

新虫 (正式写手)

[求助] fluent DPM Linux计算集群运行报错

计算对象是一个三维圆柱在空间中做简谐运动,计算域顶面有离散相入射。
DPM设置为面入射,按rosin预设函数分布,unsteady particle track, 按0.001s的粒子时间步计算(计算迭代时间步为1e-5s)
动网格udf如下:
#include "udf.h"
#include "math.h"
#include"sg_mem.h"
#include"dynamesh_tools.h"
DEFINE_CG_MOTION(cylinder_vibration,dt,cyv,omega,time,dtime)
{
#if!RP_HOST
cyv[0]=0.1023*cos(5.9816*time);
cyv[1]=0.5180*cos(5.9816*time);
cyv[2]=-0.2810*cos(5.9816*time);
#endif
}
先后在DPM并行设置中尝试了massage passing、shared memory和hybrid,均发生如下错误:
Updating solution at time level N... done.

Updating mesh at time level N... done.

==============================================================================

Node 0: Process 31019: Received signal SIGSEGV.

==============================================================================

==============================================================================

Node 3: Process 31022: Received signal SIGSEGV.

==============================================================================

==============================================================================

Node 4: Process 31023: Received signal SIGSEGV.

==============================================================================

===============Message from the Cortex Process================================

Fatal error in one of the compute processes.

==============================================================================

==============================================================================

Node 10: Process 31029: Received signal SIGSEGV.

==============================================================================
而且该错误仅在Linux计算集群中发生,我在Windows系统单机开多核计算没有问题。

事关毕业大计,哪位大神拉我一把?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

一入土木深似海,从此不再是文青
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ray williams

新虫 (正式写手)

对本问题的附加说明:
在Windows下运行时,生成的libudf文件夹win64下有两个文件,3ddp_host和3ddp_node,其中user_nt.udf内容如下:
SOURCES =  $(SRC)cylinder_vibration.c
VERSION = 3ddp_node
PARALLEL_NODE = pcmpi
在Linux集群下运行时,生成的libudf文件夹Inamd64下有两个文件,3ddp_host和3ddp_node,其中没有生成user_nt.udf,而是生成了user.udf内容如下:
CSOURCES= cylinder_vibration.cHSOURCES=FLUENT_INC=/public/home/reaijs/ansys/v150/fluentGPU_SUPPORT=off
第一行的区别是fluent14.0和15.0造成的,无关计算
后两行缺失是为什么,是编译的问题还是设置的问题?

而且在Linux集群下,不加DPM只启动动网格可以运行,不启动动网格只激活DPM也可以运行,但两者不能同时运行;而Windows下单机多核可以运行。
求大神解答
一入土木深似海,从此不再是文青
2楼2016-10-29 14:28:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ray williams

新虫 (正式写手)

再次补充问题描述:
我的case文件有三项主要设置,除了之前提到的DPM和动网格,还设置了初始状态0.2毫米厚的欧拉壁面液膜模型在圆柱表面
经过尝试,发现如下情况:
计算集群上单核运行没有问题
多核运行时
DPM+EWF(eulerian wall film)+动网格 =一楼所示错误
DPM+EWF=正常运行
DPM+动网格=正常运行
动网格+EWF=一楼所示错误
后来又将  
DPM+EWF(eulerian wall film)+动网格 在单机Linux系统下运行,同样报错如一楼所示
DPM+EWF(eulerian wall film)+动网格case用ANSYS14.0制作,Windows下安装版本有ANSYS14.0和17.0,均可运行;LINUX集群和单机上的安装版本为ANSYS15.0,不可运行;所以这是不是意味着EWF能否运行与ANSYS版本有关?
还望有大神明示。
一入土木深似海,从此不再是文青
3楼2016-10-30 19:49:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ray williams

新虫 (正式写手)

经尝试,分别在Windows下单机多核、Linux下单机多核、Linux集群下试算,均出现如一楼所示错误,判定fluent15.0存在bug,无法并行计算兼有动网格、DPM、EWF的case文件。
下一步将尝试用fluent14.5计算,结果敬请期待
一入土木深似海,从此不再是文青
4楼2016-11-07 20:43:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ray williams

新虫 (正式写手)

好久之后补上结论:
fluent14.5可以算是可以算,但稳定性奇差,平均每500个时间步就会发生一次错误而中止计算。如果不计较数据处理的工作量,还是可以算的。
一入土木深似海,从此不再是文青
5楼2017-02-02 10:26:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 Ray williams 的主题更新
信息提示
请填处理意见