24小时热门版块排行榜    

查看: 1814  |  回复: 19

5超7

至尊木虫 (著名写手)

菜鸟

[求助] 请教并行计算linux的问题

我在连接局域网进行并行计算的时候,一直会中断,中断挺有规律,自动保存一次后,没过多久就中断了,出现的字样如图中所示:terminated,还有其下面那行字,请问大家这是什么原因造成的?我用的是fluent6.3版本,排出cas的问题,因为我使用后台计算就是可以继续算下去的,只有交互式存在这个问题!

1.png
回复此楼
我要奋斗到底
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

峰fight

木虫 (正式写手)


xiegangmai: 金币+1, 谢谢参与 2013-01-06 14:09:35
引用回帖:
15楼: Originally posted by 5超7 at 2012-12-28 20:57:57
不满你说,这方面我不懂。只是机械性地按照给的指令打的,用MPI就可以调出fluent6.3...

我仔细看了下,应该是
-mpi=hp
搞航空宇航的小角色
16楼2012-12-28 21:23:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

onesupeng

金虫 (职业作家)

【答案】应助回帖


感谢参与,应助指数 +1
xiegangmai: 金币+1, 谢谢参与 2012-12-27 21:56:20
这个你应该问机器管理员的吧?感觉是因为机器不允许这样提交作业的。另外,$PBS_NODEFILE只有在用pbs作业管理系统的时候才能生成的吧,你直接这样可以吗?
长期招收博士生,参见http://fsl-unsw.com
2楼2012-12-27 02:50:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

5超7

至尊木虫 (著名写手)

菜鸟

引用回帖:
2楼: Originally posted by onesupeng at 2012-12-27 02:50:24
这个你应该问机器管理员的吧?感觉是因为机器不允许这样提交作业的。另外,$PBS_NODEFILE只有在用pbs作业管理系统的时候才能生成的吧,你直接这样可以吗?

哦!谢谢你的回复!首先这样的指令是可以提交作业的,我们研究所都通过这样的指令进行交互式计算,其次我们上传作用是通过Xftp这个软件上传的,同样需要联网才能上传!
我问过管理HPC的老师,他告诉我可能是网络的问题,可是我觉得网络的问题应该不大,因为我XFTP也是一直开着的,上面显示的是连接着的状态,而交互计算就会在自动保存一次后,中断!
我要奋斗到底
3楼2012-12-27 08:00:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

onesupeng

金虫 (职业作家)

【答案】应助回帖

★ ★ ★ ★
xiegangmai: 金币+2, 专家考核, 谢谢参与 2012-12-27 21:56:37
5超7: 金币+2, ★★★很有帮助, 非常感谢你热情的回复!目前可以通宵并行了,我把指令中的long改成了verylong 2012-12-29 08:05:18
好吧,那只能是我孤陋寡闻了。我做了至少6年的居于linux的并行系统和作业管理系统的安装测试和管理,我知道的PBS_NODEFILE是表示由pbs自动分配给作业的节点列表,其节点数为命令行中指定的进程数。因此你不调用PBS,如何能使用PBS_NODEFILE 变量呢

我认为你这种情况应该是单独手动写一个机器列表文件hosts_file ,然后让 -cns=hosts_file
其中hosts_file 里面的内容为
node1:n1
node2:n2
的形式。你研究看看是不是这么回事。当然,如果是fluent自己能生成PBS_NODEFILE 变量列表,就当我没说过
长期招收博士生,参见http://fsl-unsw.com
4楼2012-12-27 11:53:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

onesupeng

金虫 (职业作家)

【答案】应助回帖


xiegangmai: 金币+1, 谢谢参与 2012-12-27 21:56:50
但是fluent并行命令设计应该是独立于pbs等管理系统存在的,不必要依赖、兼容pbs,而且pbs也是比较落后的系统
长期招收博士生,参见http://fsl-unsw.com
5楼2012-12-27 11:55:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

5超7

至尊木虫 (著名写手)

菜鸟

引用回帖:
5楼: Originally posted by onesupeng at 2012-12-27 11:55:18
但是fluent并行命令设计应该是独立于pbs等管理系统存在的,不必要依赖、兼容pbs,而且pbs也是比较落后的系统

这方面我没有您那么懂,我只是按照要求输入相应的指令而已,只是现在自动保存一次后就退出,这让我百思不得其解
我要奋斗到底
6楼2012-12-27 12:02:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

峰fight

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与,应助指数 +1
5超7: 金币+2, 有帮助 2012-12-28 14:39:28
5超7: 金币+1, 有帮助, 剩下一个BB,给你!谢谢你! 2012-12-29 08:07:30
xiegangmai: 金币+2, 谢谢参与 2013-01-06 14:09:55
对于linux下的并行问题我不熟,帮不上什么忙
但是有个建议是使用ANSYS FLUENT,而不是6.3,6.3的版本的并行法案还停留在2006年的水平上
现在的版本是ANSYS 14.5了,13.0以后的版本,对linux这块做了很多的改动和优化
搞航空宇航的小角色
7楼2012-12-28 13:33:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

峰fight

木虫 (正式写手)


xiegangmai: 金币+1, 谢谢参与 2013-01-06 14:10:07
我实验室同学一直用的13.0,在linux并行,交互式,局域网,没有过报错,你可以试试
搞航空宇航的小角色
8楼2012-12-28 13:37:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

5超7

至尊木虫 (著名写手)

菜鸟

引用回帖:
8楼: Originally posted by 峰fight at 2012-12-28 13:37:47
我实验室同学一直用的13.0,在linux并行,交互式,局域网,没有过报错,你可以试试

恩!你不是用局域网进行交互式计算的吗?
我的问题很诡异,自动保存一下后,就出现terminated,然后就无法并行计算了
我要奋斗到底
9楼2012-12-28 14:40:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

5超7

至尊木虫 (著名写手)

菜鸟

引用回帖:
4楼: Originally posted by onesupeng at 2012-12-27 11:53:19
好吧,那只能是我孤陋寡闻了。我做了至少6年的居于linux的并行系统和作业管理系统的安装测试和管理,我知道的PBS_NODEFILE是表示由pbs自动分配给作业的节点列表,其节点数为命令行中指定的进程数。因此你不调用PBS, ...

我不是很明白你的意思,这方面我真是外行!我就贴出打完申请指令后fluent里面显示的内容给你看看把!如下图所示:

2.png



3.png



4.png



5.png

我要奋斗到底
10楼2012-12-28 14:44:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 5超7 的主题更新
信息提示
请填处理意见