24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2030  |  回复: 26

cavediger

金虫 (正式写手)


xueht987: 金币+1, 鼓励交流! 2012-08-12 10:27:04
引用回帖:
10楼: Originally posted by aylixmut at 2012-08-11 17:18:51
谢谢,我试了也不行,看来我也是属于后者,有的折腾啊。谢谢...

那就直接换PGI吧
不过,修改里面的一些参数,应该能解决问题,只是不愿折腾。
网上有建议下面方法的,不妨试一下(没有亲测):
1.建一文件limits.c,内容如下:
#include
#include
#include
void stacksize_()
{
int res;
struct rlimit rlim;

getrlimit(RLIMIT_STACK, &rlim);
printf("Before: cur=%d,hard=%d\n",(int)rlim.rlim_cur,(int)rlim.rlim_max);

rlim.rlim_cur=RLIM_INFINITY;
rlim.rlim_max=RLIM_INFINITY;
res=setrlimit(RLIMIT_STACK, &rlim);

getrlimit(RLIMIT_STACK, &rlim);
printf("After: res=%d,cur=%d,hard=%d\n",res,(int)rlim.rlim_cur,(int)rlim.rlim_max);
}
在main.f的开头,加入
CALL stacksize();

And in the makefile add limit.o at the end of the variable SOURCE
and add

limit.o: limit.c
cc -c -Wall -O2 limit.c
然后编译

2.也有说在.bashrc中加入ulimit -s unlimited,之后重新登陆就能解决了。

仅供参考

» 本帖已获得的红花(最新10朵)

我们都老得太快,却聪明得太迟。当我一路跌跌撞撞登上山巅,蓦然发现,本来就有一条笔直的路,直达山顶....
11楼2012-08-11 17:43:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gongjijun

木虫 (正式写手)

【答案】应助回帖


感谢参与,应助指数 +1
xueht987: 金币+1, 鼓励交流! 2012-08-12 10:27:15
ulimit -d unlimited
ulimit -m unlimited
ulimit -s unlimited
ulimit -v unlimited

试一下
12楼2012-08-12 09:52:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

aylixmut

铜虫 (小有名气)

送鲜花一朵
引用回帖:
11楼: Originally posted by cavediger at 2012-08-11 17:43:43
那就直接换PGI吧
不过,修改里面的一些参数,应该能解决问题,只是不愿折腾。
网上有建议下面方法的,不妨试一下(没有亲测):
1.建一文件limits.c,内容如下:
#include <sys/time.h>
#include <s ...

谢谢,.bashrc中加入ulimit -s unlimited,这个方法很早用过没有用,
准备也用pgi编译,已经成功安装pgi
13楼2012-08-12 11:02:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

魔鬼中的天使

金虫 (小有名气)

【答案】应助回帖


感谢参与,应助指数 +1
WDD880227: 金币+1, 多谢提示 2012-08-13 19:02:58
试一试,改用单节点计算是什么结果?
看看是否还是同样的错误
14楼2012-08-13 01:00:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

aylixmut

铜虫 (小有名气)

引用回帖:
14楼: Originally posted by 魔鬼中的天使 at 2012-08-13 01:00:41
试一试,改用单节点计算是什么结果?
看看是否还是同样的错误

谢谢,一样的哦。有改用过单节点计算。
真是没辙了。很奇怪哦。
15楼2012-08-13 07:52:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

引用回帖:
15楼: Originally posted by aylixmut at 2012-08-13 07:52:05
谢谢,一样的哦。有改用过单节点计算。
真是没辙了。很奇怪哦。...

电脑是什么配置的?
思想重于技巧,内涵重于表象
16楼2012-08-13 22:40:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

aylixmut

铜虫 (小有名气)

引用回帖:
16楼: Originally posted by souledge at 2012-08-13 22:40:53
电脑是什么配置的?...

系统采用SUN刀片服务器集群结构,总计使用62颗4路2.33GHz Intel Xeon处理器,2颗2路AMD处理器,84G内存,24TB存储空间。

互联网络:千兆以太网
存储容量:总计24TB,由SUN FireX4500网络存储系统构成,内含48块500GB SATA硬盘
管理节点:由1台SUN X6250构成,配置为1颗intel Xeon E5410四核CPU,4G内存
登录节点:由1台SUN X6250构成,配置为1颗intel Xeon E5410四核CPU,4G内存。目前登录节点已与校园网互联,可实现校内用户的远程访问
计算节点:由位于两组SUN Blade6000刀片机箱的15台SUN X6250刀片服务器组成,每台配置2颗intel Xeon E5410四核CPU,4G内存,
理论计算峰值:1.1184 TFLOPs(1.1184万亿次每秒)
17楼2012-08-14 08:10:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

引用回帖:
17楼: Originally posted by aylixmut at 2012-08-14 08:10:35
系统采用SUN刀片服务器集群结构,总计使用62颗4路2.33GHz Intel Xeon处理器,2颗2路AMD处理器,84G内存,24TB存储空间。

互联网络:千兆以太网
存储容量:总计24TB,由SUN FireX4500网络存储系统构成,内含48块 ...

哇~土豪级的计算资源啊,羡慕嫉妒恨啊……
既然是intel平台的,那碰上intel编译器的兼容问题的可能并不大。LZ可以考虑使用单节点多核心并行,并且计算时保存所有输出数据:mpirun -n ?? vasp >& LOGCAR
然后看LOGCAR中具体的报错。LZ的报错信息看不出是MPI的问题还是VASP的问题来~
思想重于技巧,内涵重于表象
18楼2012-08-14 12:37:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ghlhsiao

木虫 (初入文坛)

有可能是記憶體不夠
可以monitor 記憶體locate 過程是不是已經增加到極限後,  就跳掉了
19楼2012-08-14 15:13:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

aylixmut

铜虫 (小有名气)

引用回帖:
18楼: Originally posted by souledge at 2012-08-14 12:37:22
哇~土豪级的计算资源啊,羡慕嫉妒恨啊……
既然是intel平台的,那碰上intel编译器的兼容问题的可能并不大。LZ可以考虑使用单节点多核心并行,并且计算时保存所有输出数据:mpirun -n ?? vasp >& LOGCA ...

服务器是学校的,我只是用户,初接触集群,就碰到这个问题不让计算。挺郁闷的哦
LOGCAR的提示错误信息跟我前面贴的是一样的。
mpich应该没问题,我们管理员反复测试过了哦
20楼2012-08-14 15:58:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 aylixmut 的主题更新
信息提示
请填处理意见