24小时热门版块排行榜    

查看: 399  |  回复: 5
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

imation

铁杆木虫 (正式写手)

[交流] 【求助】discover计算的问题

利用discover模拟扩散遇到问题,请教各位

设置计算时间为10000ps,可是每次算到7700-8000ps时,客户端的显示没有任何变化,就是status里面的文本没有变化,能量、温度等都不变化,服务端的cpu照常运行,100%利用,gateway的job也没有上传下载,无任何错误提示。

我的配置情况

服务端
rhel5,防火墙关闭了,无杀毒软件
ms4.2

客户端
winxp sp3,windows自带防火墙,kav
ms4.3

计算步长为1fs,体系中有近4000个原子,nve

test gateway显示如下信息(请见附图)

Start tests for host 192.168.1.3, port 18888
Initialize windows sockets...
Look up IP address for 192.168.1.3...
IP address is 192.168.1.3
Ping the host...
Ping result= 0   ( IP: Success )
Ping round trip time was 0 msecs
Test connection to http://192.168.1.3:18888/ ...
Error in http test:
Invalid procedure call or argument
Tests failed

但是可以计算

搜索了帮助文件,在Installing Materials Studio on Linux systems的troubleshooting中看到
1. There is excessive network traffic between the Materials Studio client and the gateway server.
2. On clusters, Discover jobs may indefinitely remain in the queued or running state even though it is clear from the queuing system that the queued job has long since finished.
第一点,我修改那个MinimumPollingInterval从1s到5s
第二点,我不是cluster,也不是很懂这个

这个问题困扰我很久了,请教大家,谢谢

[ Last edited by freshgirl on 2009-6-26 at 16:29 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

saitou

木虫 (正式写手)

★ ★ ★ ★
csfn(金币+4,VIP+0):qqq
我怎么觉得像是你的网络问题呢,不知道MS文件传输的部分是什么原理,如果文件很大也是需要些时间的
通讯失败的原因不明,因为我也碰到过,但是不知怎么就好了,我怀疑是网络不稳定造成的:虽然我使用的是单机,但是地址是DHCP分配的,而且局域网经常收到各类攻击,造成不可预料的后果。后来改用localhost:18888为gateway就好了,你考虑分配一个私有网段给连接的所有机器,是不是会稳定些。如有必要可以专设一台出外网

说实话,我想出问题也没条件啊,就1台机子还能出什么问题
不抛弃,不放弃
5楼2008-07-10 09:12:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 6 个回答

imation

铁杆木虫 (正式写手)

发现一个问题

我修改了gateway里面的polling interval为5000(原来2000),discover的setup标签页里面,选择gateway,然后点more,把live update设成5(原来2),可是我发现server console里面的job information显示的interval还是2000msec,upload/download更新的频率是10秒钟,status文本里面的更新频率也是10秒

还有,我在添加gateway时明明设置了timeout为9999,但是通过浏览器查看gateway数据显示timeout是90

添加gateway时,我点击test gateway没有任何错误,添加完成后再test gateway,却出现错误提示
Error in http test:
Invalid procedure call or argument
Tests failed

还有linux服务器是双网卡,有eth0(192.168.1.3)和eth1(192.168.1.4),两个都可以通过浏览器查看gateway信息,也都可以在server console里面添加,不知道有什么分别
我看到帮助文件里面说
For a cluster with one external and one internal network, the names eth0 and eth1 respectively are typically used.
可是我是单机,不是cluster
2楼2008-07-08 17:12:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

saitou

木虫 (正式写手)

★ ★ ★
csfn(金币+3,VIP+0):qqq
1. 关了客户端,再开启时会有任务进行中、重连接的提示,此时客户端的显示有变化吗?

2. 设置对不上可能是要通过服务端设置的原因——没试过,我猜的

3. 2个网卡没什么用,除非可以做链路聚合,那也只是提高网络运行效率而已,对计算没有帮助。但你可以把2个网卡放在两个不同局域网段里当然 对计算还是没什么用的

[ Last edited by saitou on 2008-7-8 at 19:15 ]
不抛弃,不放弃
3楼2008-07-08 19:10:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

imation

铁杆木虫 (正式写手)

又见老兄,上次也是你热心回复我,谢谢!

我每次都是强行结束,如果选择从服务端下载数据,然后发现要等好久才能完成,经常能把客户端差不多拖死
也试过重启一下软件,显示有job正在running,问要不要重连,结果是要连很久也无反应,最后来个communication failed

我是修改的服务端,参照gateway说明设置的,不明白

我两块网卡,但是只有一块接了网线的,好像单网卡的机器上装linux也有eth0和eth1的

头疼啊,为何别人就没遇到这样的问题呢,难道大家的计算时间都没有超过10000ps的或者计算体系都比较小?
4楼2008-07-09 00:16:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见