24小时热门版块排行榜    

查看: 3776  |  回复: 19

valenhou001

至尊木虫 (职业作家)

【答案】应助回帖

★ ★
franch(金币+2): 谢谢回帖交流 2011-05-16 20:07:35
hnuzhoulin(金币+10): 2011-06-03 10:32:10
ifort的静态链接选项:  -i-static
pgi的pgf90的静态链接选项: -Bstatic

或者用man ifort, man pgf90查一下。
11楼2011-05-15 15:22:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

引用回帖:
Originally posted by valenhou001 at 2011-05-14 21:58:06:
在makefile中增加"静态链接"的选项,以得到静态链接编译的vasp模块,
或者将在~/.bashrc文件中把该库所在的路径加到LD_LIBRARY_PATH环境变量的附值中。
或者在运行作业的脚步文件中通过export 的方式 ...

你好,一个奇怪问题,我使用两个节点八个核可以提交
我用一个节点四个核就提交不上去。log如下
There are no available nodes allocated to this job. This could be because
no nodes were found or all the available nodes were already used.

Note that since the -nolocal option was given no processes can be
launched on the local node.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
A daemon (pid unknown) died unexpectedly on signal 1  while attempting to
launch so we are aborting.

There may be more information reported by the environment (see above).

This may be because the daemon was unable to find all the needed shared
libraries on the remote node. You may set your LD_LIBRARY_PATH to have the
location of the shared libraries on the remote nodes and this will
automatically be forwarded to the remote nodes.


这是什吗情况?需要mkl和openmpi在所哟计算节点上安装吗?我的家目录在各个节点上是可见的啊!
12楼2011-05-15 15:26:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

valenhou001

至尊木虫 (职业作家)


franch(金币+1): 谢谢回帖交流 2011-05-16 20:07:47
最好能把你提交作业的脚本文件的内容,以及nodes的文件或machinefile的文件的内容贴出来。还有是用什么mpi?(openmpi, mpich2或其他的?)
13楼2011-05-15 16:43:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ifmc1234

木虫 (著名写手)

【答案】应助回帖


mazuju028(金币+1): 谢谢交流 2011-05-15 18:52:31
引用回帖:
Originally posted by hnuzhoulin at 2011-05-12 21:14:53:
在诸位重虫友的帮助下,vasp编译通过了,在rocks前台计算,一切正常,

当我用qsub命令提交到后台时,却提示如下错误
host:
GPU-compute-2-0
GPU-compute-2-0
GPU-compute-2-0
GPU-compute-2-0
GPU-comp ...

回答你9楼提的问题
这和你说openmpi没什么关系,库找不到是因为没有把库的路径给出来。
我是在脚本中加这样一行
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/intel/mkl/10.2.5.035/lib/em64t
这样就可以了
14楼2011-05-15 17:36:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

引用回帖:
Originally posted by valenhou001 at 2011-05-15 16:43:32:
最好能把你提交作业的脚本文件的内容,以及nodes的文件或machinefile的文件的内容贴出来。还有是用什么mpi?(openmpi, mpich2或其他的?)

这是我的脚本文件
#!/bin/bash
#
#PBS -l nodes=1:ppn=4
#PBS -j oe
#PBS -V
#PBS -e vasp.err
#PBS -o vasp.log
#PBS -m abe
#PBS -q default
### 程序使用总内存3500MB
#PBS -l mem=5000mb  
### 程序使用总虚存3500MB
#PBS -l vmem=7500mb
### 单进程使用虚存 1700MB
#PBS -l pvmem=900mb

# go to work dir
cd $PBS_O_WORKDIR

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/intel/Compiler/11.1/075/mkl/lib/em64t/:/home/zhoulin/openmpi-1.4.3/lib/ ##---这时后面加的
# The program we want to execute (modify to suit your setup)
EXEC=./vasp-20110516-0901
# Intel MPI Home
MPI_HOME=/home/zhoulin/openmpi-1.4.3
# setup hostfile
cat $PBS_NODEFILE >> $PBS_JOBID-$PBS_JOBCOOKIE.hosts
echo "host: "
cat $PBS_JOBID-$PBS_JOBCOOKIE.hosts
echo "---------------------------"
# setup Nums of Processor
NP=`cat $PBS_NODEFILE|wc -l`
echo "Numbers of Processors:  $NP"
echo "---------------------------"

#$MPI_HOME/bin/mpirun -nolocal -machinefile $PBS_JOBID-$PBS_JOBCOOKIE.hosts  -np $NP $EXEC
$MPI_HOME/bin/mpirun -nolocal -machinefile $PBS_JOBID-$PBS_JOBCOOKIE.hosts  -np $NP $EXEC > screen.out

# clean
rm -rf $PBS_JOBID-$PBS_JOBCOOKIE.hosts

nodes文件是这个脚本生成的,我用的是rocks,用的家目录下面的安装的openmpi-1.4.3

很奇怪啊,当我用#PBS -l nodes=1:ppn=4,一个结点四个核计算时有错误,如楼上的,用#PBS -l nodes=2:ppn=4时就没问题啊。
15楼2011-05-16 09:19:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

引用回帖:
Originally posted by ifmc1234 at 2011-05-15 17:36:53:
回答你9楼提的问题
这和你说openmpi没什么关系,库找不到是因为没有把库的路径给出来。
我是在脚本中加这样一行
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/intel/mkl/10.2.5.035/lib/em64t
这样就可以了

我加了的啊,见楼下的回复。
还是一样的问题,两个节点算没问题,一个结点算问题如下,提示:

--------------------------------------------------------------------------
There are no available nodes allocated to this job. This could be because
no nodes were found or all the available nodes were already used.

Note that since the -nolocal option was given no processes can be
launched on the local node.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
A daemon (pid unknown) died unexpectedly on signal 1  while attempting to
launch so we are aborting.

There may be more information reported by the environment (see above).

This may be because the daemon was unable to find all the needed shared
libraries on the remote node. You may set your LD_LIBRARY_PATH to have the
location of the shared libraries on the remote nodes and this will
automatically be forwarded to the remote nodes.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that the job aborted, but has no info as to the process
that caused that situation.
--------------------------------------------------------------------------
mpirun: clean termination accomplished
16楼2011-05-16 09:20:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ifmc1234

木虫 (著名写手)

【答案】应助回帖

★ ★
hnuzhoulin(金币+5): 谢谢您的回复。中间机房因为种种原因跳闸了一次,也许有什么系统文件坏掉了。 2011-05-16 14:28:15
franch(金币+2): 谢谢回帖交流 2011-05-16 20:08:21
引用回帖:
Originally posted by hnuzhoulin at 2011-05-16 09:20:38:
我加了的啊,见楼下的回复。
还是一样的问题,两个节点算没问题,一个结点算问题如下,提示:

--------------------------------------------------------------------------
There are no available nod ...

这是我想是你rock系统没设好的问题。
和你提的找不到库没关了。
这个问题比较多。
你们自己组建的rock系统?
mpirun测试过没?
17楼2011-05-16 13:45:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

好吧,我结贴算了。
这个问题其他方法解决
使用mpich来安装
18楼2011-05-27 09:30:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hanson418

新虫 (初入文坛)

集群有问题,libmkl_lapack.so 没有共享出去,在集群中的其他机子找不到libmkl_lapack.so
19楼2014-01-10 14:08:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我爱天津

金虫 (正式写手)

引用回帖:
7楼: Originally posted by liuds7792 at 2011-05-14 12:27:02
集群有问题,libmkl_lapack.so 没有共享出去,在集群中的其他机子找不到libmkl_lapack.so

怎么设置才能让它找着呢
20楼2014-08-16 14:19:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 hnuzhoulin 的主题更新
信息提示
请填处理意见