24小时热门版块排行榜    

查看: 2813  |  回复: 10

qinform

木虫 (著名写手)

[求助] 天津超算安装vasp,编译看起来没有问题,运行出现错误 已有1人参与

天津超算安装vasp,编译看起来没有问题,运行出现错误:
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
MKL FATAL ERROR on loading the function mkl_blas_mc3_idamax.
yhrun: error: cn3969: tasks 0-11: Exited with exit code 1

编译成功之后曾经成功运行一次,第二天就错误百出比如缺少libmkl_blacs_intelmpi_lp64.so ,或者缺少libguide.so等。
目前就剩下这一个错误,不知道有人遇到没? 怎么解决的?

这里是ldd vasp 的结果,看起来不缺什么。
        linux-vdso.so.1 =>  (0x00007fff0b7d9000)
        libmkl_blacs_intelmpi_lp64.so => /vol6/intel_composer_xe_2013.0.079_lib/libmkl_blacs_intelmpi_lp64.so (0x00002b1ae4f41000)
        libguide.so => /vol6/lib/libguide.so (0x00002b1ae517a000)
        libpmi.so.0 => /usr/lib64/libpmi.so.0 (0x00002b1ae5327000)
        libpthread.so.0 => /lib64/libpthread.so.0 (0x0000003dfe400000)
        librt.so.1 => /lib64/librt.so.1 (0x0000003dfec00000)
        libuuid.so.1 => /lib64/libuuid.so.1 (0x0000003e08000000)
        libmkl_intel_lp64.so => /vol6/lib/libmkl_intel_lp64.so (0x00002b1ae552d000)
        libmkl_intel_thread.so => /vol6/intel_composer_xe_2013.0.079_lib/libmkl_intel_thread.so (0x00002b1ae5c7a000)
        libmkl_core.so => /vol6/lib/libmkl_core.so (0x00002b1ae6bee000)
        libiomp5.so => /vol6/lib/libiomp5.so (0x00002b1ae7de9000)
        libm.so.6 => /vol6/lib/libm.so.6 (0x0000003bd6e00000)
        libc.so.6 => /vol6/lib/libc.so.6 (0x0000003bd6600000)
        libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x0000003e09000000)
        libdl.so.2 => /lib64/libdl.so.2 (0x0000003dfe000000)
        libslurm.so.26 => /usr/lib64/libslurm.so.26 (0x00002b1ae7f90000)
        /lib64/ld-linux-x86-64.so.2 (0x0000003dfd800000)
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

jimsmart

捐助贵宾 (职业作家)

能够成功运行过一次,我觉得问题应该不大,那您就回忆一下成功之后到出问题这段时间的操作是什么,有没有可能影响程序执行的地方,作为一个反思式的参考.
    第二,解决不了的话,不如重新装系统和软件,因为您的硬件并没有问题,而这个软件对您来说是至关重要的.为了一个至关重要的目标,牺牲一些时间与精力还是值得的.
    祝您好运.
6楼2015-12-28 23:38:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qinform

木虫 (著名写手)

引用回帖:
8楼: Originally posted by obaica at 2016-03-11 22:36:51
楼主,天河超算那个错误,你最后怎么解决的,求赐教,谢谢!

把参数从头开始设置 ,貌似 就好了。
9楼2016-03-12 23:37:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qinform

木虫 (著名写手)

引用回帖:
8楼: Originally posted by obaica at 2016-03-11 22:36:51
楼主,天河超算那个错误,你最后怎么解决的,求赐教,谢谢!

实在不行 可以找他们的工作人员来安装
他们其实有安装好的,直接复制给你就好了
10楼2016-03-12 23:39:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

未岸亡灵

铁杆木虫 (著名写手)

暂时离开小木虫


【答案】应助回帖

★ ★
感谢参与,应助指数 +1
qinform: 金币+2, ★★★很有帮助 2015-12-28 20:40:26
最好提交作业的脚本里加一个source intel的mkl库的命令,和其他库的命令。
不然你去计算节点ldd vasp看有没有缺少库
2楼2015-12-28 20:26:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qinform

木虫 (著名写手)

引用回帖:
2楼: Originally posted by 未岸亡灵 at 2015-12-28 20:26:09
最好提交作业的脚本里加一个source intel的mkl库的命令,和其他库的命令。
不然你去计算节点ldd vasp看有没有缺少库

已经试了在提交作业的脚本里加一个source intel的mkl库的命令,和其他库的命令。
错误依然存在。
看了手册,不能直接登录计算节点
不过依然感谢给出建议
3楼2015-12-28 20:39:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

未岸亡灵

铁杆木虫 (著名写手)

暂时离开小木虫


【答案】应助回帖

★ ★ ★ ★
qinform: 金币+4, ★★★★★最佳答案 2015-12-28 21:05:48
引用回帖:
3楼: Originally posted by qinform at 2015-12-28 20:39:49
已经试了在提交作业的脚本里加一个source intel的mkl库的命令,和其他库的命令。
错误依然存在。
看了手册,不能直接登录计算节点
不过依然感谢给出建议...

把执行vasp命令的一行改成ldd [vasp路径] > log 写到提交提交作业的脚本里。其他不变,提交作业之后检查log文件看是否库是全的。
比如:
ldd /soft/vasp5.2-VTST/vasp.5.2/vasp > log

自然就能检查到计算节点vasp库的配置情况了
4楼2015-12-28 20:53:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qinform

木虫 (著名写手)

引用回帖:
4楼: Originally posted by 未岸亡灵 at 2015-12-28 20:53:48
把执行vasp命令的一行改成ldd  > log 写到提交提交作业的脚本里。其他不变,提交作业之后检查log文件看是否库是全的。
比如:
ldd /soft/vasp5.2-VTST/vasp.5.2/vasp > log

自然就能检查到计算节点vasp ...

按照你说的办法,确实查到了 库不全
        linux-vdso.so.1 =>  (0x00007fff297ee000)
        libmkl_blacs_intelmpi_lp64.so => not found
        libguide.so => not found
        libpmi.so.0 => /usr/lib64/libpmi.so.0 (0x00002b5a7e354000)
        libpthread.so.0 => /lib64/libpthread.so.0 (0x00000039c9e00000)
        librt.so.1 => /lib64/librt.so.1 (0x00000039ca600000)
        libuuid.so.1 => /lib64/libuuid.so.1 (0x00000039d4600000)
        libmkl_intel_lp64.so => not found
        libmkl_intel_thread.so => not found
        libmkl_core.so => not found
        libiomp5.so => /usr/lib64/libiomp5.so (0x00002b5a7e55b000)
        libm.so.6 => /lib64/libm.so.6 (0x00000039ca200000)
        libc.so.6 => /lib64/libc.so.6 (0x00000039c9a00000)
        libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000039d5600000)
        libdl.so.2 => /lib64/libdl.so.2 (0x00000039c9600000)
        libslurm.so.26 => /usr/lib64/libslurm.so.26 (0x00002b5a7e855000)
        /lib64/ld-linux-x86-64.so.2 (0x00000039c9200000)


刚刚发现,“提交作业的脚本里加一个source intel的mkl库的命令”可能我加错了,没加上,能不能告诉怎么加?
5楼2015-12-28 21:07:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qinform

木虫 (著名写手)

引用回帖:
6楼: Originally posted by jimsmart at 2015-12-28 23:38:26
能够成功运行过一次,我觉得问题应该不大,那您就回忆一下成功之后到出问题这段时间的操作是什么,有没有可能影响程序执行的地方,作为一个反思式的参考.
    第二,解决不了的话,不如重新装系统和软件,因为您的硬件并没 ...

可能的情况是我第一次安装和运行的时候环境变量设置正确了,当时也就是按照手册设的,因为当时比较晚了,就退出系统了。第二天早上怎么就运行不了了。然后就试着设置各种环境变量,软件可以重新编译,却运行不了。
感谢回复。
7楼2015-12-29 08:33:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

obaica

禁言 (著名写手)

送红花一朵
本帖内容被屏蔽

8楼2016-03-11 22:36:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 qinform 的主题更新
信息提示
请填处理意见