24小时热门版块排行榜    

查看: 1823  |  回复: 2
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

yoyoiceman

新虫 (初入文坛)

[求助] torque集群管理软件 无法识别GPU

如题,我们实验室用Rocks+torque搭建了一个小型实验集群,一个服务节点和一个计算节点,其中计算节点有GPU,英伟达的quadro FX580,但是在驱动都安好的情况下,mom进程就是无法识别到GPU的存在,之前按照torque的官方手册配置,安装了cuda toolkit,结果没用,现在改用opencl,还是没用,网上有人说不需要特别配置,是要驱动安装成功就好了,可为什么我就不行呢,如果手动更改~/torque/server_priv/nodes文件的话,用pbsnodes命令可以显示出gpus=1,但是提交任务的时候如果指定需要一个GPU的话,还是会报错,说没有满足要求的计算节点,我现在怀疑是不是硬件的问题,应为实验室的显卡比较老,是上一代GPU产品了,求大神指教啊!!!!
        另外在根据官方手册配置的时候,他说需要一个nvml.h的头文件,但是我安装的cudatoolkit里面根本就没有这个头文件,是不是没有这个头文件就不行了呢,现在英伟达官网能下载到的cudatoolkit都不包含这个头文件,郁闷~~~
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cean

金虫 (职业作家)

屌绳一条

【答案】应助回帖


csgt0: 金币+1, 应助指数+1, 欢迎交流 2012-12-17 09:33:37
580支持cuda1•1,但可能不支持opencl
To do great work, you have to have a pure mind.
3楼2012-12-15 13:48:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 3 个回答

cean

金虫 (职业作家)

屌绳一条

很少有人提opencl呀
To do great work, you have to have a pure mind.
2楼2012-12-15 13:33:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见