24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1533  |  回复: 9
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xiezhancnu

木虫 (小有名气)

[求助] perl程序求助,请大神们赐教~~~

我现在有十个基因,附件里的两个文件分别是这十个基因任意两个之间的相关系数和p-alue的值,附件应该是很容易看懂的,呵呵~~,现在呢,我想改变一下输出的格式,将两个文件整合一下,输出成这种格式:
基因1              基因2               相关系数           p-value (这一行可有可无)
DR_2577      DR_A0328           0.81186                   0.0000000171
……
输出结果不算可有可无的第一行的话,应该总共有45行,就是这么一个程序~~
我觉得应该是说清楚了,呵呵~~若是哪里说的不够清楚的话,请大神们主动提出来,呵呵~~谢谢啦~~~
回复此楼

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : pvalue.csv
  • 2012-08-10 21:25:34, 11.5 K
  • 附件 2 : cor.xls
  • 2012-08-10 21:25:40, 12 K

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

herter

金虫 (著名写手)

楼上的程序写的很好啊;
另外给个建议,没有时间写整个程序的;
1,把输入数据放到txt中,不用excel,excel处理没做过,估计不会简单;excel中都放进去了,放到txt中应该不难;
2,每一行的数据之间用空格分隔,到时候程序分段数据,会很方便的;
3,如果3000多条数据,互相需要两两比较的话,计算量到了千万级别,如果每一次比较的速度慢的话,会需要几天时间才能算完一次;我曾经算过两两比较两个4k的基因组(调用外部blast程序);如果每一次速度很快,估计半小时内算完;
4,如果第一条中没有办法获取原始数据,就只好把excel数据直接复制放到txt中,把宽的空格替换成一个空格,然后就可以用perl读取数据和输出数据了;
5,不要等哪位大哥能直接写出程序来,没有这个时间和耐心的;自己做出应该不难;

» 本帖已获得的红花(最新10朵)

6楼2012-08-12 16:13:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 10 个回答

wizardfan

至尊木虫 (著名写手)

优秀版主

本来是想帮你的,但是以前帮过你以后,一点回音都没有http://muchong.com/bbs/viewthread.php?tid=4773466&fpage=1,我也建议别人不要帮助没有基本礼仪的人。
2楼2012-08-11 01:58:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiezhancnu

木虫 (小有名气)

引用回帖:
2楼: Originally posted by wizardfan at 2012-08-11 01:58:24
本来是想帮你的,但是以前帮过你以后,一点回音都没有http://muchong.com/bbs/viewthread.php?tid=4773466&fpage=1,我也建议别人不要帮助没有基本礼仪的人。

不是的,我晕~~,现在放假了,那几天家里有事回去了,我家农村的,家里又上不了网!在家带了十来天,就把那个帖子给忘了,平时小木虫上的又不多,请您不要生气了哈~~现在把金币给您~~晕~~·
3楼2012-08-11 09:30:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jackie1179

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
xiezhancnu: 金币+10 2012-08-11 09:45:21
xzhdty: 金币+1, 谢谢参与 2012-08-13 22:21:08
你的原始文件要保存为文本文档才好操作(用制表符分隔),因为用perl操作excel表格我也不会
CODE:
#!/usr/bin/perl

use warnings;

$cor_file = "cor.csv";
$pvalue_file = "pvalue.csv";
$out = "out";

undef %cor;
undef %pvalue;

open(COR,"$cor_file") || die "Cannot open this file$!";
=~ /(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)/;
for($i = 1; $i <= 10; $i++) {
  push @gene,$$i;
}
print @gene,"\n";
$cnt = 0;
while() {
  $cnt++;
  $_ =~ /^\S+\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)/;
  for($j = $cnt; $j < 10 ; $j++ ) {
    $cor{$gene[$cnt - 1],$gene[$j]} = ${$j + 1};
  }
}
close COR;

foreach (sort keys %cor) {
  print $_,"=>","$cor{$_}\n";
}

open(PVALUE,"$pvalue_file") || die "Cannot open this file$!";
;
$cnt = 0;
while() {
  $cnt++;
  $_ =~ /^\S+\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)\t(\S+)/;
  for($j = $cnt; $j < 10; $j++) {
    $pvalue{$gene[$cnt - 1],$gene[$j]} = ${$j + 1};
  }
}
close PVALUE;

open(OUT,">$out") || die "Cannot write to this file$!";
print OUT "gene1\tgene2\tcorrelation efficient\t p-value\n";
for($i = 0; $i < 10; $i++) {
  for($j = 0; $j < 10; $j++) {
    if(exists $cor{$gene[$i],$gene[$j]}) {
      printf OUT "%-8s\t%-8s\t%8s\t%8s\n",$gene[$i],$gene[$j],$cor{$gene[$i],$gene[$j]},$pvalue{$gene[$i],$gene[$j]};
    }
  }
}

close OUT;

4楼2012-08-11 09:32:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见