24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1128  |  回复: 10

junruiwang

新虫 (小有名气)

[求助] 求各位大神,perl 对特定范围内的数据求平均值已有1人参与

文件为:
Chr        Pos        Y
1        49820        -1.68855
1        54414        -1.55555
1        99585        -1.05338
1        103929        -0.523771
1        124119        -0.261121
1        200009        -0.1234
1        390189        2.2456
2        48625        0.0250024
2        88663        -0.659643
2        90128        -0.302134
2        122780        -0.366919
2        555583        -1.00859
想根据第一列和第二列的范围来求第三列的平均值,具体为:第二列的按照每100,000的长度来分组,把第三列求一个平均值,如果有些范围没有数值则写为0(如下)。想得到的结果是:
1  100,000    -1.432493333
1  200,000    -0.392446
1  300,000    -0.1234
1  400,000    2.2456
2  100,000    -0.3259234
2  200,000    0
2  300,000    0
2  400,000    0
2  500,000    0
2  600,000    -1.00859
其中100,000、200,000...代表0-100,000、100,000-200,000范围的意思。
求各位大神帮忙啦!
回复此楼

» 收录本帖的淘帖专辑推荐

程序

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

FMStation

至尊木虫 (知名作家)

【答案】应助回帖

[perl code]
# Program in Perl
use Data:umper;
use POSIX;
my @sumY, @numY;
open my $fh, '<', "output.txt" or
     die "could not open file: $!";
$line = <$fh>;
while (my $line = <$fh> {
    my($Chr, $Pos, $Y) =  split /\s+/, $line;
    $cPos = floor($Pos / 100000) ;
    $sumY[$Chr][$cPos]+=$Y;
    $numY[$Chr][$cPos]++;
}
for (my $j= 1; $j <= 2; $j++)
{
    for (my $i= 0; $i <= 5; $i++)
    {
        $range = ($i+1)*100000;
        if ( !defined $numY[$j][$i] )
           { $avg = 0; }
        else
           { $avg = $sumY[$j][$i] / $numY[$j][$i]; }
        print "$j $range $avg\n";
    }
}
close $fh;

[output]
1 100000 -1.43249333333333
1 200000 -0.392446
1 300000 -0.1234
1 400000 2.2456
1 500000 0
1 600000 0
2 100000 -0.3122582
2 200000 -0.366919
2 300000 0
2 400000 0
2 500000 0
2 600000 -1.00859
8楼2016-08-18 06:01:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

FMStation

至尊木虫 (知名作家)

看不懂

» 本帖已获得的红花(最新10朵)

2楼2016-08-17 17:52:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

FMStation

至尊木虫 (知名作家)

【答案】应助回帖

感谢参与,应助指数 +1
#!/usr/bin/perl
use warnings;
use strict;

my $sum = 0;
my $n = 0;
while (<> {
    $sum += $_;
    $n++;
}
print $sum/$n, "\n";

https://stackoverflow.com/questi ... averages-using-perl
3楼2016-08-17 18:09:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

FMStation

至尊木虫 (知名作家)

CODE:
#!/usr/bin/perl
use warnings;
use strict;

my $sum = 0;
my $n = 0;
while (<>) {
    $sum += $_;
    $n++;
}
print $sum/$n, "\n";

https://stackoverflow.com/questions/6906116/compute-averages-using-perl
4楼2016-08-17 18:10:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

James_ever

金虫 (文坛精英)

必须用这软件??
Take few risks early, the bonus following!科研MSN群:FutureChina@groups.live.com
5楼2016-08-17 19:07:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

junruiwang

新虫 (小有名气)

送红花一朵
引用回帖:
2楼: Originally posted by FMStation at 2016-08-17 17:52:51
看不懂

就是按照0-100000,100001-200000,200001-300000......这些范围(每100000长度)对第三列进行求平均值。每个范围求一个平均值输出哦
6楼2016-08-17 19:20:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

junruiwang

新虫 (小有名气)

引用回帖:
5楼: Originally posted by James_ever at 2016-08-17 19:07:00
必须用这软件??

或者用别的语言写也成,只要能实现就行哈
7楼2016-08-17 19:23:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

FMStation

至尊木虫 (知名作家)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ...
junruiwang: 金币+100, ★★★★★最佳答案, 感谢~ 2016-08-20 14:33:13
CODE:
~~~~~~code~~~~~~~~~
# Program in Perl
use Data::Dumper;
use POSIX;
my @sumY, @numY;
open my $fh, '<', "output.txt" or
     die "could not open file: $!";
$line = <$fh>;
while (my $line = <$fh>) {
    my($Chr, $Pos, $Y) =  split /\s+/, $line;
    $cPos = floor($Pos / 100000) ;
    $sumY[$Chr][$cPos]+=$Y;
    $numY[$Chr][$cPos]++;
}
for (my $j= 1; $j <= 2; $j++)
{
    for (my $i= 0; $i <= 5; $i++)
    {
        $range = ($i+1)*100000;
        if ( !defined $numY[$j][$i] )
           { $avg = 0; }
        else
           { $avg = $sumY[$j][$i] / $numY[$j][$i]; }
        print "$j $range $avg\n";
    }
}
close $fh;

~~~~Output~~~~~~
1 100000 -1.43249333333333
1 200000 -0.392446
1 300000 -0.1234
1 400000 2.2456
1 500000 0
1 600000 0
2 100000 -0.3122582
2 200000 -0.366919
2 300000 0
2 400000 0
2 500000 0
2 600000 -1.00859

» 本帖已获得的红花(最新10朵)

9楼2016-08-18 06:02:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

junruiwang

新虫 (小有名气)

引用回帖:
9楼: Originally posted by FMStation at 2016-08-18 06:02:35
~~~~~~code~~~~~~~~~
# Program in Perl
use Data:umper;
use POSIX;
my @sumY, @numY;
open my $fh, '<', "output.txt" or
     die "could not open file: $!";
$line = < ...

太感谢啦!关于自学perl,大神能否给指条明路啊?实验室只有我一个人刚开始学,感觉好费劲。。。

发自小木虫Android客户端
10楼2016-08-18 11:48:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 junruiwang 的主题更新
信息提示
请填处理意见