24小时热门版块排行榜    

查看: 1773  |  回复: 31

jerkwin

专家顾问 (正式写手)

引用回帖:
9楼: Originally posted by dedream at 2012-10-03 21:31:04
http://www.cygwin.com/

准备明天安装一下cygwin

这个东西太大,如果你不是使用全部功能,只是用bash脚本的话,可以只装那些用得到的,那样的话,就是很小的一个bash环境,但使用没有问题。我就是这么做的。
11楼2012-10-03 21:43:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jerkwin

专家顾问 (正式写手)

引用回帖:
8楼: Originally posted by dedream at 2012-10-03 21:29:56
bash我没法交给别人用,最近的这个项目涉及到大量的数据测试,测试周期也比较长,还是感谢你。

我只会点简单的python,matlab和R,所以我再期待一下。。。呵呵...

不知道你的数据有多大,我没有处理过太大的,最大的只有几G。如果你的数据有上百G,我怀疑无论哪个语言都有点困难。做是可以做,但很耗时。那种情况下,只有想办法优化流程。我也认为,在这种情况下,效率最高的是awk、perl,不会是其他语言。
12楼2012-10-03 21:48:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jerkwin

专家顾问 (正式写手)

引用回帖:
10楼: Originally posted by dedream at 2012-10-03 21:32:46
另外,好奇一下,木虫和非木虫,有啥区别?
我一点都没感觉到呢》?

没啥,就和升级差不多。玩玩也没坏处。
13楼2012-10-03 21:49:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dedream

木虫 (正式写手)

引用回帖:
12楼: Originally posted by jerkwin at 2012-10-03 21:48:33
不知道你的数据有多大,我没有处理过太大的,最大的只有几G。如果你的数据有上百G,我怀疑无论哪个语言都有点困难。做是可以做,但很耗时。那种情况下,只有想办法优化流程。我也认为,在这种情况下,效率最高的是 ...

那倒是没有上G的数据,看来我得好好学学 bash了,再次感谢
从数据到结论
14楼2012-10-03 22:30:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

anntoy

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
dedream: 金币+10, 有帮助, 您能帮忙指点一下这个宏怎么写吗? 2012-10-05 11:32:56
昨天就想说来着,用excel的宏来做不也很容易吗
15楼2012-10-05 00:13:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dedream

木虫 (正式写手)

引用回帖:
15楼: Originally posted by anntoy at 2012-10-05 00:13:21
昨天就想说来着,用excel的宏来做不也很容易吗

您能帮忙指点一下这个宏怎么写吗?
从数据到结论
16楼2012-10-05 11:33:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

anntoy

木虫 (著名写手)

【答案】应助回帖

引用回帖:
16楼: Originally posted by dedream at 2012-10-05 11:33:15
您能帮忙指点一下这个宏怎么写吗?...

刚试了一下,你的前面的数据居然还带有秒,只是格式显示的时候去掉了……比较相等比总是不能相等,后来才发现……
晚上再给你上传吧
17楼2012-10-05 14:43:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dedream

木虫 (正式写手)

引用回帖:
17楼: Originally posted by anntoy at 2012-10-05 14:43:50
刚试了一下,你的前面的数据居然还带有秒,只是格式显示的时候去掉了……比较相等比总是不能相等,后来才发现……
晚上再给你上传吧...

后面的数据也带秒的。。。没法精确到秒了
比较时间,我也老是出错。。。
从数据到结论
18楼2012-10-05 14:54:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shinevip

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
dedream: 金币+20, 有帮助, 谢谢,我运行有点小问题,我再看看 2012-10-05 20:45:15
LZ改一下python 脚本里面文件名 就可以...

LST_in = open('lmh.txt', mode='r')
DES_out = open('cmpd_info.txt', mode='w')

for line in LST_in:

      LST_fields = line.split()
      number = LST_fields[0]

      DES_in = open('cmpd.txt', mode='r')

      for line in DES_in:

            DES_fields = line.split()
            compoundid = DES_fields[0]
            if compoundid == number:
               DES_out.writelines(line)

DES_in.close()
DES_out.close()
LST_in.close()
19楼2012-10-05 17:24:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

anntoy

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
dedream: 金币+50, ★★★很有帮助, “含量”不能在sheet2对应的行里显示吗? 2012-10-05 20:45:56
引用回帖:
18楼: Originally posted by dedream at 2012-10-05 14:54:00
后面的数据也带秒的。。。没法精确到秒了
比较时间,我也老是出错。。。...

打开之后按Alt+F11就能打开那个脚本了
表格的内容要按照sheet1那样的格式,可以往下面继续添加条件和数据,结果存放在sheet2,时间那一列你可能要修改一下显示的格式,如果需要修改存放数据的位置……你自己先看看吧,挺好改的
Book1.xls(38KB)
http://kuai.xunlei.com/d/GQOALAMQKITO?p=130497
20楼2012-10-05 19:39:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 dedream 的主题更新
信息提示
请填处理意见