24小时热门版块排行榜    

查看: 1598  |  回复: 10

seu-ljc

木虫 (正式写手)

[求助] python如何判定字符串的前几个字符是不是数字?

python如何判定字符串的前几个字符是不是数字?
捕获.JPG

如上图是一个txt的内容,楼主想要提取txt文件中的每一行数据
可是txt有的行里面不是想要的数据,楼主想要剔除这个行,楼主想请教各位达人,如何判定每一行的字符串的前几个字符是不是数字?

请诸位牛牛不吝赐教~

from pylab import *
import re

t=open('TH.txt','w')
fileHandle=open(1.txt','r')


line=fileHandle.readline()

while not('List' in line):
    line=fileHandle.readline()
done = 0

while not done:



        if line!='\n':
                line=fileHandle.readline()
                if line=='':
                        break
                #line = [ float( line ) for line in line if line ]
                temperaturetime=re.findall(r'\d*\.?\d+',line)
                print(temperaturetime[1])

                t.write('%f\n'% (float(temperaturetime[1])))
                #force1.append(float(force[1]))
        else:
                done=1



fileHandle.close()
t.close()
回复此楼

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : 1.txt
  • 2015-04-03 21:45:33, 240.44 K

» 收录本帖的淘帖专辑推荐

source

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

zeppe

金虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
seu-ljc: 金币+5, ★★★很有帮助 2015-04-04 10:36:42
seu-ljc: 金币+5, ★★★很有帮助 2015-04-05 11:54:25
if re.match('^\d', line):
   #doWhatYouWant
else:
   #this is the line doesn't start with number
2楼2015-04-04 09:17:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zeppe

金虫 (小有名气)

引用回帖:
3楼: Originally posted by seu-ljc at 2015-04-04 10:36:02
牛牛,这个难道不是判断此行有没有数字?不是判断此行前几位是不是数字开头吧?
请指教~...

^表示开头,按你这个文件只需要判断第一个字符是不是数字

[ 发自手机版 http://muchong.com/3g ]
9楼2015-04-05 10:14:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

seu-ljc

木虫 (正式写手)

引用回帖:
2楼: Originally posted by zeppe at 2015-04-04 09:17:37
if re.match('^\d', line):
   #doWhatYouWant
else:
   #this is the line doesn't start with number

牛牛,这个难道不是判断此行有没有数字?不是判断此行前几位是不是数字开头吧?
请指教~
3楼2015-04-04 10:36:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

me_yu

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
seu-ljc: 金币+10, ★★★很有帮助, 感谢牛牛的参与 2015-04-04 23:47:34
from pylab import *
import re

t=open('TH.txt','w')
fileHandle=open('1.txt','r')
line=fileHandle.readline()
while not('List' in line):
    line=fileHandle.readline()
done = 0
while not done:
        if line!='\n':
                line=fileHandle.readline()
                if line=='':
                        break
                temp = ''
                for i in line:
                    if i.isdigit() or i =='        ' or i == '\n':#每行拆分到每个字符判断就好了,不是数字的就排除
                        temp+=i#排除非数字后再重新组合
                t.write(temp)
        else:
                done=1
fileHandle.close()
t.close()

» 本帖已获得的红花(最新10朵)

听,寂静的夜里,田野里蛙声和虫鸣,好不欢快!
4楼2015-04-04 21:32:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

seu-ljc

木虫 (正式写手)

送红花一朵
引用回帖:
4楼: Originally posted by me_yu at 2015-04-04 21:32:37
from pylab import *
import re

t=open('TH.txt','w')
fileHandle=open('1.txt','r')
line=fileHandle.readline()
while not('List' in line):
    line=fileHandle.readline()
done = 0
while not done: ...

牛牛,按你的代码得出来的结果如下:
0287286028902920296028203170205082355
1287286028902920296028203170292082356
2287286028902920296028203180471082357
3288286028902920296028203180445082358
4288286028902920296028203180377082359
5288286028902920296028203180284082400
6287286028902920296028203170273082401
。。。

空格没有了。。。想要的结果是

0        28.7        28.60        28.90        29.20        29.60        28.20        31.70        20.50        8 23 55       
1        28.7        28.60        28.90        29.20        29.60        28.20        31.70        29.20        8 23 56       
2        28.7        28.60        28.90        29.20        29.60        28.20        31.80        47.10        8 23 57       
3        28.8        28.60        28.90        29.20        29.60        28.20        31.80        44.50        8 23 58       
4        28.8        28.60        28.90        29.20        29.60        28.20        31.80        37.70        8 23 59       
5        28.8        28.60        28.90        29.20        29.60        28.20        31.80        28.40        8 24 00       

还望送佛送到西~计算机大牛给的思路确实牛
5楼2015-04-04 23:50:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

me_yu

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
seu-ljc: 金币+10, ★★★很有帮助 2015-04-05 00:14:48
引用回帖:
5楼: Originally posted by seu-ljc at 2015-04-04 23:50:25
牛牛,按你的代码得出来的结果如下:
0287286028902920296028203170205082355
1287286028902920296028203170292082356
2287286028902920296028203180471082357
3288286028902920296028203180445082358
428828 ...

 if i.isdigit() or i =='        ' or i == '\n':#要保留什么字符在这里加进去就好了 比如还有点(.)和换行符就这样再加一个 i == '.' or i == '\n'

[ 发自小木虫客户端 ]

» 本帖已获得的红花(最新10朵)

听,寂静的夜里,田野里蛙声和虫鸣,好不欢快!
6楼2015-04-05 00:08:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

seu-ljc

木虫 (正式写手)

送红花一朵
引用回帖:
6楼: Originally posted by me_yu at 2015-04-05 00:08:21
 if i.isdigit() or i =='        ' or i == '\n':#要保留什么字符在这里加进去就好了 比如还有点(.)和换行符就这样再加一个 i == '.' or i == '\n'
...

经你点拨,我用了此句if i.isdigit() or i =='\t' or i == '.' or i=='\n':

得到结果如下:

0        28.7        28.60        28.90        29.20        29.60        28.20        31.70        20.50        82355       

后面的82355并没有分成 8   23  55?

我之前的方法temperaturetime=re.findall(r'\d*\.?\d+',line)可以实现结果8 23 55,可惜不能实现判定字符串的前几个字符是不是数字?

所以不知完全按你的思路,如何把82355 分开,后面要对这些数字进行处理,故而必须要将82355 分开~
7楼2015-04-05 00:18:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

me_yu

木虫 (正式写手)

引用回帖:
7楼: Originally posted by seu-ljc at 2015-04-05 00:18:27
经你点拨,我用了此句if i.isdigit() or i =='\t' or i == '.' or i=='\n':

得到结果如下:

0        28.7        28.60        28.90        29.20        29.60        28.20        31.70        20.50        82355       

后面的82355并没有分成 8   23  55?

我之前的方 ...

#稍微动下脑筋就可以解决的啊,代码如下:
from pylab import *
import re

t=open('TH.txt','w')
fileHandle=open('1.txt','r')
line=fileHandle.readline()
while not('List' in line):
    line=fileHandle.readline()
done = 0
while not done:
        if line!='\n':
                line=fileHandle.readline()
                if line=='':
                        break
                temp = ''
                temperaturetime=re.findall(r'\d*\.?\d+',line)
                line = line.replace(':',' ')#将冒号替换成空格
                for i in line:
                    if i.isdigit() or i =='        ' or i == '\n' or i == '.' or i ==' ':#将判断冒号条件改为空格条件
                        temp+=i
                t.write(temp)
        else:
                done=1
fileHandle.close()
t.close()

» 本帖已获得的红花(最新10朵)

听,寂静的夜里,田野里蛙声和虫鸣,好不欢快!
8楼2015-04-05 09:13:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

seu-ljc

木虫 (正式写手)

送红花一朵
引用回帖:
8楼: Originally posted by me_yu at 2015-04-05 09:13:31
#稍微动下脑筋就可以解决的啊,代码如下:
from pylab import *
import re

t=open('TH.txt','w')
fileHandle=open('1.txt','r')
line=fileHandle.readline()
while not('List' in line):
    line=fileHa ...

计算机大神不懂还没入门的非计算机专业忧伤。。。很多命令都不知道,就算知道也是不够灵活运用~
10楼2015-04-05 11:50:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 seu-ljc 的主题更新
信息提示
请填处理意见