| 查看: 460 | 回复: 5 | |||
| 当前主题已经存档。 | |||
[交流]
【原创】如何处理把一个文本转成数据 已有2人参与
|
|||
|
我是一个初学者,请高手赐教。 高手们可能都知道co-trainning算法中的数据集 course,里面有1051个事例(每个事例是一个网页),类标签是no course或者 course。 显然,这个文件(可以从tom michael指定的地方下载)不能直接放到我们的程序中(例如knn算法)运行,因为我们的程序只接受数字型的数据,而不是html格式的数据。 现在的问题是: 1,怎么把这1051个html文件(也就是1051个事例)包括他们相应的类标签转成一个txt文件,在txt文件里面只出现0,1,2,--9这样的数据呢? 2.有什么教材或者免费可以用吗? 非常着急,因为实验要马上开始了,不知道怎么处理 谢谢! |
» 猜你喜欢
有没有人能给点建议
已经有5人回复
假如你的研究生提出不合理要求
已经有12人回复
实验室接单子
已经有7人回复
全日制(定向)博士
已经有5人回复
萌生出自己或许不适合搞科研的想法,现在跑or等等看?
已经有4人回复
Materials Today Chemistry审稿周期
已经有4人回复
参与限项
已经有3人回复
对氯苯硼酸纯化
已经有3人回复
所感
已经有4人回复
要不要辞职读博?
已经有7人回复
bemoner
金虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 1161.2
- 散金: 12
- 红花: 1
- 帖子: 472
- 在线: 9.9小时
- 虫号: 852418
- 注册: 2009-09-20
- 专业: 信息安全
2楼2009-11-06 09:49:32
3楼2009-11-07 12:57:45
4楼2009-11-07 13:53:47
ltyong
木虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 7282.3
- 散金: 34
- 红花: 3
- 帖子: 428
- 在线: 627.4小时
- 虫号: 180331
- 注册: 2006-02-09
- 专业: 计算机应用技术
5楼2010-04-05 23:09:01
6楼2010-04-06 11:35:57












回复此楼