| 查看: 474 | 回复: 5 | |||
| 当前主题已经存档。 | |||
[交流]
【原创】如何处理把一个文本转成数据 已有2人参与
|
|||
|
我是一个初学者,请高手赐教。 高手们可能都知道co-trainning算法中的数据集 course,里面有1051个事例(每个事例是一个网页),类标签是no course或者 course。 显然,这个文件(可以从tom michael指定的地方下载)不能直接放到我们的程序中(例如knn算法)运行,因为我们的程序只接受数字型的数据,而不是html格式的数据。 现在的问题是: 1,怎么把这1051个html文件(也就是1051个事例)包括他们相应的类标签转成一个txt文件,在txt文件里面只出现0,1,2,--9这样的数据呢? 2.有什么教材或者免费可以用吗? 非常着急,因为实验要马上开始了,不知道怎么处理 谢谢! |
» 猜你喜欢
同年申请2项不同项目,第1个项目里不写第2个项目的信息,可以吗
已经有4人回复
有时候真觉得大城市人没有县城人甚至个体户幸福
已经有10人回复
天津大学招2026.09的博士生,欢迎大家推荐交流(博导是本人)
已经有5人回复
有院领导为了换新车,用横向课题经费买了俩车
已经有5人回复
CSC & MSCA 博洛尼亚大学能源材料课题组博士/博士后招生|MSCA经费充足、排名优
已经有6人回复
面上项目申报
已经有3人回复
酰胺脱乙酰基
已经有9人回复
博士延得我,科研能力直往上蹿
已经有7人回复
面上基金申报没有其他的参与者成吗
已经有5人回复
遇见不省心的家人很难过
已经有22人回复
bemoner
金虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 1161.2
- 散金: 12
- 红花: 1
- 帖子: 472
- 在线: 9.9小时
- 虫号: 852418
- 注册: 2009-09-20
- 专业: 信息安全
2楼2009-11-06 09:49:32
3楼2009-11-07 12:57:45
4楼2009-11-07 13:53:47
ltyong
木虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 7282.3
- 散金: 34
- 红花: 3
- 帖子: 428
- 在线: 628.1小时
- 虫号: 180331
- 注册: 2006-02-09
- 专业: 计算机应用技术
5楼2010-04-05 23:09:01
6楼2010-04-06 11:35:57













回复此楼