| 查看: 514 | 回复: 5 | |||
| 当前主题已经存档。 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[交流]
【原创】如何处理把一个文本转成数据 已有2人参与
|
|||
|
我是一个初学者,请高手赐教。 高手们可能都知道co-trainning算法中的数据集 course,里面有1051个事例(每个事例是一个网页),类标签是no course或者 course。 显然,这个文件(可以从tom michael指定的地方下载)不能直接放到我们的程序中(例如knn算法)运行,因为我们的程序只接受数字型的数据,而不是html格式的数据。 现在的问题是: 1,怎么把这1051个html文件(也就是1051个事例)包括他们相应的类标签转成一个txt文件,在txt文件里面只出现0,1,2,--9这样的数据呢? 2.有什么教材或者免费可以用吗? 非常着急,因为实验要马上开始了,不知道怎么处理 谢谢! |
» 猜你喜欢
26年申博自荐-计算机视觉
已经有4人回复
考博
已经有4人回复
药化及相关博士的申请
已经有3人回复
一篇MDPI论文改变了学习工作和生活
已经有4人回复
一个化合物的合成路线:CAS:367929-02-0 名称:8β-乙烯基雌二醇
已经有4人回复
太白金星有点烦
已经有3人回复
中国地质大学(北京)博士招生补录,数理学院材料科学与工程专业和材料与化工专业
已经有3人回复
收到国自然专家邀请后几年才会有本子送过来评
已经有3人回复
有没有快的中文核心比较快录用的,纳米材料光催化
已经有4人回复
4楼2009-11-07 13:53:47
bemoner
金虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 1161.2
- 散金: 12
- 红花: 1
- 帖子: 472
- 在线: 9.9小时
- 虫号: 852418
- 注册: 2009-09-20
- 专业: 信息安全
2楼2009-11-06 09:49:32
3楼2009-11-07 12:57:45
ltyong
木虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 7282.3
- 散金: 34
- 红花: 3
- 帖子: 428
- 在线: 628.1小时
- 虫号: 180331
- 注册: 2006-02-09
- 专业: 计算机应用技术
5楼2010-04-05 23:09:01












回复此楼