| 查看: 477 | 回复: 5 | |||
| 当前主题已经存档。 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[交流]
【原创】如何处理把一个文本转成数据 已有2人参与
|
|||
|
我是一个初学者,请高手赐教。 高手们可能都知道co-trainning算法中的数据集 course,里面有1051个事例(每个事例是一个网页),类标签是no course或者 course。 显然,这个文件(可以从tom michael指定的地方下载)不能直接放到我们的程序中(例如knn算法)运行,因为我们的程序只接受数字型的数据,而不是html格式的数据。 现在的问题是: 1,怎么把这1051个html文件(也就是1051个事例)包括他们相应的类标签转成一个txt文件,在txt文件里面只出现0,1,2,--9这样的数据呢? 2.有什么教材或者免费可以用吗? 非常着急,因为实验要马上开始了,不知道怎么处理 谢谢! |
» 猜你喜欢
依托企业入选了国家启明计划青年人才。有无高校可以引进的。
已经有14人回复
江汉大学解明教授课题组招博士研究生/博士后
已经有3人回复
AI 太可怕了,写基金时,提出想法,直接生成的文字比自己想得深远,还有科学性
已经有11人回复
依托企业入选了国家启明计划青年人才。有无高校可以引进的。
已经有11人回复
ltyong
木虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 7282.3
- 散金: 34
- 红花: 3
- 帖子: 428
- 在线: 628.1小时
- 虫号: 180331
- 注册: 2006-02-09
- 专业: 计算机应用技术
5楼2010-04-05 23:09:01
bemoner
金虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 1161.2
- 散金: 12
- 红花: 1
- 帖子: 472
- 在线: 9.9小时
- 虫号: 852418
- 注册: 2009-09-20
- 专业: 信息安全
2楼2009-11-06 09:49:32
3楼2009-11-07 12:57:45
4楼2009-11-07 13:53:47













回复此楼