| 查看: 443 | 回复: 5 | |||
| 当前主题已经存档。 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[交流]
【原创】如何处理把一个文本转成数据已有2人参与
|
|||
|
我是一个初学者,请高手赐教。 高手们可能都知道co-trainning算法中的数据集 course,里面有1051个事例(每个事例是一个网页),类标签是no course或者 course。 显然,这个文件(可以从tom michael指定的地方下载)不能直接放到我们的程序中(例如knn算法)运行,因为我们的程序只接受数字型的数据,而不是html格式的数据。 现在的问题是: 1,怎么把这1051个html文件(也就是1051个事例)包括他们相应的类标签转成一个txt文件,在txt文件里面只出现0,1,2,--9这样的数据呢? 2.有什么教材或者免费可以用吗? 非常着急,因为实验要马上开始了,不知道怎么处理 谢谢! |
» 猜你喜欢
真诚求助:手里的省社科项目结项要求主持人一篇中文核心,有什么渠道能发核心吗
已经有8人回复
寻求一种能扛住强氧化性腐蚀性的容器密封件
已经有5人回复
论文投稿,期刊推荐
已经有6人回复
请问哪里可以有青B申请的本子可以借鉴一下。
已经有4人回复
孩子确诊有中度注意力缺陷
已经有14人回复
请问下大家为什么这个铃木偶联几乎不反应呢
已经有5人回复
请问有评职称,把科研教学业绩算分排序的高校吗
已经有5人回复
2025冷门绝学什么时候出结果
已经有3人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
3楼2009-11-07 12:57:45
bemoner
金虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 1161.2
- 散金: 12
- 红花: 1
- 帖子: 472
- 在线: 9.9小时
- 虫号: 852418
- 注册: 2009-09-20
- 专业: 信息安全
2楼2009-11-06 09:49:32
4楼2009-11-07 13:53:47
ltyong
木虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 7282.3
- 散金: 34
- 红花: 3
- 帖子: 428
- 在线: 626.4小时
- 虫号: 180331
- 注册: 2006-02-09
- 专业: 计算机应用技术
5楼2010-04-05 23:09:01













回复此楼