| 查看: 404 | 回复: 1 | |||
| 本帖产生 1 个 翻译EPI ,点击这里进行查看 | |||
[求助]
一段话,求翻译为英语
|
|||
|
目前,大多数监督标注方法在大规模语料环境中可以获得较好的效果,但 标注语料资源在实际应用中既难以获取,也难具有通用性。本文提出基于A方法的原型模式扩展算法: 首先,使用初始小规模训练数据构造一定准确率的一体化标注器。 其次,利用A 算法自动扩展训练数据。从未标记数据中预测出候选实例,把 数值大于某个域值的数据加入训练集。 最后,通过训练数据中存在的约束来对噪声进行剪辑。并使用扩展后的训练 数据重新迭代训练分类器,直到最终趋于稳定迭代终止。 |
» 猜你喜欢
表哥与省会女结婚,父母去帮带孩子被省会女气回家生重病了
已经有12人回复
依托企业入选了国家启明计划青年人才。有无高校可以引进的。
已经有14人回复
江汉大学解明教授课题组招博士研究生/博士后
已经有3人回复
AI 太可怕了,写基金时,提出想法,直接生成的文字比自己想得深远,还有科学性
已经有11人回复
依托企业入选了国家启明计划青年人才。有无高校可以引进的。
已经有11人回复
起沃尔特与
木虫 (小有名气)
- 翻译EPI: 1
- 应助: 4 (幼儿园)
- 金币: 3270.3
- 红花: 1
- 帖子: 290
- 在线: 191.5小时
- 虫号: 2204688
- 注册: 2012-12-25
- 性别: MM
- 专业: 临床药理
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
yuxintian: 金币+50, 翻译EPI+1 2013-03-21 14:37:36
yuxintian: 金币+50, 翻译EPI+1 2013-03-21 14:37:36
|
At present, most of the supervision and labeling methods can achieve good effect in the large-scale corpus environment , but in a real world application, tagging corpus resources is not only difficult to obtain, hard also to be versatile. In this article, we present a prototype model extension algorithma based on A-method: First of all, using the original small-scale training data conducts integration annotators with a certain accuracy rate. Secondly, useing the A-algorithm expands the training data automatically. To predict the candidate example among untagged data, then the numerical data which is greater than a certain thresholdto should join in a training set . Finally, in line with the constraints existed in training data cutting the noise for clips. And using the training data after extension to afresh the training classifier iteratively, until approaching the final stable iteration. |

2楼2013-03-21 08:52:35













回复此楼