| 查看: 508 | 回复: 1 | |||
[交流]
非平衡文本数据集标注相关问题 已有1人参与
|
大家好! 小弟做的研究内容是文本的情感分类领域的问题, 因为之前没有人做过相关的工作,因此数据集需要自己来标注数据。 目前标注了其中一小部分数据后,发现数据非常不平衡,大概积极:消极:中性 = 5:1:94 的比例 。因此标注数据的速度特别慢,而且数据很不平衡,大家有什么推荐的方法呢?经费有限,所以估计请很多人标注不太行,~麻烦大家帮忙出出主意![]() ![]() |
» 猜你喜欢
河北省自然科学基金
已经有6人回复
青B发送上会通知了吗
已经有7人回复
博士申请
已经有3人回复
26/27申博自荐
已经有5人回复
某211大学教师把个人教师官方主页改成:我跑了我跑了我跑了!官宣跑路!
已经有4人回复
今年审到国自然15份,谈谈感受
已经有28人回复
投稿求助,期刊
已经有8人回复
献血感触
已经有13人回复
面上本子正文33页,违规吗?会被低分嘛?
已经有16人回复
国自然评分
已经有5人回复
2楼2017-02-25 10:04:41












。因此标注数据的速度特别慢,而且数据很不平衡,大家有什么推荐的方法呢?经费有限,所以估计请很多人标注不太行,~麻烦大家帮忙出出主意
回复此楼
10