24小时热门版块排行榜    

查看: 622  |  回复: 4
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

bayou3

银虫 (正式写手)

[求助] 如何做实验?

各位学长,我想问下我们平时看完论文或者有idea后,是要如何做实验呢?
麻烦详细说说可以吗?

打个比方,比如我要做微博的极性分析(积极性、消极性),我是要先有词库吗,这个词库我要自己建吗?如果下载,我要去哪里下载呢?下载下来要怎么用呢?

有了词库后,我是要写程序(比如java程序)去分析手头上有的xml数据吗?给这些数据做分词?然后给这些做好分词的语句配合词库去分类出极性吗?
(如果是这样去写代码的话,程序的架构我要自己搭建是吗?)

我就是小白,希望会的同学帮我解答下,我说的只是例子,如果你是做别的方面的,按你做的方面的经验讲讲也可以呀。 非常感谢!
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

我要努力
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nwaxe

金虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
bayou3: 金币+20, 有帮助, 自己框架——这个是要自己掌握像Struts、Hibernate、Spring等的框架技术么? 2013-10-15 14:33:54
1. 词库,这是实验最基础的,我个人建议你去下载别人公布的benchmark, 建词库不是一两个人短时间能完成的,而且建的词库要保证有一定的普适性,实用性等等。这个工作一般由牛组,或者公司,专门研究机构完成。自己去弄,可能费力不讨好。
2. 如果你类似的想法,别人有code公布,是一件好事,但是你一定要把code的每一行代码都弄的很明白才能在此基础上修改。
3. 我还是建议你们建立自己的框架,我的建议是:数据库数据提取(转化成你们想要的数据结构形式),按照你们设计的算法分步实现,最好能一步一步的验证自己的编的程序是对的,这个过程可能比较磨人,因为有的时候你根本找不到参照知道自己的code是否正确,此时你就要保证每一行代码是按你的意思执行的就好了。
4. 最后,可能一个关键的步骤就是调参数了,程序一开始性能不佳,千万别急,多试试参数,多调整,慢慢性能就会上去的(我的经验,第一版程序性能都不佳)。
5. 自己编的框架,最大的优势就是能在此基础上做很多工作,自己的代码很了解,改起来得心应手。
加油祝好。
4楼2013-10-11 10:33:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 5 个回答

gorgan

木虫之王 (文学泰斗)

无意苦争春

【答案】应助回帖

感谢参与,应助指数 +1
先看文献,包括期刊文章和学位论文,看看别人是怎么做实验的,他们怎么建立词库,他们有没有已经编写好的代码工具
无我相,无人相,无众生相,无寿者相
2楼2013-10-10 16:05:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

DUTterence

金虫 (小有名气)

【答案】应助回帖

感谢参与,应助指数 +1
先看文献,然后模拟文献中的实验,看看能否得到文献中结果
走别人的路,让别人无路可走
3楼2013-10-11 08:38:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

feng1002

新虫 (初入文坛)

【答案】应助回帖

感谢参与,应助指数 +1
最简单的是找一个做过的人质询下
5楼2013-10-13 10:22:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见