24小时热门版块排行榜    

查看: 350  |  回复: 1

sjtu2012

银虫 (著名写手)

[交流] 高校学者应与国外知名IT公司的研究院强强合作,努力让研究有实际价值已有1人参与

不久前,香港科技大学计算机科学及工程学系助理教授易珂博士以访问学者的身份来访了惠普中国研究院,并与惠普中国研究院的研究人员与实习生们度过了两周愉快的工作时光。在一个阳光明媚的午后,我们和易珂博士进行了一次愉快的交流,并了解到易珂博士目前主要的研究领域以及他与惠普中国研究院的合作经历。     

    易珂博士2001毕业于清华大学计算机系,之后赴美国杜克大学继续攻读,并于2006年取得博士学位。毕业后,易珂博士在美国AT&T实验室工作了一年,2007年起在香港科技大学计算机科学及工程学系任教。目前,易珂博士的研究领域是海量数据算法与实践。具体来说,就是对大规模数据处理问题先从理论上设计算法,分析其通讯复杂度、时间复杂度以及空间复杂度,然后在单机及分布式环境下实现原型和进行实验。
    “这次我和中国惠普研究院的合作,主要涉及了两个课题,其中之一就是这里的强项:机器学习。”易珂博士告诉我们。“第一个项目是惠普“聪明打印”应用的延伸,它在加载在微软Bing工具条上的应用。现在我们在网页上打印内容的时候,并不用打印全部内容,因为现在页面上广告之类不太相关的东西很多。我们要打印的可能只是一小部分,比如新闻的正文,网购的确认单等,这样做不仅省纸、省墨,同时也保护环境。而现在打印的范围基本上都是自己来圈,我们想做的就是一个延伸,通过以前用户打印的相似网页,从以前用户的选择区域来预测新的页面哪些部分值得打印,然后推荐给用户。这也是一个自学习的过程,目标就是尽量做到准确。目前这个项目还处在实验室的研究阶段,但前景非常好。现在我们做成了一个ToolBar的形式在浏览器上供用户下载安装,已经有了上百万的下载量。但目前只能让用户自己选择打印的范围,未来我们会逐渐推出智能预测的功能。”
    “第二个项目现在还在摸索期,”易珂博士笑笑说。“大概思路就是在搜索引擎里,当搜索一个关键字的时候,有时候用户是想搜索跟自己位置相关的,比如咖啡厅、电影院。而有些关键字是和地点没关系,比如搜电脑型号、HP等。我们现在就想把这两方面结合起来,当用户搜一个关键字的时候,智能地分析出他是不是想搜与地址相关的,如果是相关的话就自动告诉搜索引擎,把当前地址考虑进去。否则按一般的关键字搜索就可以了。我们的方法也是通过分析已往以往用户的搜索记录来预测哪些搜索是和地址相关的,哪些不是。”
    “其实这两个项目的基本思想是一致的,都是分析过去的记录来预测用户的意图,基本上都是用到一些数据挖掘和自学习的方法。还有一个涉及隐私的问题,所以我们会问用户,你希不希望发送信息给我们,来推进我们的质量。但这两个项目我们现在的记录都还并不多,只有几万条的记录。但如果积累到一定数据量的话,我们就会开始做个性化的预测,因为所有的数据挖掘都是数据量越大,效果越好。”
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zzhlgzz

木虫 (正式写手)

相关版块跳转 我要订阅楼主 sjtu2012 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见