P_cliff 版 (精华区)

发信人: worldguy (稀里糊涂), 信区: P_cliff
标  题: 微软暑期研讨班第三天
发信站: 哈工大紫丁香 (Sun Jun  5 18:12:03 2005), 转信

今天依旧是个好天气。早上起来,吃过饭,直奔行政楼113。

今天的主题是牛成博士的报告:Corpus-Level Information Fusion和Question-Answering Supported by IE。Corpus-Level Information Fusion的思想是针对单篇文档信息抽取的局限提出改进,在整个文档集合中进行对抽取的信息融合。这里会有一些问题:比如如何确定同一个名字的NE是同一个人还是不同的人,如何对不同时期的信息进行融合,如何确定概念的关系等。牛博士介绍了用机器学习方法对人名实体跟踪(machine learning approach for person name tracking)。先用VSM做一个baseline,然后对实体的匹配关系做进一步的建模。我听懂的不多。实验的部分,很精彩。他们针对实验数据不容易获得的情况,想了很多方法。很有启发性。等我学习了一些机器学习算法后,回头再来看,一定又有不少的收获。

最后牛博士介绍IE在QA中的应用。他说,IR之于QA不是最重要的问题,QA本身有很多问题,不能只靠IR解决。IE能够在一定能程度上帮助QA提升性能。QA中常见的问题是事实问题(factoid question),列举问题(list question)和定义性问题(definition question)。IE能够将抽取的信息,辅助答案的抽取。这里面研究的内容也不少。牛博士谦虚地说,他做的研究不多,大家相互学习。QA确实是一个很难的问题,随着QA技术的发展,NLP,IR,IE,TS等技术都能够得到良好的应用。

总结这三天来的课程,我收获非常多。

感谢牛成博士(Dr. Niu Cheng),黄伟道博士(Dr. Hwee Tou Ng),Frank Seide和林钦佑博士(Dr. Chin-Yew Lin),他们的精彩的讲座使我受益匪浅,对我学习机器学习理论有非常大的帮助。

http://ir.hit.edu.cn/~victor/blog


--
  +--+--+--+--+--+--+--+--+--+--+
  |十|酒|八|七|六|五|四|三|二|一| 
  |分|薄|分|分|欲|谷|季|餐|目|贯| 
  |坦|烟|交|忍|不|皆|不|有|远|知| 
  |荡|断|往|让|张|食|懒|节|眺|足| 
  +--+--+--+--+--+--+--+--+--+--+


※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.250.16]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:2.014毫秒