P_cliff 版 (精华区)
发信人: worldguy (稀里糊涂), 信区: P_cliff
标 题: 微软暑期研讨班第三天
发信站: 哈工大紫丁香 (Sun Jun 5 18:12:03 2005), 转信
今天依旧是个好天气。早上起来,吃过饭,直奔行政楼113。
今天的主题是牛成博士的报告:Corpus-Level Information Fusion和Question-Answering Supported by IE。Corpus-Level Information Fusion的思想是针对单篇文档信息抽取的局限提出改进,在整个文档集合中进行对抽取的信息融合。这里会有一些问题:比如如何确定同一个名字的NE是同一个人还是不同的人,如何对不同时期的信息进行融合,如何确定概念的关系等。牛博士介绍了用机器学习方法对人名实体跟踪(machine learning approach for person name tracking)。先用VSM做一个baseline,然后对实体的匹配关系做进一步的建模。我听懂的不多。实验的部分,很精彩。他们针对实验数据不容易获得的情况,想了很多方法。很有启发性。等我学习了一些机器学习算法后,回头再来看,一定又有不少的收获。
最后牛博士介绍IE在QA中的应用。他说,IR之于QA不是最重要的问题,QA本身有很多问题,不能只靠IR解决。IE能够在一定能程度上帮助QA提升性能。QA中常见的问题是事实问题(factoid question),列举问题(list question)和定义性问题(definition question)。IE能够将抽取的信息,辅助答案的抽取。这里面研究的内容也不少。牛博士谦虚地说,他做的研究不多,大家相互学习。QA确实是一个很难的问题,随着QA技术的发展,NLP,IR,IE,TS等技术都能够得到良好的应用。
总结这三天来的课程,我收获非常多。
感谢牛成博士(Dr. Niu Cheng),黄伟道博士(Dr. Hwee Tou Ng),Frank Seide和林钦佑博士(Dr. Chin-Yew Lin),他们的精彩的讲座使我受益匪浅,对我学习机器学习理论有非常大的帮助。
http://ir.hit.edu.cn/~victor/blog
--
+--+--+--+--+--+--+--+--+--+--+
|十|酒|八|七|六|五|四|三|二|一|
|分|薄|分|分|欲|谷|季|餐|目|贯|
|坦|烟|交|忍|不|皆|不|有|远|知|
|荡|断|往|让|张|食|懒|节|眺|足|
+--+--+--+--+--+--+--+--+--+--+
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.250.16]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:5.424毫秒