发信人: niceday (快乐小小草), 信区: Computer
标 题: 机器智能与翻译研究室欢迎大家加盟
发信站: BBS 哈工大紫丁香站 (Fri Mar 16 12:02:01 2007)
哈尔滨工业大学计算机学院语言技术研究中心机器智能与翻译研究室
1.发展简史
哈尔滨工业大学计算机科学与技术学院语言技术研究中心机器智能与翻译研究室(Machin
e Intelligence & Translation Laboratory,MI&T Lab),自1985年以来一直致力于机器
翻译研究与系统开发。本研究室最初完成的汉英机器翻译系统CEMT-I于1989年5月鉴定,成
为我国第一个通过技术鉴定的汉英机器翻译系统,获部级科技进步二等奖。
本研究室通过合作又先后完成了汉英机译系统CEMT-II、CEMT-III,并结合系统开发进行了
相关的技术研究。CEMT-III系统于1993年5月在北京鉴定,受到与会专家的好评,并获部级
科技进步二等奖。1993年原航天工业总公司投资开发"达雅翻译工作站(机器辅助翻译系统
)",是我们在自动翻译软件商品化方面进行的一次可喜尝试。同时在机器翻译相关的一系
列技术方面进行了广泛探索,包括汉语自动分词与词性标注、英语词法分析、汉语和英语
句法分析、词义消歧、英汉双语语料库加工等。2000年以来,除了继续承担国家863 计划
课题和自然科学基金课题以外,还广泛加强了国内外的学术交流与合作,与美国、日本、
韩国、爱尔兰、香港等地的同行保持着广泛的联系,积极开展学术交流和研究合作。
2000年6月哈工大-微软机器翻译技术联合实验室的建立,为本研究室进一步发展创造了机
会。随着计算机学院机构改革的深入,2003年3月本研究室与相关研究室一起组成了语言技
术研究中心,在研究深度和广度方面有了新发展。我们不再局限于机器翻译及其相关技术
的研究,而是扩大到整个自然语言处理领域,包括了面向翻译、检索、理解等各方面的人
类语言信息处理技术,扩展到语言和语音技术、语言和图形技术的结合,也扩展到若干人
工智能技术的应用研究。2003年底,根据现有规模和研究方向的实际情况,研究室更名为
机器智能与翻译研究室(MI&T Lab)。2004年6月,基于哈工大-微软机器翻译技术联合实
验室几年来所作出的成绩,联合实验室扩大为哈工大-微软自然语言处理及语音技术联合实
验室。2004年11月联合实验室进一步提升为教育部-微软语言语音重点实验室。
2.研究方向
(1) 互联网信息智能处理
互联网已经成为人类社会最大的信息资源,围绕着海量网络信息的检索、跨语言检索、抽
取、分类、过滤、知识挖掘、问答、文摘、综述、摘译等智能处理需要自然语言处理技术
的广泛应用。通过关键词加权计算、互联网结构特征、句法浅层分析、句法语义骨干关系
分析、Ontology框架、语境分析等技术,实现网络信息的智能计算。其目标是最大限度地
为各类用户提供互联网信息服务。
目前,我们开展的研究着眼于跨语言信息检索、信息抽取、文摘与摘译。可能应用的领域
包括信息预警、组织机构信息门户、数字化图书馆、电子政务、个人信息订制等。以语言
技术研究中心为核心,正在开展新一代面向用户的高性能信息检索理论与方法的研究。
(2) 机器翻译技术、资源、评价的研究
机器翻译从处理流程和处理深度的两个角度来看,涉及到多种自然语言处理技术。机器翻
译处理流程包括源语言的分析、从源语言到目标语言的转换、目标语言的生成。源语言分
析又可以分为词法分析、词性标注与句法分析、语义分析、语用和语境分析等不同的分析
层次。源语言和目标语言之间的转换是机器翻译的核心问题,通过大规模双语(或多语)
语料库及其标注来获取翻译知识是提高机器译文质量的关键技术之一。针对机器翻译流程
中的核心问题,我们正在深入研究句法结构的统计转换方法、译文消歧方法,以求在机器
翻译技术上走向深入、探索新的突破。
除了研究翻译技术,我们还重视双语/多语语料库的深度加工,探索机器译文的有效自动评
价。通过资源建设和系统评测,将有助于发现翻译系统的问题和关键影响因素,推动翻译
技术的进步。
(3) 文景转换技术
文景转换技术(Text-to-Scene)是基于人工智能方法把非形式化输入如自然语言的描述,转
换生成二维或者三维图形描述,显示静态或者动态的场景。文景转换研究涉及的理论和方
法多、技术难度大,是一个值得大力探索、具有广泛应用前景的技术。目前相关的系统还
处于实验室阶段。
文景转换技术主要依托于自然语言理解、计算机图形学两个方面的技术背景,为了使这两
个相对独立的技术平滑连接起来,主要解决方案是借助形式化结构平滑化、以便完整地传
递有关信息。其中涉及的技术主要包括:自然语言处理、中间结构、场景生成以及性能评
价,主要研究常识推理、空间关系的定量可视化等细节问题。本研究室率先开展了从自然
语言文本中自动确定空间关系并予以可视化的研究,成为计算机学科数字媒体博士点的一
个组成部分。
除了上述三个重点研究方向外,本研究室在多语言分析技术、统计学习技术在自然语言处
理中应用等方面进行了广泛研究。
3.研究队伍与人才培养
目前,机器智能与翻译研究室有教师6名、博士研究生(包括在职人员)20余名、硕士研究
生30余名及本科生等,总人数近60人。学术带头人为博士生导师李生教授和赵铁军教授。
研究室总面积近300平方米。拥有微机、服务器及工作站70余台套及其他科研设备。保证了
师生们具有良好舒适的工作和学习环境。
本研究室每年招收10余名硕士研究生和若干名博士研究生。在培养过程中,我们坚持面向
国际,选送优秀学生进入微软、东芝等国际大企业研发中心或者国外优秀研究机构进行访
问研究,拓宽学生的视野,培养优秀人才。
自成立以来,本课题组已培养了大量的研究生、本科生,他们大多数仍活跃在相关领域中
。其中博士毕业的包括:周明博士(微软亚洲研究院)、张民博士(新加坡信息通讯技术
研究院)、刘小虎博士(美国Amazon)王海峰博士(东芝中国研发中心)荀恩东博士(北
京语言文化大学)、张晶博士(华南理工大学)、吕雅娟博士(中科院计算所)、孟遥博
士(北京富士通研究开发中心)、姚建民博士(苏州大学)、韩习武博士(黑龙江大学)
、梁颖红博士(东北林业大学)、曹海龙博士(日本NICT)
--
☆ ╮╭══╮╭╬╬╮╔╮╭══╦═╮╭═╦══╯╭══╦╦╮
║ ║ ║╭╩╬╮║║ ╭╣ ☆╭═╬══╯╭══╬╬╮
╭════╯╭╬╯║ ║╭═╯☆║╯╭╮║╠═╮╭═╬══╮║ ★☆║
☆ ║ ║ ║╭══╮║║║★║║ ║╰═╬★═╯╰══╩╩╯
☆ ║ ║ ║╠══╣╠╯║ ║║╭║╰═╬══╯╰╬══╬╯
●╯╯═╯╰══╯╚ ╰═╯╯╰╯╰═╩══╯╰╰══╩╯
※ 来源:·哈工大紫丁香 http://bbs.hit.edu.cn·[FROM: 202.118.239.104]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:2.903毫秒