自然语言理解(NLU)或自然语言解释(NLI)[1]是人工智能领域中自然语言处理的子话题,旨在处理机器的阅读理解。自然语言理解被认为是人工智能困难问题。[2]
因其在自动推理、[3]机器翻译、[4]问答、[5]新闻收集、文本分类、语音激活、存档和大规模内容分析等方面的应用,NLU在该领域中具有相当大的商业利益。
NLU是文本的后处理,在使用NLP算法(词性标注等)之后,它利用来自识别设备(自动语音识别 [ASR]、视觉识别、上次对话、ASR的误识别单词、个人档案、话筒接近度等)的上下文的各种形式,从典型的语音命令中识别零碎的和连续的句子的含义以执行指令意图。NLU有一个围绕特定垂直产品的本体,用于计算某种意图的概率。NLU有一个定义好的已知意图列表,它从指定的上下文信息识别源导出消息有效载荷。NLU将提供多个消息输出,以将服务(软件)或资源(硬件)从单个派生意图中分离出来(用可视语句(显示或说出)和转换后的语音命令消息对语音命令发起者做出响应所消耗的输出信息与M2M通信和动作所消耗的输出信息大不相同)。
STUDENT程序是由Daniel Bobrow于1964年在他的麻省理工学院博士论文中写下的,这是已知的最早通过计算机理解自然语言的尝试之一。[6][7][8][9][10]在约翰·麦卡锡创造了术语人工智能的八年后,Bobrow的论文(标题为计算机问题解决系统的自然语言输入)展示了计算机如何理解简单的自然语言输入来解决代数应用题。
一年后的1965年,麻省理工学院的Joseph Weizenbaum写了一个可以用英语就任何话题进行对话的交互式程序“ELIZA ”,最受欢迎的话题是心理疗法。ELIZA通过简单地将关键词解析和替换成固定短语来解决问题,Weizenbaum避开了给程序提供一个现实世界知识的数据库或丰富的词典这一问题。然而,ELIZA作为一个玩具项目获得了惊人的人气,可以被视为当今商业系统的先驱,如Ask.com所使用的商业系统。[11]
1969年Roger Schank在斯坦福大学引入了概念依存理论进行自然语言理解。[12]这个模型受了Sydney Lamb工作的部分影响,并在耶鲁大学中被Schank的学生广泛使用,例如Robert Wilensky、Wendy Lehnert和Janet Kolodner。
1970年,William A. Woods引入了扩充转移网络(ATN)来表示自然语言输入。[13]ATN使用递归调用的有限状态自动机的等价集代替短语结构规则。ATN及其更通用的格式“广义ATN”被持续使用了许多年。
1971年Terry Winograd完成了SHRDLU系统,并以此写了他在麻省理工学院的博士论文。SHRDLU可以在儿童积木的有限范围中理解简单的英语句子,并指导机械臂移动物品。SHRDLU的成功演示为该领域的持续研究提供了巨大动力。[14][15]随着他的书《语言是一个认知过程》的出版,Winograd继续在这个领域发挥着重要的影响。[16]Winograd后来在斯坦福大学成为了谷歌创始人之一的Larry Page的顾问。
在20世纪70年代和80年代,斯坦福国际研究院的自然语言处理小组继续在该领域进行研究和开发。基于这项研究开展了许多商业活动,例如,1982年Gary Hendrix成立了赛门铁克公司,最初是一家为个人计算机上的数据库查询开发自然语言界面的公司。然而,随着鼠标驱动的出现,图形用户界面的赛门铁克改变了方向。大约在同一时间许多其他的商业活动也开展起来,例如人工智能公司的Larry R. Harris和认知系统公司的Roger Schank及其学生。[17][18]1983年,Michael Dyer在耶鲁开发了BORIS系统,该系统与Roger Schank和W. G. Lehnart所做的工作类似。[19]
第三个千年出现了使用机器学习进行文本分类的系统,例如IBM的Watson。然而,这种系统展现了多大程度的“理解”受到争议,例如 据Json Searle所述,沃森甚至不理解这些问题。[20]
认知科学家John Ball和帕特姆理论的发明者支持这一评定。自然语言处理已经向支持服务和电子商务中的人类生产力应用进军,但这在很大程度上是通过缩小应用范围实现的。在人类语言中表述需求的方式数以千计,这仍然与传统的自然语言处理背道而驰。“只有当我们根据句子中其他单词的含义将每个单词与正确的含义进行匹配时,才有可能与机器进行有意义的对话——就像3岁的孩子一样,无需猜测。“帕托姆理论”
术语“自然语言理解”可以应用于各种计算机应用,从小型、相对简单的任务如向机器人发出简短命令,到高度复杂的工作如完全理解报纸文章或诗歌段落。许多现实世界的应用程序介于这两个极端之间,例如用于电子邮件自动分析的文本分类以及将它们到公司中合适的部门的路由不需要深入理解文本,[21]但是与管理具有固定模式的数据库表的简单查询相比,这需要处理更大的词汇量和更多样的语法。
多年来人们在不同的复杂程度下对处理自然语言和向计算机提交类似英语 句子进行了各种尝试。一些尝试没有使系统具有深入的理解,但有助于整体系统可用性。例如,Wayne Ratliff最初开发了Vulcan 程序用类似英语的语法来模仿《星际迷航》中说英语的计算机的程序。Vulcan后来成为了dBase系统,其易于使用的语法有效地开启了个人计算机数据库行业。[22][23]然而,带有易于使用或类似英语 的语法与使用丰富的词典并包含自然语言句子语义的内部表示(通常为一阶逻辑)的系统截然不同。
因此,系统旨在实现的“理解”的广度和深度决定了系统的复杂性(以及隐含的挑战)和它可以处理的应用类型。一个系统的“广度”是由它的词汇和语法的多少来衡量的。“深度”是通过系统与流利的母语人士的理解的接近程度来衡量的。对于最窄和最浅的系统,类似英语 的命令解释器具有最小的复杂性,但应用范围很小。窄而深的系统对理解的机制进行探索和模拟,[24]但是它们的应用仍然有限。除了简单的关键字匹配之外,尝试理解文档内容(如新闻稿)并判断其对用户的适合性的系统更广泛,并且具有相当大的复杂性,[25]但是它们仍然有些肤浅。宽而深的系统超出了当前的技术水平。
不管使用什么方法,大多数自然语言理解系统都有一些共同的组件。系统需要语言的词典和解析器和语法规则来将句子分解成内部表示。用合适的本体构建丰富的词典需要大量的工作,例如“Wordnet ”词典需要很多人多年的努力。[26]
系统还需要一个语义理论来指导理解。语言理解系统的解释能力取决于它所使用的语义理论。作为计算机自动语义解释的基础,语言的竞争语义理论在适用性方面有特定的权衡。[27]这些范围涵盖从朴素语义学 或随机语义分析 到使用语用学 从上下文中提取含义的方方面面。[28][29][30]语义分析器将自然语言文本转换成形式意义表示。[31]
自然语言理解的高级应用也试图将逻辑推理纳入其框架。这通常是通过将派生的含义映射到谓词逻辑中的一组断言中,然后使用逻辑推演得出结论来实现的。因此,基于函数语言如Lisp的系统需要包含一个子系统来表示逻辑断言,而面向逻辑的系统如那些使用Prolog语言的系统通常依赖于内置逻辑表示框架的扩展。[32][33]
自然语言理解中的语境管理会带来特别的挑战。大量不同的例子和反例导致上下文的形式建模的方法多种多样,每种方法都有其特定的优缺点。[34][35]
^Semaan,P. (2012)。自然语言生成:概述。计算机科学与研究杂志-ISSN,50-57.
^Roman诉Yampolskiy案。图灵测试作为人工智能完备性的定义特征。在人工智能、进化计算和元启发式(AIECM)中——追随艾伦·图灵的脚步。杨新社(编辑。)中。第3-17页。(第1章)。伦敦斯普林格。2013.http://cecs . Louis ville . edu/ry/turingestasadenfingfeature 04270003 . pdf.
^范·哈梅伦、弗兰克、弗拉基米尔·立夫希茨和布鲁斯·波特合编。知识表示手册。第一卷。埃尔塞维尔,2008年。.
^马切里、克劳斯、弗朗兹·约瑟夫·奥赫和赫尔曼·内伊。" 使用统计机器翻译的自然语言理解 . "第七届欧洲语音通信和技术会议。2001..
^赫希曼、勒奈特和罗伯特·盖扎乌斯卡。" 自然语言问答:从这里看 . "自然语言工程7.4 (2001): 275-300。.
^美国人工智能协会 人工智能简史 [1].
^Daniel Bobrow博士论文计算机问题解决系统的自然语言输入。.
^思考的机器帕米拉·麦考鸭2004ISBN 1-56881-205-1第286页.
^斯图尔特·拉塞尔;彼得·诺维格(2003),人工智能:一种现代方法Prentice Hall,ISBN 0-13-790395-2,http://aima.cs.berkeley.edu/,第19页.
^计算机科学标志风格:超越编程布莱恩·哈维1997ISBN 0-262-58150-7第278页.
^约瑟夫·维森鲍姆(1976)。计算机能力与人类理性:从判断到计算W.弗里曼和公司。ISBN 0-7167-0463-3第188-189页.
^罗杰·沙克,1969年,自然语言的概念依赖分析器《1969年计算语言学会议录》,瑞典桑比,第1-3页.
^威廉·伍兹(1970)。“自然语言分析的转换网络语法”。ACM通讯13(10):591–606[2].
^人工智能:关键概念,罗纳德·克里斯利著,桑德·伯格尔,2000年ISBN 0-415-19332-X第89页.
^特里·威诺格拉德在斯坦福大学的SHRDLU页面SHRDLU.
^特里·维诺格拉德(1983),语言是一个认知过程爱迪生——韦斯利,雷丁,麻省。.
^拉里·哈里斯,人工智能公司的研究ACM SIGART公报,第79期,1982年1月[3].
^基于案例的内部推理克里斯托弗·里斯贝克,罗杰·沙克,1989ISBN 0-89859-767-6第十三页.
^深度理解:叙事理解的整合过程模型。。迈克尔·g·戴尔。麻省理工学院出版社。ISBN 0-262-04073-5.
^https://web.archive.org/web/20221028215527/http://www . wsj . com/articles/sb 10001424052748703407304576154313126987674.
^一种分层电子邮件分类方法作者:李佩丰等人自然语言处理和信息系统由Zoubida Kedad编辑,Nadira Lammari,2007年ISBN 3-540-73350-7.
^信息世界,1989年11月13日,第144页.
^信息世界,1984年4月19日,迷失1971页.
^在有限的语用领域建立全自然语言理解的工作模型詹姆斯·梅森2010[4].
^挖掘网络:从超文本数据发现知识作者:苏曼·查克拉巴蒂,2002年ISBN 1-55860-754-4第289页.
^G.A. Miller,R. Beckwith,C. D. Fellbaum,D. Gross,K. Miller。1990.WordNet:在线词汇数据库。Int。词典学。3,4,第235-244页。.
^在语言学中使用计算机:实用指南作者:约翰·劳勒,海伦·阿里斯塔·德里198ISBN 0-415-16792-2第209页.
^自然语言理解的朴素语义学凯瑟琳·达尔格伦1988ISBN 0-89838-287-4.
^基于随机的语义分析作者Wolfgang Minker,Alex Waibel ,Joseph Mariani 1999ISBN 0-7923-8571-3.
^语用学与自然语言理解作者:乔治亚·格林1996ISBN 0-8058-2166-X.
^黄玉华和雷蒙·穆尼。" 用统计机器翻译学习语义分析 . "计算语言学协会北美分会人类语言技术会议主要会议记录。计算语言学协会,2006年。.
^自然语言处理序言程序员作者:卡温顿,1994年ISBN 0-13-629478-2.
^Prolog中的自然语言处理作者:杰拉尔德·加斯达,克里斯托弗·梅利西,1989年ISBN 0-201-18053-7.
^理解语言理解作者:阿什温·拉姆,肯尼斯·摩尔曼,1999年ISBN 0-262-18192-4第111页.
^语境的形式方面Pierre Bonzon等人,2000年ISBN 0-7923-6350-7.
暂无