电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

面向机器人学习的对话模版抽取方法分析研究 计算机专业VIP专享VIP免费

面向机器人学习的对话模版抽取方法分析研究 计算机专业_第1页
面向机器人学习的对话模版抽取方法分析研究 计算机专业_第2页
面向机器人学习的对话模版抽取方法分析研究 计算机专业_第3页
目录前言1第一章绪论21.1研究背景及意义21.2问答系统概述31.3本文的主要工作41.4本文的组织结构5第二章问答系统实现方法62.1问答系统实现方法62.2问题分析72.2.1问题预处理72.2.2问题分类72.2.3关键字提取82.3信息检索82.4答案抽取9第三章问答系统算法设计113.1Lucene113.2相似度计算113.2.1词向量123.2.2卷积神经网络133.2.3Word2vec143.3排序学习15第四章模版匹配方法174.1问题模版174.2模版构建174.21后缀树174.22模版获取194.23准确度计算204.3问题分类21朴素贝叶斯方法214.4评估方法21第五章总结与展望235.1本文总结235.2后续工作展望23参考文献24致谢26摘要问答系统的主要任务是在信息抽取文档的支持下,提供给自然语言表述的问题一个简单有效的答案,实现友好可靠的人机交互方式,现有的技术已经能够基本实现部分问答需求。在本文中,我们将讨论基本的问答系统的实现结构和工作方式,并分析一种使用模版学习的问题匹配和答案抽取方法。问题模版通过提供一些人工问题的实例输入搜索引擎,建立了一个带标签的语料库,从返回的文件中抽取并标准化得。我们可以通过MRR得分评估每个模版的精准度,确定每个问题类型的回答效果。在获得高精度的模版后可以应用于匹配新问题的答案。答案抽取的相关度计算采用基于词向量模型的排序学习方法。排序学习是机器学习的典型应用,用于构建信息检索系统的学习排序模型。训练数据由查询得到的文档指定的部分文档列表组成。排序学习的目的确定是在新问题提出时文档列表中已有的内容与问题请求是否有关。关键字:问答系统;模板学习;问题匹配;答案抽取;排序学习AbstractThemajortaskofthequestionansweringsystemistoprovideasimpleandeffectiveanswertotheproblemofnaturallanguageexpressionunderthesupportofinformationextractiondocuments,toachieveafriendlyandreliablehuman-computerinteraction,andtheexistingtechnologyhasbeenabletobasicallyfulfillsomeofthequestionsandanswers.Inthisarticle,wewilldiscusstheimplementationstructureandworkingmethodsofthebasicquestionansweringsystem,andanalyzeaquestionmatchingandanswerextractionmethodusingtemplatelearning.Thetextpatternisobtainedbyprovidingsomeexamplesofhumanproblemstothesearchengine.Ataggedcorpusiscreatedandextractedfromthereturneddocumentsandstandardized.WecanusetheMRRscoretoevaluatetheaccuracyofeachtemplateanddeterminetheresponsetoeachquestiontype.Afterobtainingahigh-precisionpattern,itcanbeappliedtomatchtheanswerstonewquestions.TherelevancycalculationofanswerextractionuseslearningtorankmethodbasedonthewordPresentationmodel.Learningtorankisatypicalapplicationofmachinelearningandisusedtoconstructalearningorderingmodelforinformationretrievalsystems.Thetrainingdataconsistsofalistofpartialdocumentsspecifiedbythedocumentobtainedbythequery.Thepurposeofrankingistodeterminewhetherexistingcontentinthedocumentlistisrelatedtothequestionrequestwhenanewquestionisasked.Keywords:QuestionAnsweringSystem;TextPatternLearning;QuestionMatching;AnswerExtraction;LearningtoRank前言问答系统(QuestionAnsweringSystem)是一种新型信息检索系统。它与用户交互过程是使用自然语言对话的方式进行的。与现有的搜索引擎不同,问题答疑系统不是为用户提供繁琐的关键字匹配的文档列表,而是以自然语言的形式准确地返回问题的答案。问答系统的主要目的是迅速切实地回复用户查询的问题。通常问答系统的处理流程区分为三个步骤:问题分析、信息检索以及答案抽取。问答系统近年来得到了扩展,以涵盖其他领域的知识。系统已经发展到到可以答确定时间和地理空间问题、定义和术语问题、描述类问题和多语言问题,涵盖知识载体包括文字、音频、图像和视频。当前的问答研究主题包括人机交互性、答案重用、答案表示、知识推理、情感分析、语义解析等在匹配很多相似的问题时,通常采用问题模版的方法。每种特定的问题都有...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

文章天下+ 关注
实名认证
内容提供者

各种文档应有尽有

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部