700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 知识图谱问答(KBQA)数据集介绍

知识图谱问答(KBQA)数据集介绍

时间:2021-03-12 18:26:36

相关推荐

知识图谱问答(KBQA)数据集介绍

一、WebQuestions

提出该数据集的论文:Semantic Parsing on Freebase from Question-Answer Pairs

数据集地址:/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a

WebQuestions数据集(提出)是由斯坦福大学研究人员通过Google Suggest API构建得到的,数据集本身共包含5810条(问题,答案)对,其中简单问题占比在84%,复杂的多跳和推理问题相对较少。根据提出者的最初数据划分方式,WebQuestions被分为训练集和测试集两个集合,其中训练集包含3778条数据,测试集包含2032条数据。

ComplexWebQuestions

提出该数据集的论文:The web as a knowledge-base for answering complex questions

数据集地址:https://www.tau-/compwebq

ComplexWebQuestions数据集基于WebQuestionsSP数据集而建立的。建立方式为:首先根据WebQuestionsSP数据集的SPARQL语句涉及模板进行扩展形成模式化的复杂问句,然后人工将复杂问句进行转述形成自然语言问句。该数据使用场景包含知识图谱问答和阅读理解两个任务,共包含34,689条数据,其中训练集27,734条,验证集3,480条,测试集3,475条。

二、SimpleQuestions

提出该数据集的论文:Large-scale Simple Question Answering with Memory Networks

数据集地址:/downloads/babi/

SimpleQuestions数据集(提出)是一个针对简单问题而构建的数据集,它采用人工标注的方法根据知识库中的事实生成对应的问句,并且以Freebase作为答案来源。该数据集共包含108,442条数据(包含关系标注),其中训练集为75910条(70%),验证集为10845条(10%),测试集为21687条(20%)。

三、ComplexQuestions

提出该数据集的论文:Constraint-Based Question Answering with Knowledge Graph

作者本人的数据集地址:/JunweiBao/MulCQA/tree/ComplexQuestions

ComplexQuestions数据集(提出)是一个专门针对复杂问题而构建的数据集,在构建该数据集过程中,作者从一个实际使用的搜索引擎(具体哪个暂未知)中筛选并得到了878条可用的问答对。除了这878条数据,作者还从WebQuestions等数据集上额外选出了1222条数据,由此共得到了2100条复杂问题对。总体来说,该数据集共包含2100条问答对,其中训练集个数为1300条,测试集个数为800条。

四、GraphQuestions

提出该数据集的论文:On Generating Characteristic-rich Question Sets for QA Evaluation

数据集地址:/ysu1989/GraphQuestions

这是一个比较难的数据集(提出),涉及较多比较复杂的逻辑,以Freebase作为知识库。该数据集在构建时先设计问题涉及的模式(即知识库中的一个子图),然后让人根据图改写成自然语言题目。举个例子:“the nine eleven were carried out with the involvement of what terrorist organizations?”

五、30M Factoid Questions

提出该数据集的论文:Generating Factoid QuestionsWith Recurrent Neural Networks: The 30M Factoid Question-Answer Corpus

数据集地址:/details/973fb709bdb9db6066213bbc5529482a190098ce

该数据集是由模型自动构建的,包含30M的问答对。按照论文中的说法,问句质量和人类构建的质量相当,很有使用价值。

附:

KBQA相关工作系统总结:针对复杂问题的知识图谱问答最新进展

WebQuestions相关介绍:SEMPRE–Semantic Parsing with Execution

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。