科大讯飞在机器阅读理解SQuAD比赛中夺得第一
本篇文章1496字,读完约4分钟
雷锋。网站7月31日报道。最近,在斯坦福大学发起的斯坦福问答竞赛中,HKUST讯飞和哈尔滨工业大学提交的系统模型获得了第一名,击败了微软亚洲研究院、艾伦研究院、ibm、salesforce、facebook、谷歌、卡内基梅隆大学、斯坦福大学等全球学术和工业研究团队,这些团队都是中国本土的研究机构
科达讯飞在最近的斯坦福问答挑战赛中获得一等奖(照片/雷锋)
据雷锋说。来自全球工业界和学术界的顶尖团队参与了这项活动,如艾伦研究所、ibm、salesforce、facebook、谷歌、微软研究院、cmu和斯坦福大学等。
小队机器阅读理解挑战赛的具体操作流程如下。竞赛通过众包建立了一个大规模的机器阅读理解数据集(包括100,000个问题),可以为人工标注者阅读几百字的短文,让标注者根据文章内容提出最多五个问题并给出正确答案;这篇文章的原文来自500多篇维基百科文章。在阅读完数据集中的一篇短文后,参赛者提交的系统模型将根据文章内容回答几个问题,然后与人工标注的答案进行比较,得到精确匹配和模糊匹配的结果。
HKUST的科大讯飞向雷锋透露。这个比赛是一个持续的挑战,参赛者可以提交它进行优化。然后组织者会定期更新结果。在本轮测试中,由IFlytek和哈尔滨工业大学提交的系统模型——交互式AOA阅读器(基于交互式级联注意力模型),其精确匹配率为77.845%,模糊匹配率为85.297%,两项得分均居首位。
一般来说,机器阅读理解在研究领域经常会遇到以下两个问题:
1.数据问题:目前,基于深度学习模型等统计方法的机器阅读理解离不开大量的人工标注数据,但固有数据集往往存在规模小、质量差的问题。在这种情况下,很难根据这些数据量建立一个优秀而有效的模型。
2.算法问题:在进行阅读理解或自动问答时,传统的自然语言处理方法会通过拆分任务将其分为问题分析、文本分析、关键句子抽取等步骤。然而,这种方法容易造成级联误差的积累,并且很难得到好的结果。例如,子目标的整合结果不能与最终目标完全一致;不适当的局部优化可能导致研究进展缓慢。
因此,目前在机器阅读理解领域,大多采用完整的端到端神经网络建模,消除了由步骤引起的级联误差。此外,神经网络方法可以通过大量的训练数据学习广义知识表示,从语义层面抽象文本和问题。
根据IFlytek对雷锋的介绍。(公开号码:雷锋。它在这个问题上也采用了一个端到端的神经网络模型,但是更多的关注于如何模拟人类阅读理解的一些方法。在这次测试中获得第一名的“交互式aoa阅读器”主要根据给定的问题对文本进行多次过滤,并根据过滤后的文章进一步筛选出问题中的关键问题。通过“交互”和逐步定义答案的范围,该模型可以获得良好的结果。
iflytek智能标记技术的工作流程
目前,IFlytek与哈尔滨工业大学联合实验室的研发成果已逐步应用于教育领域,如利用机器对试卷的主观题进行评分,以辅助人工阅卷,减少人员投入,减少人工阅卷中疲劳、情绪等因素的影响,进一步提高人工阅卷的效率、准确性和公平性。
同时,雷锋。com还了解到,近年来,HKUST IFlytek在全国中小学频繁开展试点项目,并与一些教育机构携手合作。例如,2015年11月之前,HKUST的IFlytek利用机器标记技术在安庆和合肥建立了试点项目。在对人机评分结果进行分析后,计算机在评分一致性率、平均评分差异、相关度以及与仲裁评分接近的比例等方面均达到或超过了人工评分水平。在今年湖北省的中考中,襄阳市引进的智能阅卷系统也来源于iFlytek的机器智能阅卷技术。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:科大讯飞在机器阅读理解SQuAD比赛中夺得第一
地址:http://www.6st8.com/zbxw/6585.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。