2020年9月6日,金山集团AI团队在由卡内基梅隆大学、斯坦福大学和蒙特利尔大学联合发起的多步推理阅读理解评测中荣登榜首。在全部6项测评中,金山模型有5项指标刷新纪录排名第一,1项指标排名第二,全面超越之前的冠军微软,结束了长达一年的由美国科技公司包括微软、谷歌等在内的霸榜局面,为中国AI的崛起贡献了一份力量。
属于多步推理的阅读理解数据集,2018年发布后吸引了众多研究机构和高校参与,其中包括谷歌、微软、IBM、、字节跳动、日本电报电话公司(NTT)、清华大学、华盛顿大学、纽约大学等巨头公司和名校。
传统的机器阅读理解是通过单个问题和单个篇章去抽取答案。而多步推理阅读理解是将单篇文档扩充到多个篇章,同时要从多个篇章中筛选出与问题相关的篇章,并进一步要求模型能够对佐证篇章中所叙述事物的逻辑关系构建两步及以上的推理链,因而更具有挑战性。本次金山集团参加的是干扰项赛道( ),该赛道更侧重于考察模型的文本推理能力,同时也是参赛队伍最多的赛道。该技术可以为文本内容深度理解、知识推理问答等相关应用提供引擎支持。
图1. 挑战赛(干扰项赛道)最新榜单(截至2020年9月22日)
踏实的金山AI
随着数据、算力、算法的蓬勃发展,人工智能迎来了历史上的第三次发展高峰。世界各国不断加大投入,我国也将人工智能列为“新基建”。结合企业发展需求在线翻译 金山,金山在集团董事长雷军亲自指导下,开始加大在AI领域的研发投入,成立了涵盖图像、语音、语言等多个研究方向的AI团队,由中科院人工智能领域青年专家李长亮博士负责。
成立仅三年时间,金山AI 团队已经在多个方向取得领先地位,申请发明专利100余项,在国际顶级期刊会议上发表人工智能论文数十篇。目前获得了2018全球人工智能挑战赛AI 翻译竞赛、WMT 2019英中翻译竞赛、IEEE ISI-World Cup 2019大数据竞赛、微软COCO Image 、多步推理阅读理解评测等国际大赛的冠军。
从纯技术研究到场景落地
成立三年来,AI 团队为WPS、金山词霸、金山云等提供了智能写作、智能问答、翻译辅助、公式识别、智能校对、大数据推荐等多项技术支持。
AI 团队发展迅速、硕果累累,尤其是在机器翻译、计算机视觉、机器阅读理解、智能文档等领域取得突破性进展。目前团队正致力于以认知为核心的人工智能服务,并在三个方向重点发力:机器翻译、知识问答、文档智能。按照金山一贯的务实风格,AI 团队正在尝试进行项目落地,并已开发出AIDA翻译引擎、AIDA知识引擎以及AIDA文档智能处理系统。
AIDA翻译引擎:基于金山30年的文档处理经验,AI 团队进行了机器翻译领域的深度研究,创新出层次注意力机制、高斯搜索等独特算法,并在工程细节、特征提取等方面积累了丰富的经验。AIDA翻译引擎以垂直领域大文档翻译为重点,旨在为文学、金融、法律、政府、军事、医药、学术、机械、专利等众多领域的客户提供接近人工翻译水准的高水平快捷翻译服务。目前系统支持中文与其他140种语言互译,译文能完美保持原文版式并支持在线译后编辑。系统还能自动识别文本语种和领域,根据具体的文本领域提供符合行业规范的个性化翻译,保证用词准确、行文专业。
AIDA知识引擎:AIDA知识引擎利用创新的知识挖掘技术、基于权威数据库进行精准问答,可以最大化提升知识获取效率、带给用户简单顺畅的搜索体验。应用场景包括思政教育、公文写作、财经问答、知识百科等等,真正实现所答皆为所问。
AIDA文档智能处理系统:AIDA文档智能处理系统能够对各种类型的文本进行结构化处理和关键信息抽取,从而构建知识图谱,助力企业工作者从各类企业文档中高效获取有效信息,并实现文档关键信息的结构化管理。应用场景包括企业各类合同管理、求职简历管理等。
目前金山AI已和中科电、华为、语言桥、中图进出口、传神翻译、小米、国家某部委等企事业单位建立了密切合作。
为人类创造美好生活的愿景
在李长亮博士看来,AI技术目前处于起步阶段,但前途不可限量在线翻译 金山,团队成员也坚信“未来一定是人工智能的时代”。心怀“用先进人工智能技术提高生产力、为人类创造美好生活”的梦想,金山AI用三年时间在机器翻译、机器阅读理解、文本挖掘等领域突破一个又一个技术高地,在众多AI巨头中脱颖而出。
未来,他们还会进行怎样的探索?我们拭目以待。
限时特惠:本站持续每日更新海量各大内部创业课程,一年会员仅需要98元,全站资源免费下载
点击查看详情
站长微信:Jiucxh