首页 > 微软

微软将开源数据库 增强机器的阅读理解能力

  沟通是任何事物了解彼此的最大障碍,学习、理解不同的语言是它的基础。据悉为了解决机器与人类沟通的难题,微软将发布一个免费的数据库来帮助机器创建更多的对话。

微软将开源数据库 增强机器的阅读理解能力

  该数据库名为微软机器阅读理解数据库(简称MS MARCO),包含有10万条英文查询及对应回答。用来帮助人工智能系统更好地理解人类语言。

  微软合作伙伴集团项目经理Rangan Majumder在周五的一篇博客中提到,微软将免费开放MS MARCO,并希望能够与其他机构合作来更好地提高机器的阅读理解能力。

  数据库中的资料来源于必应搜索和Cortana,并做相应的匿名处理。对问题的回答则是基于互联网、人类手工编写以及经过验证的信息。这些查询和回复将用于建立深度学习模型。

  当前,该数据库将对非商业用途的用户提供免费下载。同其他人工智能数据库开源计划类似,微软也将采用同样的方式开源MS MARCO。

  其中的一项是ImageNet,可用于训练图像识别算法的图片标记数据库。微软此前在开发图片识别技术时用到ImageNet,现在又用该数据库来强化微软计算机视觉API等产品。如果想了解更多有关MS MARCO的信息,可下载其研发团队发表的论文。该团队还在进行另外一项挑战,用MARCO的数据来评估训练模型,而评估脚本也还在研发中。

  这项开源计划也是微软进一步发展其人工智能的举重要措。微软一直以来都在打造基于机器学习和人工智能的Azure云平台,同时在Office和Windows中也加入了一些人工智能的特性。本周早些时候,微软推出了QnA Maker云服务,用于降低开发者研制问答聊天机器人的难度。

  人工智能的每一丝进步,都离不开工程师与海量信息的幕后支持。随着微软开源计划的实施,人工智能领域无疑迎来了更进一步的契机!或许未来的某一天,机器真的能和人沟通呢。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:/microsoft/2021-03-08/17970.html

留言与评论(共有 0 条评论)
   
验证码:

潘少俊衡

| 桂ICP备2023010378号-4

Powered By EmpireCMS

爱享小站

中德益农

谷姐神农

环亚肥料

使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

感谢潘少俊衡友情技术支持