为了让你更好地搜索专业学术资料,Semantic Scholar 想打造超越谷歌的 AI 搜索引擎
早期项目

为了让你更好地搜索专业学术资料,Semantic Scholar 想打造超越谷歌的 AI 搜索引擎

基于 AI 的专业搜索将变得更加智能。

2016-11-14 7:40:14


和绝大部分时候我们使用的日常搜索不同,专业的学术论文因其特定的术语和复杂的语义,在检索上有更多不一样的要求。为了让人们在做研究时能够更好地查找到需要的资料,由非盈利 AI 研究机构华盛顿西雅图 Allen 智能研究所首席执行官 Oren Etziono 领导的队伍“Semantic Scholar”目前正在打造一款免费的专业学术搜索引擎,据说在检索上比谷歌还要更“智能”。

自搜索引擎是在去年 11 月份首次推出以来,团队一直在不断扩大引擎的数据资料库,目标是通过对文章的内容和上下文更加智能和复杂的理解,得出更加优化的搜索结果和排序。目前,这一引擎已经涵盖了跨越计算机科学、神经科学领域等的 1000 万篇学术论文,而且还吸引了不少基于 AI 的学术搜索引擎加入,其中就包括了微软。

WEB_eyevine6.05035612

谷歌的专业论文搜索引擎 Google Scholar 资料库中大约有 2 亿篇论文,但是它全是通过关键字得出搜索结果的。相比之下,Semantic Scholar 可以评估论文中哪部分才是最“有意义”的, 通过引用的数量等数据实现对论文的快速排列 ,这就和我们平时的“搜索热度”类似。

当团队第一次发布自己的这款产品时,可供搜索的论文只有 300 万篇。不过之后团队通过与其姐妹研究所 AI2 的合作,现在可供查询的论文已经达到了数百万篇,而且还为神经学和医学增加了新的搜索过滤器。这些过滤器的功能非常强大,比如,他们已经将搜索的范围缩小到了人脑的某个特定部分或者某个特定细胞类型,又或者采用了哪种研究模型和研究方法。据 Etzioni 介绍,他们计划在明年引入所有的 PubMed 数据,并且将可搜索的领域扩展到所有学科。

圣地亚哥的神经科学学会的年会上,当 Semantic Scholar 对外界展示自己改进后的这项技术时,给不少学者都留下了深刻的印象。“这将极大改变目前的搜索状况,”来自斯坦福大学的神经生物学家 Andrew Huberman 说道,“它能够很好地带领你在这些庞杂的资料库中找到自己想要的信息。”

除了谷歌和 Semantic Scholar,目前市场上推出了同样服务的还有微软。在今年 5 月份,微软悄悄发布了新款的 Microsoft Academic 并取代了此前的 Microsoft Academic Search。

微软在新款引擎中使用的算法和数据都是通过 API 接口从 Open Academic Society 中获取,而这一机构是微软研究院、AI2 和其他机构共同成立的。“合作伙伴越多,产品的效果就越好,”项目负责人王文山说道。在他看来,Semantic Scholar 对自然语言处理的研究正不断深入,而微软的工具基于网络搜索引擎 Bing,因此覆盖的面更广,目前已经包含了来自 1.6 亿份出版物的数据。两者结合将会产生更优化的效果。

Microsoft Academic 和 Semantic Scholar 一样,在引擎中加入了过滤器,其中包括作者、期刊、研究领域等标准,而且还使用递归算法,按照过去 6 个月中被引用的次数给每个细分领域的专家进行了影响力大小的排序。

微软的努力得到了不少学术界人士的认可。他们认为,微软的学术搜索引擎融合了谷歌覆盖面广以及 Scopus 和 Web of Science 的结构精度优势。“Microsoft Academic 正在快速发展中。”来自英国米德赛斯大学的 Anne-Wil Harzing 说道。微软研究院表示,目前他们正在设计更具个性化的搜索功能,在用户登录之后能够根据用户的需要,自动推动合适的论文和最新研究成果,这一服务预计将在明年年初上线。

“未来 20 年后,AI 不仅将学会阅读,而且还能理解学术文本。”Etzioni 说道。

扫码关注粹客网微信公众号,每日推送更多精彩资讯,随时随地关注业界最新动态
一只多线程的大型猫科动物,关注人工智能/VRAR/无人驾驶领域,欢迎交流:) 微信:miuccia591

热门评论

Copyright © 2015-2016 粹客网 | 广州市彼利熊网络科技有限公司 (粤ICP备15096117号)