跳过主要内容
校园生活

智能搜索

北卡罗来纳州的研究人员已经开发出一种搜索引擎为用户提供更准确、个性化的搜索结果的方法。过去的挑战是如何扩大这种方法的规模,以便它不会消耗大量的计算机资源。现在研究人员设计了一种技术来实现个性化搜索这比100倍更有效比先前的方法。

问题是搜索引擎如何处理复杂或令人困惑的查询。例如,如果用户正在寻找对金融信息学研究进行研究的教师成员,那么该用户希望来自教师的相关网页列表,而不是提到使用这些条款的教师或新闻故事的研究生页面。这是一个复杂的搜索。

类似地,当搜索有多种可能的解释时,传统的搜索引擎会使用非个人的技术。举例来说,如果用户搜索“美洲虎速度”,他搜索的可能是美洲虎超级计算机、丛林猫或汽车的相关信息计算机科学他是北卡罗来纳州立大学的高级研究员,也是该研究论文的资深作者。“在任何给定的时间,同一个人可能想要这些东西的任何信息,所以分析用户不一定很有帮助。”

NC国家计算机科学研究员科马为安彦武。
NC国家计算机科学研究员科马为安彦武。

ananwu的团队提出了一种解决个性化搜索问题的方法,通过查看用户的“环境查询上下文”,即他们查看用户最近的搜索,以帮助解释当前的搜索。具体来说,它们超越了搜索中使用的词,寻找相关的概念,以确定搜索的上下文。

因此,如果用户之前的搜索包含“节约”一词,它将与概念相关联,喜欢“动物”或“野生动物”甚至“动物园”。然后,随后的“捷豹速度”的搜索会推动丛林猫的结果 - 而不是汽车或超级计算机 - 在结果中提高。最近的概念已经与搜索相关联,当新搜索的结果时收到的重量就越多。

搜索引擎也试图识别用户在搜索结果上的点击行为模式,以识别最有可能的用户搜索意图。然而,这些技术是非个人的,是在全球基础上应用的。因此,如果一组关键字的最频繁点击模式是在特定的上下文中,那么该上下文将与大多数或所有用户的查询相关联——即使您最近的搜索历史表明您的查询上下文是关于丛林猫的。

“我们正在做的是不同的,”安燕武说。“我们正在为个人用户实时识别搜索词的上下文,并利用它来确定用户在特定时间对特定查询的意图。这使得我们能够比传统搜索引擎更有效地处理更复杂的搜索。随着人们将网络作为支持不同任务的关键知识库,此类搜索变得越来越普遍。”

(闪亮img = " //www.watsongsa.com/wp-content/uploads/2013/11/big-data-book-inset.jpg " title =“相关故事”头=“大数据写书”视频= "链接= = " //www.watsongsa.com/2013/08/big-data-book/ "颜色" 4 f4f4f "]北卡罗莱纳州学生想要一个更好的大数据类的入门教材。所以他们写了一个。

尽管安燕武和她的团队在一年多前开发了一种情境感知的个性化搜索技术,但挑战一直是如何扩大这种方法的规模。“因为为每个用户运行一个环境上下文程序将占用大量的计算资源,这是不可行的,”安彦武说。

然而,安彦武的研究团队现在已经提出了一种技术,包括表示数据的新方法、索引数据以便有效访问的新方法,以及组织这些索引的新计算体系结构。这项新技术有很大的不同。

“我们的新索引和搜索计算架构允许我们支持使用8GB机器对大约2,900个并发用户的个性化搜索,而早期的方法仅支持17个并发用户。这使得概念更加实用,并将我们更接近下一代搜索引擎,“Anyanwu说。

留下一个响应

您的电子邮件地址将不会被公布。所有字段都是必需的。