贝叶斯集是一种新的信息检索框架,它基于人类学习新概念和概括的方式。在此框架中,查询由一组项目组成,这些项目是某些概念的示例。贝叶斯集…… 更多阅读 如何像 Zappos 一样在 SEO 上杀死它 Google+ 就像 401K 用于搜索 Digital Reasoning 的 Synthesys 网络搜索扼杀了人工智能吗? 社交搜索一切,适合所有人:产品评论 “项目搜索”公司Xyggy的首席执行官兼创始人 Dinesh Vadhia一直是Noisy 社区的活跃成员至少一年,我很高兴发表他剑桥大学 / CMU Zoubin教授的这篇客座文章Ghahramani和剑桥大学/盖茨比计算神经科学部门研究员Katherine Heller。我用维基百科链接对帖子进行了注释,希望能让没有统计学或机器学习背景的读者更容易理解它。 人们非常善于在观察几个例子后学习新概念。例如,一个孩子在一生中只见过几只狗之后,就会自信地指出哪些动物是。
种从示例中学习概念并
将其概括为新项目的能力是智能的基石之一。相比之下,目前互联网上的搜索服务很少或根本没有学习和概括。 贝叶斯集是一种新的信息检索框架,它基于人类学习新概念和概括的方式。在此框架中,查询由一组项目组成,这些项目是某些 电话号码列表 概念的示例。贝叶斯集自动推断哪些其他项目属于该概念并检索它们。例如,对于两部动画电影“ Lilo & Stitch ”和“ Up ”的查询,Bayesian Sets 将返回其他类似的动画电影,如“ Toy Story ”。 这是如何运作的?人类泛化在认知科学中得到了深入研究,并且基于相似性和特征相关性的某种度量提出了各种模型。最近,贝叶斯方法已成为人类认知模型和机器学习系统的基础。 贝叶斯集——一种新颖的信息检索框架 考虑一个项目的世界,其中项目可以是网页、文档、图像、广告、社会和专业资料、出版物、音频、文章、视频、投资、专利、简历。
医疗记录或我们可能
其他类别的项目想查询。 单个项目由该项目的特征向量表示。例如,对于文本文档,特征可以是单词出现的次数,而对于图像,特征可以是不同颜色和纹理元素的数量。 给定由一小组项目(例如建筑物的一些图像)组成的查询,任务是检索属于查询示例的概念的其他项目(例如其他图像)。为完成任务,我们需要衡量可用项目与查询项目的匹配程 银行电子邮件列表 度或得分。 一个概念可以通过使用统计模型来表征,该模型定义了属于该概念的项目的特征的生成过程。参数控制项目特征的特定统计属性。例如,高斯分布具有控制每个特征的均值和方差的参数。通常这些参数是未知的,但先验分布可以代表我们对合理参数值的看法。 分数 给定查询项集合 Q 用于对每个项 x 的相关性进行排序的分数比较两个假设的概率。第一个假设是项目 x 来自与查询项目 Q 相同的概念。对于这个假设。