相关动态
智能推荐:“相关性搜索”只给你最想要的
2024-11-10 17:06

在过去十年里,搜索已经变得无处不在——搜索框已然成为各类网站、应用的基础标配。一个网站或者应用不提供搜索框,这是无法想象的事情。随着搜索在基础架构方面越来越多的难题得到解决,加之解决方案的商品化进程,搜索引擎的竞争已经从如何提供快速、可伸缩的搜索,转变成如何针对用户的信息需求提供最相关的匹配。换言之,就是如何正确地理解用户意图,提高搜索的相关性,为用户提供满意的搜索结果。

智能推荐:“相关性搜索”只给你最想要的

什么是相关性

所谓相关性,就是根据内容对用户及业务需求的满足程度,对搜索内容进行排名的一门学问。它会将搜索引擎打造成一个看似智能的系统,能够理解用户和业务的需求。让搜索引擎理解内容中包含的重要特征(feature):比如餐厅的位置,书中出现的词汇,或者衬衫的颜色这样的属性。有了准确的特征,当用户在应用内搜索时,就可以计算出什么对他们而言是重要的:这家餐厅离我有多远?这本书上讲的内容对我有帮助吗?这件衬衫和我刚买的裤子搭配吗?这些在搜索期间影响排名的因素,是用来衡量用户所关心的内容的,称之为信号(signal)。搜索引擎面临的挑战,就是在不同特征之间做出选择,并实现能满足用户与业务需求的信号。

然而,技术只是实现相关性的工具,明白要做什么可能比知道怎么做更重要。“相关性”在某个具体应用里的含义大相径庭。

在不同的应用中其搜索相关性大不相同

我们很容易误以为搜索是一个单一问题。事实上,不同的搜索应用之间,彼此差异非常大。每个应用都有截然不同的相关性预期。

通用型搜索应用,比如Google,要返回有用而可靠的信息。利用PageRank,Google 不仅为用户返回了与搜索相匹配的内容,而且这些内容还是被网络上其他地方认为是可靠和可信的。

电商网站对于被搜索的内容拥有完全的控制,它们较少关注可信度。电商网站为了达成交易,就要根据用户的搜索行为、历史数据等信息,为用户推荐合适的商品,促进销售。

医疗、法律和学术研究领域的专家搜索,通过更为深入地挖掘文本来定义相关性。这种专家搜索依赖于对专业人员输入的行业术语的理解。这类解决方案必须掌握专业领域里各种事物之间的微妙关联。比如,“Heart Attack(心脏病)”和“Myocardial Infarction(心肌梗死)”是一回事;或者急性“Myocardial Infarction”是一种特殊类型的“Heart Attack”。

再往下细分,还会发现更多的不同。比如房产搜索是一种电商搜索吗?两者固然有相似之处(让用户买得称心),但对于一名购房者而言,还有许多其他因素需要考虑(所在学区、邻里关系、户型)。本地餐饮的搜索应用呢?就医的搜索呢?用餐馆菜单来订餐呢?企业内网的搜索呢?

相关性需求多种多样,有时候用户甚至有可能还没有意识到自己的需求是什么,但是开发者却必须通过各种方法,挖掘出其真实需求,迎接业务带来的挑战。

信息检索与相关性

那么,搜索的相关性有系统性的基础和通用的工程性原则吗?答案是有的。事实上,在相关性的背后藏着一门学问:学术领域里的信息检索(information retrieval)。它包含被普遍接受的各种实践,可以对广泛分布在各行各业的相关性加以改进。

在信息检索中,相关性被定义为一种返回搜索结果的实践,它能最大限度地满足用户的信息需求。而且,典型的信息检索关注的是文本排名。信息检索中的很多发现,都是在试图衡量给定的文章与用户的文本查询在多大程度上具有相关性。这些发现中有很多都已经在开源的搜索引擎中被实现了。

然而应用的相关性取决于各种因素,有些因素具有广泛性和普遍性,它们所涉及的就是信息检索中的文本排名;还有很多因素都是和具体应用息息相关的(比如,用户距离餐厅有多远)。经典的信息检索技术对于解决相关性问题,确实能有所帮助,但是还有一些问题则爱莫能助。这些问题很大程度上游离于搜索技术之外,且涉及更为广泛的各种产品策略问题:我们的用户是谁?他们希望通过这个应用得到什么?搜索要解决的那些隐含在其中而未加指明的信息需求是什么?

如何解决相关性

开源搜索引擎可以通过编程的方式将我们对相关性的理解植入搜索引擎,打造相关性解决方案,使之既满足用户需求,又符合业务目标。采用开源引擎怎样定义出一个框架,既包含狭义的领域特定因素,又用到广义的信息检索技术呢?以下几点是需要考虑的。

ü 识别出能够刻画内容、用户或搜索查询的关键特征。

ü 通过对特征的提取和对内容的丰富,想办法让搜索引擎理解这些特征。

ü 在搜索期间,通过构造信号来对用户搜索的相关性加以度量。

ü 在对结果进行排名时,通过控制排名函数,仔细平衡多个信号之间的影响。

    以上就是本篇文章【智能推荐:“相关性搜索”只给你最想要的】的全部内容了,欢迎阅览 ! 文章地址:http://yejunbin01.xhstdz.com/news/1553.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://yejunbin01.xhstdz.com/mobile/ , 查看更多   
最新文章
掌握百度收录规则:优质内容与创新性助力网站成功收录
百度收录有其特定的规则,这对网站制作人员和内容制作者来说极为关键。掌握这些规则,能让更多人的目光落在自己的网页或文章上。
搜狐简单AI:开启AI绘画和文生图的新时代,提升创作效率
在一个充满竞争的数字时代,许多创作者深感压力,尤其是那些需要频繁生产高质量内容的个体。在这样的背景下,AI技术的崛起为创造
AI大模型与网球运动结合的应用场景及案例分析
        AI大模型与网球运动结合的未来前景是广阔的,它不仅能够提升运动员的训练和比赛表现,还能改善教练
最值得一看的精品网站之一,你绝不能错过!
在现代网络文学的浪潮中,精品小说层出不穷,吸引了无数读者的目光。推荐几部不可错过的网络佳作:首先是《全职高手》,讲述了电
郑州SEO优化攻略,揭秘助力企业网络飞跃的策略精髓
郑州SEO网络优化推广,为企业提供专业网络策略,提升网站排名,增强品牌曝光度。通过精准关键词、高质量内容、优化用户体验,助
揭秘网站刷关键词排名软件,效果与风险并存
随着互联网的飞速发展,网络营销已经成为企业推广产品和服务的重要手段,在众多网络营销策略中,提高网站在搜索引擎中的关键词排
科大讯飞AI智能写作:全方位助力文案创作与优化,解决多种写作需求
在数字化浪潮的推动下智能写作成为了提升工作效率、优化内容品质的关键工具。科大讯飞智能写作以其强大的语言解决能力和丰富的创
支付宝小程序搜索排名优化,算法规则基础了解
小程序市场可谓是百花齐放,争奇斗艳。小程序搜索排名优化则为小程序获利提供了强大的支持。做优化首先要知道平台的规则&#
解析国内AI写作平台:创新背后的挑战与突破
一、国内 AI 写作平台兴起近年来,随着人工智能技术的飞速发展,国内 AI 写作平台如雨后春笋般涌现。这些平台利用深度学习、自然
解析百度的绿萝算法怎样识别买卖链接
  作为站长,大家都知道,百度于2013年2月20日推出了最新的搜索引擎算法,起名叫绿萝,公告称这个新算法主要是打击买卖链接的
相关文章