您好,欢迎来到优网店!
027-59261398
咨询热线:  400-088-9970  
首页 天猫商城 淘宝商城 京东商城 其他商城 网店出售 购买网店

简单了解淘宝搜索算法系统


首先我们弄清楚淘宝搜索排序的目的是什么?是为了帮用户快速的找到他们所需要的宝贝(商品)。从技术层面来说,就是在用户输入商品关键词自动匹配到这个关键词所代表的商品,并且淘宝搜索系统会把最符合用户需求的商品排到前面然后会把其他的排在后续相应的位置。为了营造更好的用户体验,算法排序系统的基本逻辑就是以下三个点


优网店-专业天猫交易平台!


一.算法的基本模型

当用户输入宝贝关键词进行搜索的时候,系统依据算法来给这个关键词匹配到的每个商品进行实时的计算,并按照相应的分数的大小对商品进行排序,同时展现到用户的面前

对于一个好的算法模型来说,首先我们要考虑用哪些特征因子来判定跟这个关键词高度匹配等就和我们在网页中搜索一样淘宝的算法模型基本跟搜索引擎一样,就是把网页的重要性和相关性给网页评判个分数,然后进行相应的排序。搜索引擎中网页和关键词的相关性,和重要性就是搜索引擎系统排序模型中两个重要因子。我们具体来说相关性因子是指搜索关键字在一篇文档中出现的频次和度数,当这个频次和度数越高时,则搜索引擎则认为该文档和关键词的相关度越高。重要因子比如GooglePagerank,我们可以把它理解为一个网页入口超级链接的数目:一个网页被其他网页引用得越多,则这个网页就会被Google认为有很高的价值。特别一个网页被很多重要的网页所引用那么这个网页的重要程度也就会被认为相当之高

二.线下评估的重要性

算法模型的评估实际上会被分为线上的评估和线下的评估,线下的评估大多数都体现在搜索中常用的相关性指标。相关性我们可以把它定义狭义和广义两方面,狭义相关性指检索结果和用户查询的相关程度高不高。而从广义的层面上来说可以理解为用户查询看到系统展示的商品是否满意也就是说当用户在搜索输入相关的关键词之后,得到的结构是否满足,如果这之间经历的过程越顺畅越快速那么系统则认为搜索相关性好。

三.线上测试的方法

如果想真实验证一个算法模型的好坏,这个时候就需要有另外一个系统提供真实的流量来检验这个系统。淘宝搜索实现的BTS系统就是处于这样的一个环境,用户搜索的同时,由搜索系统根据一定的策略来自动决定用户的分组号,保证自动抽取导入不同分组的流量具有一定的可对比性,然后让不同分组的用户看到不同算法模型提供的结果。用户在不同模型下的行为将被记录下来,这些行为数据通过分析之后形成一系列指标,而通过这些指标的比较,最后就可以来比较不同模型谁好谁坏,只要分组的流量达到一定的程度之后这些数据指标从统计意义上来说就具有可比性。

其实,大部分时候我们都有好几个模型和功能在线上测试,我们一般都BTS的方式来观察测试的情况,如果测试稳定就开放给所有用户,如果没有稳定或者提升一般不会开放给用户

现在大家了解淘宝搜索系统的基本原理之后,对于做天猫店铺的大家来说应该是很大的好处的。







今日推荐阅读:DSR下滑原因

优网店是国内电商中介知名品牌,专业提供天猫店铺、商城出售转让服务。网店出售网店转让就找优网店!