阿里云飞天大数据产品价值解读——《一站式高质量搜索开放搜索》

一、如何评估搜索质量、体验与业务价值

1.搜索-无处不在
生活中多种不同场景需要进行搜索,在企业内部产品中也需要使用多种搜索功能,方便用户快捷地获取企业相关商品、服务、内容等信息。搜索在不同的企业业务中的角色可能有所不同。如下图所示,搜索在电商行业是十分重要的业务流量转化入口,在其他领域也必不可少。
搜索是用户获取信息的基础手段与能力,如果搜索不好用,用户信任度必会降低。如果搜索在某业务场景中使用不多,建议衡量业务的全站流量结构。
image.png
2. 评估搜索质量、体验与业务价值
六成左右客户不清楚如何评估搜索质量、体验与业务价值,那么引出以下问题。

  • 搜索的业务价值驱动力是什么?搜索在企业内部的业务价值驱动一般依靠被动的Bad case、KPI或业务需求。依靠Bad case驱动,搜索结果具有随机性,不固定时间地点场合,搜索体验差。KPI指标判断,容易片面和不知所以然。依靠业务需求指业务方或运营指明将某些搜索结果置于前排,意味着结果排序相关性势必会完全依赖于业务方经验而无法客观的保障用户的体验与业务转化,不具备可控性。以上三种业务价值驱动方式都存在较大问题。
    目前许多企业的做法是根据上述所谓的内部搜索业务价值驱动力,做召回、排序、业务需求以及扩展搜索历史等功能。
  • 如何衡量?主观?客观?如果明确了搜索的业务价值驱动力,如何衡量驱动效果,即业务价值?具有客观的体系化衡量手段才有可能实现客观的判断。
    下图所列举为一套以淘宝内部为典型的搜索上线流程。首先需要有监控/评估搜索用户体验的方法,周期性评测用户体验。通过监控/评估明确迭代/专项。在上线前做一些A/B Test或灰度测试,如果没有问题可全量上线,并监控线上效果。例如翻页率下降,说明用户以往搜索10页才能找到的内容现在1、2页就可以找到,搜索体验提升。

该链路是主动监控、评估搜索业务价值的,好的驱动力应该是高效的体系化的持续化的实现交付价值。
那么如何衡量搜索业务价值?该链路源头是监控/评估能力,需要有体系化、专业的报表与评估服务。报表是客观性数据,只能反映果而不能体现因,评估服务是人工主观评估服务。监控/评估取代了所谓Bad case、KPI、业务需求,更加体系化地衡量搜索体验。

image.png

如下图所示,OpenSearch报表评估提供5大维度的30+指标。报表只能体现整体结果,而局部效果的评估可以根据大量指标从不同视角得出不同结论。五大维度分为流量指标、点击类指标、用户分析类指标、Query分析类指标、成交指标,核心指标由其提炼而来。
以往每天上班第一件事是查看关键指标,如发现可能存在问题,需要检查连带影响,确保报表各项核心指标正常后才会展开其他工作。因此该体系化、专业的报表与评估服务不仅带给客户一种技术能力,更使客户能够在平台上完整落地、驱动搜索业务。

image.png

  • 如何高效、可持续、体系化地交付搜索价值?搜索的相关市场、场景、用户、文化一直处于变化中,明确搜索业务价值驱动力、衡量方式后,如何高效、可持续、体系化地交付搜索价值?
    与一般开源不同,OpenSearch提供的不是需要客户自行拼搭开发的零散工具,而是一套完整服务,一切皆为提升业务价值、体现大家的专业能力。OpenSearch服务主要有以下四个特点。第一,免运维,客户只需要提供数据并配置满足自身业务诉求的策略。第二,开箱即用,只需提供数据与配置策略,操作便捷。第三,一站式,提供搜索核心功能、扩展功能。第四,高搜索质量。

下图所示为搜索上线流程,创建应用、上传数据并进行简单调试后即可发布上线。若过程顺利半天即可完成。
image.png

二、OpenSearch背景与核心能力介绍

OpenSearch是阿里巴巴自研的搜索引擎,过去一直支持并服务阿里内部应用,经过千锤百炼才沉淀到可以赋能市场上其他企业。
image.png
搜索的核心是做召回、排序、业务需求以及功能扩展,投入重、依赖多、周期长,一般企业难以投入大规模人力与资源。因此开发性能与体验优秀的搜索引擎并非易事。
image.png
召回核心模块为分析器与查询分析。中文博大精深,易生歧义,分词效果至关重要。召回内置多种分析器,分析语言意图。查询分析提供同义词、纠错、词权重、实体识别、停用词分析等必备功能。
排序方面支持二次排序,是大数据量召回的有效解决方式。还支持类目预测、人气模型,支持表达式以及Cava排序定制。
根据业务需求需要支持混排、打散、词典管理等功能实现。混排指在搜索召回结果中根据业务需求相应展示视频、文字、图片等不同媒体类型结果。例如在淘宝搜索结果中,打散指品牌、价格等打散展示。
扩展即功能性扩展,如A/B Test、搜索框下拉提示、热搜&底纹(默认搜索词)、飘红、Debug工具等。
召回、排序、业务、扩展都是为了服务客户,使客户能以最小成本、最短时间交付高质量业务价值而提供的能力。
1.分析器
分析器是影响搜索效果的基础模块,不同业务场景需要使用不同分析器,需要用户结合自身业务场景自行选择。目前OpenSearch集成了12种分析器供用户选择,用户也可上传自己的分词词条个性化定制分析器。
image.png

下图所示为阿里OpenSearch电商分析器与开源IK分析器对比数据,可见OpenSearch分析器的分词效果相对优于IK开源分析器。该对比随机抽取100个电商类Query,下图列举部分结果。例如925银耳饰,开源IK分析器分词有“银耳”一项,OpenSearch电商分词理解显然更优。
image.png
2.类目预测
用户搜索意图可分为精搜、泛搜,类目预测即预测用户搜索某一Query时目标类目的结果。类目预测并非依靠个人体感,而需要符合市场需求,根据行为数据尽可能快速满足用户需求。
如下图所示,使用类目预测前在淘宝搜索光明,可能出现米、面、奶等多种相关商品。而根据用户点击行为数据,100个用户搜索光明,绝大多数点击的商品是光明牛奶,意味着用户搜索光明通常是搜索光明牛奶,因此使用类目预测后前排推荐商品变化为光明牛奶。
类目预测也可使用纯文本方式。

案例——双面胶:多数时候搜索双面胶指办公用品,然而一段时间内电视剧《双面胶》很热,出现了许多相关周边产品。那么用户在该阶段搜索双面胶想要的商品或许会发生变化,可通过用户行为数据进行类目预测。
案例——播、海贼王、柯南:“播”是一个服装品牌,多数时候需要召回的内容为该品牌服装。海贼王、柯南等Query,需要根据市场需求,通过类目预测提供更合适的结果。
image.png
3.人气模型
淘宝早期搜索结果排序方式非常简单,宝贝发布后上架试7天,剩余下架时间越短排序越靠前,所有卖家都有相同的机会获得流量,对卖家、买家都相对公平。然而该模式无法将价值最大化,并不经济。
因此淘宝很早发布了人气模型,尽可能与市场趋势匹配,使用户更加满意,从而转化为最大价值。用户体验好,对优质卖家、商品也更公平,是当前默认模型。
image.png
4.热搜&底纹
image.png

三、典型案例

1.召回
下图所示站点是以UGC内容为主的论坛。由于站内搜索用户地域表达与文化习惯差异大,易生歧义,导致搜索体验差。因此该类搜索场景要求搜索引擎具备较强的语义理解能力,根据搜索和文档的真实语义进行智能匹配。
词权重分析:如下图所示,搜索问题为“胎停有什么症状”,基于优秀的召回质量,通过词权重分析能够给出较好的结果排序。
拼写纠错、同义词扩大召回:如下图所示,由于用户方言习惯等问题,搜索关键词时将“剖腹产”误输入为“抛妇产”,通过拼写纠错等功能,仍然可以正确识别用户意图,提供相关内容。
**客户评价-1:简单无门槛,连不懂技术的产品经理都可以使用OpenSearch对业务进行迭代,大大缩短了项目的迭代周期。
客户评价-2:提高效率,目前技术团队没有专职优化搜索的技术人员,只是根据项目需求做临时优化即可,省力省心。**
image.png
2.技术类内容社区
某国内最大的中文IT内容社区,涉及众多业务场景,由于是技术类内容社区,需要提供强大、优秀的搜索服务。
该社区花一年时间基于开源自建搜索服务,效果不佳。因此该社区试行OpenSearch。
下图所示为基于开源自建搜索服务与基于OpenSearch服务的搜索效果对比。搜索同一关键词Win10重装,可见基于OpenSearch服务的搜索语义理解更优,提供的搜索结果相关性更高。
由于该社区搜索词专业垂直度高,通用分词不足以支持,需要自定义词典,并结合了阿里NLP通用Query智能分析+人气模型。
效果:对比基于开源自建的搜索服务CTR提升80%+,对比友商CTR提升3%。
image.png

 

 

原文链接
本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/515226.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker 构建企业级Maven私服仓库 nexus3

文章目录一、环境准备1. 安装docker2. 启动docker3. 拉取镜像4. 目录权限5. 创建容器6. 监控日志二、登录配置2.1. 效果验证2.2. 登录2.3. 初始化三、仓库配置3.1. 创建仓库3.2. 创建用户3.3. 补充知识点四、本地项目部署jar到私服4.1. 配置用户4.2. 添加远程仓库配置4.3. 发布…

淘宝直播三大核心技术揭秘

背景-全民直播大时代 在疫情的影响下,直播从传统的秀场应用逐渐渗透到行业的各个领域。包括在线课堂,旅游,政企,房车销售等等,可以说是全民直播时代已经到来。 在这样的一个大背景下,过去一年淘宝直播得以快…

Java 领域offer收割:程序员黄金 5 年进阶心得!

怎样才能拿到大厂的offer?没有掌握绝对的技术,那么就要不断的学习。如何拿下阿里等大厂的offer的呢,今天分享一个秘密武器,资深架构师整理的Java核心知识点,面试时面试官必问的知识点,篇章包括了很多知识点…

开放下载!《深入浅出玩转物联网平台》

物联网正在迅速发展、势不可当,企业或创业者该如何面对? 本书从实际需求出发,分为上下两卷,和读者一起从多角度认识物联网。作者从复杂的IoT产业链中,选取了多个经典案例结合知识点进行分类总结,集结成此书…

从电源问题出发,带你揭秘新体系结构范式 COA

简介: 本文整理自 2020 年云原生微服务大会主论坛白海石的分享《Capability Oriented Architecture for cloud and edge》,主要介绍了一种新的体系结构范式——面向能力的体系结构(COA),旨在为跨云和边缘的分布式、自适…

从蜜罐新技术看欺骗防御发展走向

随着攻防演习日益实战化、常态化使得蜜罐从十几年的老安全技术焕发新春,基于蜜罐演进而来的欺骗防御也因此而名声大噪,越来越多的安全厂商已经将资源投入到此技术领域。在最近信通院组织的蜜罐产品能力评测中,参与的主流厂商有36家之多。蜜罐…

对话 Dubbo 唤醒者北纬:3.0 将至,阿里核心电商业务也在用 Dubbo

简介: 如今,Dubbo 已经毕业一年,越来越多开发者开始询问 Dubbo 3.0 到底有哪些变化,阿里巴巴内部到底用不用 Dubbo,这是不是一个 KPI 开源项目以及 Dubbo 和 Spring Cloud 之间到底是什么关系。本文,将独家…

分布式ELK+KAFKA日志采集 docker-compose

文章目录一、安装docker-compose插件1. 下载docker-compose插件2. 赋予权限二、搭建ELKKAFKA环境2.1. 编写docker-compose2.2. 启动docker-compose2.3. 验证效果2.4. 安装logstash三、微信项目投递消息kafka3.1. 微信集成kafka3.2. 配置kafka3.3. aop拦截3.4. 消息投递3.5. 测试…

java安全编码指南之:基础篇

简介: 作为一个程序员,只是写出好用的代码是不够的,我们还需要考虑到程序的安全性。在这个不能跟陌生人说话世界,扶老奶奶过马路都是一件很困难的事情。那么对于程序员来说,尤其是对于开发那种对外可以公开访问的网站的…

Gartner:70%新应用由低代码开发,AI热潮后小数据崛起

作者 | 宋慧 出品 | CSDN云计算 头图 | 付费下载于东方IC 国际研究机构Gartner在近日发布了2021年十大数据和分析趋势。纵观这十个趋势,基本可以归纳为三类主题,分别是: 加速数据和分析变革:运用AI创新、经过改进的可组合性以及…

Sentinel 1.8.0 年度版本发布,熔断降级重构升级!

在经过数月的打磨后,Sentinel 1.8.0 版本正式发布!该版本是本年度最重要的版本之一,包含大量特性改进与 bug 修复,尤其是针对熔断降级特性的完善升级(支持任意统计时长、慢调用比例降级策略、熔断器事件监听&#xff0…

清华大学-美团数字生活联合研究院成立

转载自清华新闻网 4月12日,清华大学-美团数字生活联合研究院(以下简称“清华美团数字生活研究院”)揭牌仪式暨管委会第一次会议在清华大学举行。仪式上,清华大学副校长杨斌与美团联合创始人王慧文共同为联合研究院揭牌。 杨斌表…

SpringCloud 应用在 Kubernetes 上的最佳实践 — 高可用(熔断)

前言 阿里巴巴十多年的双十一,锤炼出来了一套业界领先的高可用技术,有一些已经商业化(云产品 PTS、AHAS),也有的开源了如:Sentinel、ChaosBlade。我们这一系列的高可用章节也主要介绍这方面的内容。今天介…

shadingjdbc实战分表分库

文章目录一、问题汇总1. 水平与垂直拆分之间的区别?2. 单表达到多大量开始进行分库分表?3. 基于客户端与服务端实现分表分库区别?4. 数据库分表分库策略有哪些?5. 自定义范围分表算法实现分表?二、整合ShardingSphere实现分表2.1…

阿里云机器学习怎么玩?这本新手入门指南揭秘了!

想知道我是怎样免费在阿里云上玩机器学习的吗? 不慌,这就告诉你答案~ 它来了--阿里云向个人免费开放云端深度学习开发环境DSW(DataScienceWorkshop),还有免费GPU资源可以使用,实验的数据还会免费保存30天&a…

华为庞鑫:闪存3.0时代,四大变化激发全闪存数据中心潜能释放

从2005年到2019年间,中国数字经济总体规模由2.6万亿元增加至35.8万亿元,数字经济在GDP的占比也由14.2%提升至36.2%。随着数字经济蓬勃发展,数据也成为当之无愧的关键生产要素,是基础性资源和战略性资源。数据洪流的到来进一步驱动…

基于RabbitMQ订单未支付30分钟自动取消

文章目录一、原理实现1. 超时消费流程图2. 死信队列的架构原理3. 订单超时30分钟实现原理二、核心代码实战2.1. 记录订单待支付数据2.2. 超时消费者监听2.3. 订单核对校验一、原理实现 1. 超时消费流程图 2. 死信队列的架构原理 相同点: 死信队列和普通队列区别不…

蚂蚁mPaaS:有人修建高楼,有人重构城市

简介: 纵览这时代的先声,在高楼之巅,在海天之外。 2018年2月,春运拉开序幕。 这是人类史上最大规模的迁徙活动,3.82亿人坐进车厢,被31万趟车次送往不同的目的地。如果有一台摄影机从高空对准中国大地&…

全场景闪存加速、全场景数据保护,华为助力医院实现智能化转型

数字经济时代的来临,是影响当今医疗健康服务领域最重要的大趋势。在这种大背景下,新时期的智能医疗必将在医疗行业内掀起一阵浪潮。2020年,新冠疫情的肆虐势必推进浪潮的提前到来。 首都医科大学附属北京同仁医院,始建于1886年&a…

从Cloudflare事件,看DNS服务的重要性

简介: 美国时间7月17日,美国知名的网络安全服务提供商Cloudflare,出现了突发网络服务故障。通过这个事件,和大家聊聊关于网络安全稳定的思考,以及稳定、安全的DNS服务的重要性。 7.17事件 美国时间7月17日下午&#…