专题实战 | 如何快速构建高质量电商行业搜索?

简介:本文详细介绍如何快速接入智能开放搜索(OpenSearch)电商行业增强版,助力企业实现高质量搜索效果,提升业务转化率及用户产品体验!

电商搜索特点

1. 关键词堆砌

例如:明星同款夏季连衣裙包邮;

2. 词序对语义影响不大

例如:明星同款女夏季连衣裙包邮,女夏季连衣裙包邮明星同款;

3. 类目预测问题

例如:当用户查询“苹果”时,可能查询的是水果,也可能是手机品牌;

4.查询召回文档相关性差

核心词识别不准确,分词不准确;

5. 搜索引导的业务转化比重较大

据统计,综合类电商搜索引导转化占比40%以上,垂直类电商搜索引导转化占比60%以上;

6. 稳定性要求较高,支持弹性扩容

活动、大促系统QPS可能是平时的百倍千倍,需要平滑的扩缩容,保障系统的稳定;

开放搜索电商行业方案优势

  1. 基于淘系同款搜索引擎-问天(Ha3),提供更高性能的搜索服务,系统稳定高效,海量数据实时更新;
  2. 电商行业知识图谱能力,支持电商属性的分词、纠错、同义词、停用词、实体识别、词权重、类目预测等行业查询语义理解能力,精准定位用户搜索意图,提升业务转化,降低无结果率;
  3. 丰富的电商搜索服务经验,源自阿里巴巴内部搜索技术的云服务输出,集团内500+业务接入,阿里云电商客户服务数千家;
  4. 通过引擎侧的多路召回能力,支持搜索结果、下拉提示、底纹词等场景实现个性化搜索服务;
  5. 轻松接入,快速上手,一键式接入行业模板,可根据自身业务自定义选择功能,并满足非技术人员业务干预调优与数字化运营需求;

了解更多电商搜索能力:https://c.tb.cn/F3.0VTxwn

开放搜索电商增强版接入流程

注册阿里云账号(已有账号无需注册),并实名认证,创建好实例,如果是非本人使用,可以授权子账号权限,更多详情查看> 。

如果您已经对搜索有一定的了解或者是已经使用过开放搜索产品,则可以参考功能流程图以便更快速、更全面的了解开放搜索的能力。

表结构设计

接入开放搜索前,需要预先设计好表结构(可单表,可多表join),以便后期应对各种搜索业务场景和数据推送场景。目前开放搜索支持的多表场景如下:

详情可参考应用结构--->创建多表join。

注意

电商行业模板中以下字段是必须字段,类型、字段标签固定,字段名称可自定义:

数据接入

开放搜索支持用户通过数据源将数据接入搜索,也支持无数据源,通过API/SDK/控制台上传文件的方式导入数据详情如下:

  1. RDS数据源配置
  2. MaxCompute(原ODPS)数据源配置
  3. POLARDB数据源配置
  4. API/SDK数据导入

电商行业模板配置

选择分析器

电商行业模板中以下索引标签、分析方式固定,索引名称可自定义:

开放搜索还向用户提供了面向其他行业、语言的分析器,如有相应业务需求,可参考内置分析器。

设置查询分析规则

查询分析模板请选择,系统默认勾选的分析包:

 查询分析的详情内容可点击此处进行参考。

设置排序策略

电商行业模板会自动根据用户配置的应用结构中的字段、索引去生成适合该应用的基础排序和业务排序,详情如下:

基础排序

0.6*static_bm25()+0.4*normalize(sales)

业务排序

query_match_ratio(cate_id) * 1000 + floor( if(field_match_ratio(brand) == 1, 1, field_match_ratio(brand) * query_match_ratio(brand)) + if(text_relevance(product_title) + text_relevance(cate_id) + text_relevance(brand) == 0, -1, 0) ) * 1000 + (text_relevance(product_title, default, true) * 0.3 + text_relevance(cate_id) + text_relevance(brand) + 0.5) * (normalize(sales) + 0.3) * if(is_sale, 1, 0.9) * timeliness_ms(up_time)

开放搜索中的排序策略较为灵活,您可根据自己的业务需求进行修改或自定义,详情可参考排序表达式配置。

搜索引导服务

下拉提示模型配置

下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。

热搜底纹模型配置

热搜和底纹是一个完整搜索引擎必备的基本功能,通常占据着搜索框入口的重要位置,提供不可或缺的业务价值。

原文链接

本文为阿里云原创内容,未经允许不得转载。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511527.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux 网络性能的 15 个优化建议!

作者 | 张彦飞allen来源 | 开发内功修炼那么具备了对网络的深刻的理解之后,我们在性能方面有哪些优化手段可用呢?我这里给出一些开发或者运维中的性能优化建议。这些建议都是从书中摘录的。不过要注意的是,每一种性能优化方法都有它适用或者不…

Flink Sort-Shuffle 实现简介

简介:Sort-Shuffle 使 Flink 在应对大规模批数据处理任务时更加游刃有余 本文介绍 Sort-Shuffle 如何帮助 Flink 在应对大规模批数据处理任务时更加游刃有余。主要内容包括: 数据 Shuffle 简介引入 Sort-Shuffle 的意义Flink Sort-Shuffle 实现测试结果调…

「现代C++设计魅力」虚函数继承-thunk技术初探

简介:工作中使用LLDB调试器调试这一段C多继承程序的时候,发现通过lldb print(expression命令的别名) 命令获取的指针地址和实际理解的C的内存模型的地址不一样。那么到底是什么原因呢? 作者 | 扬阜 来源 | 阿里技术公众号 一 问题背景 1 实…

万物互联时代到来,锐捷发布场景化无线零漫游方案

数字化和万物互联时代到来,物联网与 IoT 设备发展迅猛,以往只在办公区域主要由手机等移动设备使用的无线网络,正在接入更多核心业务生产、物流仓储等各类的生产设备。据分析机构 IDC 预测,无线网络优先是当下智能园区网络建设投资…

阿里云田涛涛:高效智能的云,CloudOps让运维更简单

简介:CloudOps:以应用为中心的自动化运维新趋势 12月21日,在阿里云弹性计算年度峰会上,阿里云弹性计算体验与控制系统负责人田涛涛发表了主题为《高效智能的云,CloudOps让运维更简单》的演讲,深度解读了云上运维新趋势…

打造南沙“强芯”,南沙首届IC Nansha大会召开

6月25日,2022 中国南沙国际集成电路产业论坛在广州南沙召开。本次峰会由广州南沙经济技术开发区管理委员会、广州市工业和信息化局主办;支持单位为广州湾区半导体产业集团有限公司、广东省集成电路行业协会、广州市半导体协会;广东省半导体及…

OpenAI开发者大会简介

文章目录 GPT-4 Turbo 昨天晚上 OpenAI的首届开发者大会召开 Sam Altman也做了公开演讲,应该说 这是继今年春天发布GPT-4之后 OpenAI在AI行业又创造的一个不眠夜 过去一年 ChatGPT绝对是整个科技领域最热的词汇 OpenAI 也依靠ChatGPT取得了惊人的成绩 ChatG…

阿里云贾少天:大规模云服务器高效使用及管理实践

简介:本篇内容分享了大规模云服务器高效使用及管理最佳实践。 2021年10月22日,在云栖大会的《云上运维最佳实践》分论坛,阿里云高级技术专家贾少天发表了主题为“大规模云服务器高效使用及管理最佳实践”的演讲,本篇内容根据他的…

发现新视界——视觉计算将如何改变生产方式

简介:本篇内容将从3个部分为读者介绍关于视觉计算如何改变生产方式,进一步阐述可视化业务方面的挑战及阿里云视觉计算的解决方案与优势。 编者按:在2021年10月举办的云栖大会的《数字孪生&Cloud XR技术助力产研创新论坛》上,…

容器监控指南:三剑客轻松实现 Docker 容器监控

作者 | Milan Mahat在本指南中,我们将学习如何使用 docker-compose 在容器中设置 cAdvisor,将其与 prometheus 连接,并通过 grafana 监控服务器的容器。CAdvisor 是一种流行的工具,用于收集容器的信息。它是 prometheus 和 grafan…

N个技巧,编写更高效 Dockerfile|云效工程师指北

简介:云原生时代下软件的构建和部署离不开容器技术。提到容器,几乎大家下意识都会联想到 Docker 。而 Docker 中有两个非常重要的概念,一个是Image(镜像),一个是Container(容器)。前…

TDA-04D8变送器数据上报阿里云

简介:本文将以TDA-04D8变送器作为采集对象,使用海创微联采集控制系统对TDA-04D8变送器进行采集,然后将设备上的毛重、净重、皮重数据采集上传到阿里云物联网平台,阿里云物联网平台将数据实时可视化。 文章分为3部分: …

http ,怎么优雅的拒绝你

作者 | 奇伢来源 | 奇伢云存储典型问题:服务端优雅的拒绝今天分享一个后端编程的实际经验。这个问题来源于对象 S3 后端协议实现的技巧思考。场景:服务端不想接收 http 的 body 的时候,该怎么优雅的拒绝呢?什么意思?对…

企业物联网平台新版公共实例升级企业实例教程

简介:2021年7月30日企业物联网平台重磅升级,发布的新版公共实例支持一键升级企业版实例,本文将为大家介绍一键升级教程 一、企业版实例,企业用户首选 企业物联网平台 提供设备上云必备的基础服务,用户无需自建物联网…

【全观测系列】Elasticsearch应用性能监控实践

简介:本文介绍了应用性能监控的应用价值以及解决方案等。 1、什么是全观测? 要了解全观测,我们先看看传统运维存在哪些问题。 数据孤岛,分散在不同部门,分析排查故障困难;多个厂商的多种工具&#xff0c…

es实战-使用IK分词器进行词频统计

简介:通过IK分词器分词并生成词云。 本文主要介绍如何通过 IK 分词器进行词频统计。使用分词器对文章的词频进行统计,主要目的是实现如下图所示的词云功能,可以找到文章内的重点词汇。后续也可以对词进行词性标注,实体识别以及对…

IC Nansha|AMD高级副总裁、大中华区总裁潘晓明:制程、架构、平台优化突破计算边界

6月25日,中国南沙国际集成电路产业论坛在广州南沙顺利举行。AMD高级副总裁、大中华区总裁潘晓明出席了本次会议,并在高峰论坛环节中以《高性能计算的未来》为主题发表了演讲。 (AMD高级副总裁、大中华区总裁 潘晓明) 作为一家深耕…

爱数SMART 2022峰会开启,分享数据战略与建设数据驱动型组织方法论

6月28日,爱数SMART 2022线上峰会全球直播正式开启。主论坛上,爱数正式提出了企业制定数据战略以及建设数据驱动型组织的方法论,并推出开源计划与数字伙伴计划2.0,共创数据驱动型组织。 通过清晰的数据战略,从容加速数据…

云原生时代开发者工具变革探索与实践

简介:本篇内容分享了原生时代开发者工具变革探索与实践。 分享人:马洪喜 行云创新CEO 正文:本篇内容将通过三个部分来介绍云原生时代开发者工具变革探索与实践。 一、云原生模块化开发概览 二、软件模块化开发特点 三、ADD产品简介 一、…

喜马拉雅 Apache RocketMQ 消息治理实践

简介:本文通过喜马拉雅的RocketMQ治理实践分享,让大家了解使用消息中间件过程中可能遇到的问题,避免实战中踩坑。 作者:曹融,来自喜马拉雅,从事微服务和消息相关中间件开发。 本文通过喜马拉雅的RocketMQ治…