使用阿里云试用Elasticsearch学习:使用内置模型 lang_ident_model_1 创建管道并使用

文档:https://www.elastic.co/guide/en/machine-learning/current/ml-nlp-deploy-model.html

部署刚刚下载好的内置模型

在这里插入图片描述
在这里插入图片描述

部署内存不够用

在这里插入图片描述
还得花钱,拉几把倒吧。就用自带的吧。

测试模型

在这里插入图片描述

POST _ml/trained_models/lang_ident_model_1/_infer
{"docs":[{"text": "The fool doth think he is wise, but the wise man knows himself to be a fool."}]
}

以下是高概率预测英语的结果。

{"inference_results": [{"predicted_value": "en","prediction_probability": 0.9999658805366392,"prediction_score": 0.9999658805366392}]
}

创建管道

添加处理器

reference 推理

# Field map
{"message": "text"
}
# Inference configuration
{"classification":{"num_top_classes":5}
}

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/ead8f9cf189f422c8f6885a6dbe1403a.png
set 设置

#  field 
event.ingested
# value 
{{{_ingest.timestamp}}}

在这里插入图片描述

失败处理器

在这里插入图片描述

测试

[{"_source": {"text_field":"Hello, my name is Josh and I live in Berlin."}}
]

在这里插入图片描述

[{"_source":{"message":"Sziasztok! Ez egy rövid magyar szöveg. Nézzük, vajon sikerül-e azonosítania a language identification funkciónak? Annak ellenére is sikerülni fog, hogy a szöveg két angol szót is tartalmaz."}}
]

在这里插入图片描述
在这里插入图片描述

测试没问题,创建管道

在这里插入图片描述

使用

安装插件

注意版本号与es版本一直,都是8.9.1。安装完会自行重启。
下载mapper-annotated-text安装包
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/acc4f9669673445fa673d204baff59a0.png

映射索引

注意message字段别写错

PUT ner-test
{"mappings": {"properties": {"ml.inference.predicted_value": {"type": "annotated_text"},"ml.inference.model_id": {"type": "keyword"},"message": {"type": "text"},"event.ingested": {"type": "date"}}}
}

索引文档

通过管道 lang_ident_model_1 索引一批文档

POST /_bulk?pipeline=lang_ident_model_1
{"create":{"_index":"ner-test","_id":"1"}}
{"message":"Hello, my name is Josh and I live in Berlin."}
{"create":{"_index":"ner-test","_id":"2"}}
{"message":"I work for Elastic which was founded in Amsterdam."}
{"create":{"_index":"ner-test","_id":"3"}}
{"message":"Elastic has headquarters in Mountain View, California."}
{"create":{"_index":"ner-test","_id":"4"}}
{"message":"Elastic's founder, Shay Banon, created Elasticsearch to solve a simple need: finding recipes!"}
{"create":{"_index":"ner-test","_id":"5"}}
{"message":"Elasticsearch is built using Lucene, an open source search library."}

或者用query

POST lang-test/_doc?pipeline=ner-test
{"message": "Mon pays ce n'est pas un pays, c'est l'hiver"
}

查看数据

"hits": [{"_index": "ner-test","_id": "1","_score": 1,"_source": {"message": "Hello, my name is Josh and I live in Berlin.","event": {"ingested": "2024-04-13T20:31:48.855089336Z"},"ml": {"inference": {"predicted_value": "en","top_classes": [{"class_name": "en","class_probability": 0.9854748734614491,"class_score": 0.9854748734614491},{"class_name": "tg","class_probability": 0.003855695585908385,"class_score": 0.003855695585908385},{"class_name": "ig","class_probability": 0.0036940515396614113,"class_score": 0.0036940515396614113},{"class_name": "sw","class_probability": 0.0021393582129747924,"class_score": 0.0021393582129747924},{"class_name": "it","class_probability": 0.0011839650697029283,"class_score": 0.0011839650697029283}],"prediction_probability": 0.9854748734614491,"prediction_score": 0.9854748734614491,"model_id": "lang_ident_model_1"}}}},......

文档重新索引到新目标

POST _reindex
{"source": {"index": "ner-test-new","size": 50},"dest": {"index": "ner-test","pipeline": "lang_ident_model_1"}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/814162.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

日常项目管理和开发中经常使用的Git统计命令

日常项目管理和开发中经常使用的Git统计命令 引言应用场景一:统计项目整体提交次数应用场景二:按开发者统计提交数量应用场景三:统计每日/每周提交活动应用场景四:统计单个文件或目录的修改频率应用场景五:按照commitI…

错题记录-华为海思

华为 海思数字芯片 参考 :FPGA开发/数字IC笔试系列(5) 华为海思IC笔试解析 FPGA开发/数字IC笔试系列(6) 华为海思IC笔试解析 SystemVerilog Function与Task的区别 $readmemh与$readmemb这两个系统任务是用来从指定文件中读取数据到寄存器数组或者RAM、ROM中。除了…

IP地址修改步骤详解

IP地址是网络设备在网络中的标识,它决定了设备在网络中的位置与可访问性。然而,在某些情况下,我们可能需要修改IP地址,以满足特定的网络需求或解决网络问题。虎观代理将详细介绍IP地址的修改步骤,帮助读者更好地理解和…

HarmonyOS4-学习入门知识总结

简单的组件学习: /*** weip 自定义控件* 自定义构建函数也是需要充电的地方,分全局和局部的* 全局:需要添加function关键字 局部:不加function关键字* Styles function 自定义公共样式 分全局和局部* Extends(Text) 继承模式 只…

langchain 加载 csv,json

csv from langchain_community.document_loaders.csv_loader import CSVLoaderloader CSVLoader(file_pathdata/专业描述.csv, csv_args{delimiter: ,,quotechar: ",fieldnames: [专业, 描述] }, encodingutf8, source_column专业)data loader.load() print(data)quote…

150个 HTML5 网站模版 量大慢选

HTML5 网站模版 No.1 HTML5 网站模版 No.1

计算机网络之同轴电缆,集线器,网桥,交换机,路由器

ping的过程 两台主机用交叉线连接,通过88.2ping88.3发现底层是先经过广播,通过arp协议,告诉我要找的ip是88.3,然后88.3主机收到后就把自己的mac地址发送回去,同理88.2发现是发给自己的后就进行接收,有了mac地址然后再通…

分类预测 | Matlab实现基于迁移学习和GASF-CNN-Mutilhead-Attention格拉姆角场和卷积网络多头注意力机制多特征分类预测/故障识别

分类预测 | Matlab实现基于迁移学习和GASF-CNN-Mutilhead-Attention格拉姆角场和卷积网络多头注意力机制多特征分类预测/故障识别 目录 分类预测 | Matlab实现基于迁移学习和GASF-CNN-Mutilhead-Attention格拉姆角场和卷积网络多头注意力机制多特征分类预测/故障识别分类效果基…

ASM 中的栈模型

Label 介绍 在 ASM 中,每一个 Label 必须对应一个 Frame,两个 Label 可以共享一个 Frame,可以理解为将两个 Label 合并了,而一个 Frame 只对应一个 Label,就是创建它的 Label。每一次定义一个方法,即执行 …

字体体积压缩

环境:python3 关键步骤: pip install fontTools目录详情: 执行 pyftsubset.exe SourceHanSansCN-Medium.ttf --text-file3500.txt然后打开:TTF To Woff2,选择文件上传,等待处理,下载,使用 附常用汉字,字体文件请善用百度 3500.txt 工才下寸丈大与万上小口山巾千乞川亿个…

【C++算法竞赛 · 图论】图的存储

前言 图的存储 邻接矩阵 方法 复杂度 应用 例题 题解 邻接表 方法 复杂度 应用 前言 上一篇文章中(【C算法竞赛 图论】图论基础),介绍了图论相关的概念和一种图的存储的方法,这篇文章将会介绍剩下的两种方法&#xff…

大模型之一:大语言模型预训练的过程

介绍 大语言模型的一般训练过程(3步):1、预训练学知识,2、指令微调学格式,3、强化学习对齐人类偏好 预训练 所以要想大模型有领域知识,得增量预训练(靠指令微调记知识不靠谱,不是…

【大语言模型】应用:10分钟实现搜索引擎

本文利用20Newsgroup这个数据集作为Corpus(语料库),用户可以通过搜索关键字来进行查询关联度最高的News,实现对文本的搜索引擎: 1. 导入数据集 from sklearn.datasets import fetch_20newsgroupsnewsgroups fetch_20newsgroups()print(fNu…

zookeeper和kafka消息队列

zookeeper zookeeper介绍 Zookeeper是一个开源的分布式的,为分布式框架提供协调服务的Apache项目 zookeeper特点 zookeeper是由一个领导者(leader),多个跟随者(follower)组成的集群 Zookeepe集群中只要有半数以上节点存活,Zookeeper集群…

使用Postman发送跨域请求实验

使用Postman发送跨域请求 1 跨域是什么?2 何为同源呢?3 跨域请求是如何被检测到的?4 Postman跨域请求测试4.1 后端准备4.2 测试用例4.2.1 后端未配置跨域请求(1) 前端不跨域(2)前端跨域 4.2.2 后端配置跨域信息(1&…

数据结构-链表刷题集(长期更新)

文章目录 1. leetcode 2 两数之和1.1 解法一 1. leetcode 2 两数之和 1.1 解法一 题目及其相关实例如下 要做这个题,首先我们要学会模拟竖式的加法,我们知道即使是java基本数据中最大的long类型范围也是有限的,那如果超出范围了我们该怎么办呢,我们就需要用字符串来模拟这个…

Mac 下 Python+Selenium 自动上传西瓜视频

背景 研究下 PythonSelenium 自动化测试框架,简单实现 Mac 下自动化批量上传视频西瓜视频并发布,分享给需要的同学(未做过多的异常处理)。 脚本实现 首先通过手工手机号登录,保存西瓜视频网站的 cookie 文件 之后加载…

HTML的文档说明

1.告诉浏览器当前网页的版本 2.写法&#xff1a; &#xff01;以前的写法&#xff1a;要依据网页的HTML的版本去确定&#xff0c;紫萼发油很多很多。 具体的写法可以参考&#xff1a;W3C官网的文档说明 &#xff01;新写法&#xff1a;W3C都推荐用h5的写法 <DOCTYPE ht…

C语言CRC通用模块代码

我这几天看了下CRC具体校验原理&#xff0c;我看网上都没有一个通用的CRC库&#xff0c;都是一个函数写一种校验方式的那种&#xff0c;以下代码是随手写的一个通用的CRC软件模块&#xff0c; 支持最小单位字节的输入&#xff0c;有问题大家一起讨论。移植时需要修改的点可能是…

【蓝桥杯】第十五届蓝桥杯大赛软件赛省赛(Java研究生组)个人解题思路及代码分享

文章目录 试题A&#xff1a;劲舞团试题B&#xff1a;召唤数字精灵试题C&#xff1a;封闭图形的个数试题D&#xff1a;商品库存管理试题E&#xff1a;砍柴试题F&#xff1a;回文字符串试题G&#xff1a;最大异或节点试题H&#xff1a;植物生命力 试题A&#xff1a;劲舞团 【问题…