HuggingFists系统功能介绍(2)--数据源账号

数据源

    再次,我们进入“数据源”管理模块。该模块用于管理我们在进行数据处理或分析时所需要的所有数据源。在定义任何的数据流程读写工作之前,必须先通过数据源管理模块创建出对应的数据源。数据源可以是我们需要进行数据处理时,原始数据所在的存储系统;也可是我们处理完的数据要写出或者进行二次读取的存储系统。HuggingFists支持的存储系统如界面所示,包括:数据库、文件系统、事件流以及应用系统四类。其中,事件流在社区版中没有放开。但可以将其简单理解为提供对类似Kafka这样的消息队列数据源的管理。我们可以在社区版中看到其它三类数据源。

数据库数据源

      

数据库数据源列表      

Milvus数据库浏览

        数据库数据源是最为大家所熟知的,他在同类型的数据科学工具最为常见的。传统面向结构化数据处理的数据科学工具对此类数据源支持的都极为丰富,除了关系型数据库外,也拓展了诸如HBase、ElasticSearch、MongoDB等NOSQL类型的数据库。HuggingFists在这方面也在不断完善,目前也支持了包括云端数据库Snowflake在内的20+种数据库类型,限于安装包的大小,社区版预置了少数几种。如需其它类型的数据库,可通过后面介绍的连接器库管理导入对应的数据库连接器即可。为了更全面的支持AI领域的应用,HuggingFists目前支持了Milvus向量库以及腾讯的云向量库。使用者可以使用向量库搭建RAG或图像检索等不同的应用。HuggingFists为其集成的所有数据库都提供了一致操作及查看界面,可以极大的降低使用者的学习成本,当然也牺牲了部分数据库的特点。使用者不能将HuggingFists的数据库管理模块预期为一个专业的数据库管理工具,其定位更多是为了让用户能够对待处理与分析的数据有一个初步的了解。能够对数据进行简单的浏览及查询。HuggingFists对其支持的所有数据库都有通过SQL语句进行检索的能力,即使数据库本身没有。SQL语法兼容SQL92的语法结构,但由于数据库本身的构造差异,所以其提供的SQL语法带有很大程度的数据库特色。比如:Milvus以及腾讯云向量库的SQL语法。HuggingFists采用的SQL语法集成的是数由科技的开源项目“moql-transx”。可以通过该项目了解各数据库的SQL语法详细介绍。

文件系统数据源

      

文件系统数据源列表

HDFS文件系统浏览

        文件系统数据源是为所有用户更熟知的一类数据源,但该类数据源在传统的数据科学工具中却鲜有支持。因为结构化数据是不需要太关注这类数据源的。但最近几年出现的FiveTran、Matillion等几款新ETL工具以及部分RPA(机器人自动化)工具都有对文件系统数据源有了支持。但这些支持更多是算子级别的,就是可以在流程定义中读写这些数据源,但是无法通过界面对数据源进行浏览及管理。HuggingFists则提供了文件系统的管理功能,支持对云文件系统、分布式文件系统以及远程文件系统等进行目录浏览、文件浏览、文件上传、下载等操作。基本兼容使用者在使用本地文件系统时的操作体验,方便使用者对文件系统型数据源进行直观的了解。通过对文件系统型数据源的支持,HuggingFists建立了对非结构化数据处理与分析的基础。支持通过文件系统读取、写出各种类型的文件,并通过流程管理模块完成数据处理与分析流程的搭建。HuggingFists系统安装后会内置一个缺省的文件系统数据源。社区版系统安装完后,会将本地文件系统的特定目录预置为HuggingFists的内置文件系统,HuggingFists内的读取/写出类算子会缺省以内置文件系统作为读取/写出的目标。而企业版的HuggingFists系统则支持将HDFS设置为内置的文件系统。

应用系统数据源

      

应用系统数据源列表

HuggingFace数据源浏览

        应用系统数据源用于提供对各类应用系统数据源的简单浏览功能。如:GitHub、HuggingFace、Tushare、Shodan等。HuggingFists将这些网站或应用视为一类数据源,并针对它们预置了部分连接器。可通过这些连接器创建数据源完成对网站或应用的数据浏览和检索。对于提供了API接口的应用,HuggingFists将每个API接口视为一个数据对象,通过应用数据源界面可以浏览到数据源内的所有API数据对象。选中某个API数据对象,可填充参数,并发起对API的检索请求,并向使用者展示返回结果。

小结

        通过HuggingFists的数据源管理模块,使用者可以一站式的浏览和管理散布在本地、局域网或者互联网上的各类数据。这将给予使用者极大的帮助,不必切换工具,就可将数据尽收眼底。

账号管理

        创建绝大部份数据源时,我们都需要有一个必须填充的信息,就是“认证信息”。这些认证信息在很多情况下会有复用的情况。比如创建MySQL数据源时,我们为不同的数据库建立一个数据源,但是其认证信息可能是复用的。分别为每个数据源都设置一遍认证信息即增加了认证信息泄漏的风险,又增加了认证信息的维护成本。一但密码或者Access Token变更了,需要将所有相关数据源都调整一遍。数据源少的时候,这个维护成本还好承担,一旦数据源多起来就容易搞乱、搞错了。为此,HuggingFists提供了一个统一的账号管理模块。该模块负责管理系统中的所有认证信息,包括数据源相关的认证信息以及算子访问外部API时所需的认证信息。

                        点击界面右上角的”user_name”->”个人设置”->”资源账号”,进入账号管理模块。

资源账号列表

        在账号管理模块中,可以分组查看使用者创建的所有账号。使用者可通过“新建账号”按钮,选择对应的账号模板添加账号。使用者可以不必关注数据源或API接口的认证方式,不需要关心是用户名/密码认证还是OAuth2认证,只需要按照账号模板给出的信息提示填充即可。

        账号模板是可扩充的,其随着连接器和算子的注册添加而同步扩充。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/701652.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uniapp上传文件到腾讯云

官方API地址 javaScript_SDK 下载cos npm i cos-js-sdk-v5 --save 生成签名 获取secretId和secretKey let cos new COS({SecretId: *******************************,SecretKey: ******************************,}) 参考文章:腾讯云如何获取secretId和secret…

C++中的左值和右值

目录 一. 左值和右值的概念 1. 左值 1.1 可修改的的左值 1.2 不可修改的左值 右值 二. 左值引用和右值引用 1. 左值引用 2. 右值引用 主要用途 1. 移动语义 2. 完美转发 2.1 引用折叠 2.2 std::forward 一. 左值和右值的概念 什么是左值和右值 1. 左值 左值是一个表示…

Linux内核源码安装

文章目录 前言查看内核源码包安装内核源码编译内核源码最后 前言 我是醉墨居士,我们安装一下Linux内核源码,方便我们学习Linux内核 也方便我们进行eBPF开发时查看Linux内核的一些信息 查看内核源码包 apt-cache search linux-source安装内核源码 因为…

【vue3语法】开发使用创建项目等

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、vue3创建vue3v2函数式、v3组合式api响应式方法ref、reactive计算属性conputed监听属性wacthvue3 选项式生命周期父子通信父传子defineProps编译宏 子传父de…

互联网加竞赛 机器视觉opencv答题卡识别系统

0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 答题卡识别系统 - opencv python 图像识别 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分…

并查集例题(食物链)C++(Acwing)

代码&#xff1a; #include <iostream>using namespace std;const int N 50010;int n, m; int p[N], d[N];int find(int x) {if(p[x] ! x){int t find(p[x]);d[x] d[p[x]];p[x] t;}return p[x]; }int main() {scanf("%d%d", &n, &m);for(int i 1…

linux前端部署

安装jdk 配置环境变量 刷新配置文件 source profile source /etc/profile tomcat 解压文件 进去文件启动tomcat 开放tomcat的端口号 访问 curl localhsot:8080 改配置文件 改IP,改数据库名字&#xff0c;密码&#xff0c; 安装数据库 将war包拖进去 访问http:…

【Python笔记-设计模式】代理模式

一、说明 代理模式是一种结构型设计模式&#xff0c;提供对象的替代品或其占位符。代理控制着对于原对象的访问&#xff0c;并允许在将请求提交给对象前后进行一些处理。 (一) 解决问题 控制对对象的访问&#xff0c;或在访问对象前增加额外的功能或控制访问 (二) 使用场景…

apidoc接口文档的自动更新与发布

文章目录 一、概述二、环境准备三、接口文档生成1. 下载源码2. 初始化3.执行 四、文档发布五&#xff0c;配置定时运行六&#xff0c;docker运行七&#xff0c;不足与优化分析 一、概述 最近忙于某开源项目的接口文档整理&#xff0c;采用了apidoc来整理生成接口文档。 apidoc…

深度学习系列59:文字识别

1. 简单文本&#xff1a; 使用google加的tesseract&#xff0c;效果不错。 首先安装tesseract&#xff0c;在mac直接brew install即可。 python调用代码&#xff1a; import pytesseract from PIL import Image img Image.open(1.png) pytesseract.image_to_string(img, lan…

MES管理系统生产过程控制的核心要素

MES&#xff08;制造执行系统&#xff09;是为优化制造业生产过程和管理而设计的软件系统&#xff0c;其核心要素包括&#xff1a; 工单管理&#xff1a;工单管理是MES系统最基本的功能之一&#xff0c;它可以跟踪和管理各种类型的工单&#xff0c;如生产工单、维修工单和质量…

Spring篇----第六篇

系列文章目录 文章目录 系列文章目录前言一、spring 支持集中 bean scope?二、spring bean 容器的生命周期是什么样的?三、什么是 spring 的内部 bean?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男…

Java EE改名Jakarta EE,jakarta对程序开发的影响

一、前言 很多Java程序员在使用新版本的Spring6或者springboot3版本的时候&#xff0c;发现了一些叫jakarta的包。我在阅读开源工作流引擎camunda源代码的时候&#xff0c;也发展了大量jakarta的工程包。 比如&#xff1a;camunda的webapps编译工程就提供了2种方式javax和jaka…

SCI一区 | Matlab实现ST-CNN-MATT基于S变换时频图和卷积网络融合多头自注意力机制的多特征分类预测

SCI一区 | Matlab实现ST-CNN-MATT基于S变换时频图和卷积网络融合多头自注意力机制的故障多特征分类预测 目录 SCI一区 | Matlab实现ST-CNN-MATT基于S变换时频图和卷积网络融合多头自注意力机制的故障多特征分类预测效果一览基本介绍模型描述程序设计参考资料 效果一览 基本介绍…

论文阅读:Ground-Fusion: A Low-cost Ground SLAM System Robust to Corner Cases

前言 最近看到一篇ICRA2024上的新文章&#xff0c;是关于多传感器融合SLAM的&#xff0c;好像使用了最近几年文章中较火的轮式里程计。感觉这篇文章成果不错&#xff0c;代码和数据集都是开源的&#xff0c;今天仔细读并且翻译一下&#xff0c;理解创新点、感悟研究方向、指导…

【杂谈】还能这么骗Github开源者?

起因 StarkNet给Github前5000的账户空投了一波STRK代币,一般有资格获得空投的开发者&#xff0c;大概能获得 110个 STRK 代币&#xff0c;按目前价格计算大概 1500人民币左右。 什么是有资格的开发者呢&#xff1f;按 Starknet要求&#xff0c;如果你给在 GitHub上排名前 5000…

基于SSM的废品买卖回收管理系统(有报告)。Javaee项目。ssm项目。

演示视频&#xff1a; 基于SSM的废品买卖回收管理系统&#xff08;有报告&#xff09;。Javaee项目。ssm项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&#xff0c;通过Spri…

Vue+SpringBoot打造开放实验室管理系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、研究内容2.1 实验室类型模块2.2 实验室模块2.3 实验管理模块2.4 实验设备模块2.5 实验订单模块 三、系统设计3.1 用例设计3.2 数据库设计 四、系统展示五、样例代码5.1 查询实验室设备5.2 实验放号5.3 实验预定 六、免责说明 一、摘…

设计模式-创建型模式-建造者模式

建造者模式&#xff08;Builder Pattern&#xff09;&#xff1a;将一个复杂对象的构建与它的表示分离&#xff0c;使得同样的构建过程可以创建不同的表示。建造者模式是一种对象创建型模式。 建造者模式一步一步地创建一个复杂的对象&#xff0c;它允许用户只通过指定复杂对象…

windows 中, bash: conda: command not found(已解决)

git bash 中运行conda命令&#xff0c;出现这种错误&#xff0c;原因是你没有在git bash中 配置conda&#xff0c;导致git bash无法找到conda 那就配置一下&#xff0c;找到你的conda的安装位置下的bash.sh文件&#xff0c;一般在安装位置&#xff08;我的安装在C盘的自定义路径…