景联文科技:高质量垂直领域数据集助力AI技术突破

随着人工智能技术的飞速发展,垂直领域数据集在提升模型性能、解决领域问题、推动创新应用以及提升竞争力等方面的重要性日益凸显。

提高模型性能:垂直领域数据集专注于特定任务或领域,使用这些数据集进行训练可以让模型更好地理解和解决特定领域的问题。

深入解决领域问题:垂直领域数据集通常包含丰富的专业知识和深度信息,这使得模型能够更深入地了解特定领域的问题。

推动创新应用:通过垂直领域数据集的训练,模型可以更好地适应特定领域的需求和规则,从而推动该领域的创新应用。

提升竞争力:对于企业和研究机构来说,拥有高质量的垂直领域数据集可以提升其在特定领域的竞争力。可以更好地理解市场需求、客户行为以及行业趋势,从而制定出更有效的商业策略。

景联文科技是AI基础数据行业的供应商,拥有丰富的垂直领域成品数据集。

一、自动驾驶领域成品数据集

部分数据样例如下:

1.2000000张DMS驾驶员行为视频训练集

采集设备:可见光和红外双目摄像头

车型要求:大众-桑塔纳、日产-轩逸、起亚-赛拉图、雪铁龙-爱丽舍,车型都是五年内的,每种车型平均

数据规模:2000000张图像,2000000个json文件

采集多样性:多年龄段、多时间段、多种行为(疲劳驾驶、副驾驶及后排座椅、未系安全带、抽烟、吃喝、后挡风玻璃置物台、主驾驶防护栏、中控台 、手持手机打电、中央扶手处、聊微信看视频)

2.5000个id1225900段车内录音采集数据集

采集规模:5000个id1225900段录音

采集设备及要求:专业录音设备进行录制,麦克风间距95mm

采集多样性:在汽车行驶过程中或静止状态时、开窗或关窗时、开空调或不开空调的情况下各录制一遍

录音内容为:口语类、新闻类

男女比例:1:1

年龄分布:年龄在20到50之间,20到30占30%,30到40占50%,40到50占20%。

语言:标准的普通话

二、智能安防领域成品数据集

部分数据样例如下:

1.225570张火焰标注图像训练集

采集设备:手机

数据规模:225570张png图像、22550个xml文件

采集多样性:多种室外场景

标注规则:分“flame、smoke、fire、cloud、leaf、fog、sunset、light 、sunlight”九类火焰做拉框标注,一张图上标注区域不超过三个

采集时间:白天、夜晚

2.1500段烟火视频数据集

采集设备:相机分辨率为1080p(200万),平角监控相机

数据规模:总共7500分钟左右,1500段视频,每段视频5分钟左右

采集内容:在5个工厂场景,5个仓库场景,5个办公楼场景下,分别在灯光、昏暗、正常光三种不同的光下采集大火、中火、小火三种不同的火势大小的视频

采集角度:多角度采集

采集环境:共15个场景,分别为5个工厂场景,5个仓库场景,5个办公楼场景

三、智慧城市垂直领域成品数据集

部分数据样例如下:

1.1200000张城市治理图像数据集

采集内容:采集城市道路上暴露垃圾、打包垃圾、单车违停、电动车违停、店外经营、垃圾桶满溢、乱堆废料、违规撑伞、违规户外广告、沿街晾晒 、游摊小贩、占道经营等12种场景数据  

采集设备:摄像头  

数据规模:1200000张图像,12类场景每类100000张

采集场景:暴露垃圾、打包垃圾、单车违停、电动车违停、店外经营、垃圾桶满溢、乱堆废料、违规撑伞、违规户外广告、沿街晾晒、游摊小贩、占道经营

采集要求:拍摄高度1.8-4.5米,拍摄距离15-20米

采集多样性:多种场景、不同时间段、不同拍摄角度

采集时间:白天、夜晚

2.10000张牵狗绳数据集

数据内容:不同人遛狗牵狗绳图片或视频,要求10个以上不同场景、10种以上不同狗

数据规模:10000张图像

采集犬类多样性:金毛、拉布拉多、哈士奇、柯基犬、萨摩耶犬等10余种

采集场景多样性:小区绿化带、小区道路、马路边等10余种

景联文科技支持定制采集标注服务。拥有来自不同领域的专家,可以对垂直领域的数据信息进行清洗,删除有害或者存在偏见的内容,从而确保训练数据的正确性,避免生成式AI模型产生偏见、错误信息或其他问题行为。

数据安全合规方面,景联文科技已通过ISO9001质量、ISO27001信息安全、ISO27701国际隐私安全管理认证,参与8项国家数据交换格式和数据安全标准制定。

为自动驾驶、智能安防、智慧城市等领域的全球数千家人工智能从业公司和高校科研机构交付海量、高质量的AI算法训练数据。

景联文科技|数据采集|数据标注

助力人工智能技术,赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/203829.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

redis应用-分布式锁

目录 什么是分布式锁 分布式锁的基本实现 引入过期时间 引入校验id 引入lua 引入看门狗 引入redlock算法 什么是分布式锁 在一个分布式系统中,也会涉及到多个节点访问同一个公共资源的情况,此时就需要通过锁来做互斥控制,避免出现类似于"线程安全"的问题. 而…

@Autowired注入多态

如IBizStudyService接口有多个实现类BizStudyServiceImpl和BizStudyServiceExImpl,在Autowired注入时要用Qualifier指定实现类名称。 Autowired Qualifier("BizStudyServiceImpl") private IBizStudyService bizStudyService; 在实现类定义时要加上名称…

【开源】基于Vue和SpringBoot的计算机机房作业管理系统

项目编号: S 017 ,文末获取源码。 \color{red}{项目编号:S017,文末获取源码。} 项目编号:S017,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 登录注册模块2.2 课程管理模块2.3 课…

【QT】Qt类库的模块

目录 1.Qt基本模块 2.Qt附加模块 3.增值模块 4.技术预览模块 5.Qt工具 1.Qt基本模块 Qt基本模块是Qt在所有平台上的基本功能,它们在所有的开发平台和目标平台上都可用,在Qt5所有版本上是源代码和二进制兼容的。 Qtcore模块是Qt类库的核心,所有…

【2021研电赛】基于EAIDK-310的云端互联无人驾驶系统

本作品介绍参与极术社区的有奖征集|分享研电赛作品扩大影响力,更有重磅电子产品免费领取! 参赛单位:上海理工大学 参赛队伍:你说的都是对的 指导老师:蒋全 参赛队员:童锐,邹祖奇,胡涛 获奖情况&…

分享一个Python网络爬虫数据采集利器

前言 你是否曾为获取重要数据而感到困扰?是否因为数据封锁而无法获取所需信息?是否因为数据格式混乱而头疼?现在,所有这些问题都可以迎刃而解。让我为大家介绍一款强大的数据收集平台——亮数据Bright Data。 作为世界领先的数据…

聚观早报 |JFrog发布新功能;中科百孚减持龙芯中科股票

【聚观365】12月7日消息 JFrog发布新功能 中科百孚减持龙芯中科股票 商汤集团再回应做空报告 xAI融资新进展 苹果市值再次突破 JFrog发布新功能 流式软件公司、企业软件供应链平台提供商JFrog发布新功能,推出业界首款致力于加速安全软件建构与发布的端到端平台…

跟着GPT学习shell脚本,学习脚本中的各种符号(一)。

Shell脚本符号深入学习计划 第1周:基本符号和它们的用法 学习目标:掌握基本的Shell符号,如#, ;, &&, ||。内容: #用于注释。;用于在一行中分隔多个命令。&&和||用于连接命令,实现逻辑控制。 第2周&…

VectorDB的使用方法

🔗链接: https://github.com/jina-ai/vectordb 安装: 以下3个都要安装才可以使用VectorDB 1. Microsoft Visual C 14.00 Microsoft Visual C 14.0: https://blog.csdn.net/ViatorSun/article/details/118699938 2. DocArray pip install docarray 3. VectorDB …

springboot整合webservice修改cxf自动生成wsdl的soap:address location

近期系统中的webservice接口要上线 通过http://localhost:8080/webServices/testService?wsdl走网关访问时&#xff0c;返回的<soap:address location>是真实业务服务的ip:port。因为我们只能暴露网关的ip和端口&#xff0c;需要将真实服务的ip和端口隐藏起来。 Beanpu…

什么是神经网络的超参数

1 引言 超参数在神经网络的设计和训练中起着至关重要的作用。它们是在开始训练之前设置的参数&#xff0c;与网络的结构、训练过程和优化算法有关。正确的超参数选择对于达到最优模型性能至关重要。 2 神经网络结构的超参数 层数&#xff08;Layers&#xff09;&#xff1a; 决…

Elastcsearch:通过 Serverless 提供更多服务

作者&#xff1a;Ken Exner 人们使用 Elasticsearch 解决最大数据挑战的方式一直令我们感到惊讶。 从超过 40 亿次下载、70,000 次提交、1,800 名贡献者以及我们全球社区的反馈中可以清楚地看出这一点。 Elastic 在广泛的用例中发挥的作用促使我们简化复杂性&#xff0c;让搜索…

支付通道是什么?支付通道的价值体现在哪里?

支付通道是什么&#xff1f;什么是通道&#xff1f; “道”&#xff0c;人走路用的&#xff0c;从一个地点通向另一个地点。而支付通道也是这样&#xff0c;只不过道路上的不是人&#xff0c;是资金流&#xff1b;也就是一个能把金钱从一个地方转移到另一个地方的方式。 支付…

不敢想象,会用大数据分析工具有多爽!

当业务人、小白会用大数据分析工具会有多爽&#xff1f;1、再不用去跟IT沟通需求&#xff0c;等IT取数开发报表&#xff1b;2、有新的分析需求&#xff0c;我当场就能分析数据&#xff0c;获取信息&#xff1b;3、有足够多的数据信息支撑业务分析决策&#xff0c;实现从经验决策…

Spring中@Contorller和@ResController的区别

Controller 和 RestController 是在 Spring 框架中用于定义控制器的注解&#xff0c;它们之间有一些区别。 一、Contorller Controller 注解用于标识一个类为控制器&#xff08;Controller&#xff09;。控制器负责处理客户端请求并返回相应的响应。在使用 Controller 注解时&…

【富文本编辑器】原生JS使用WangEditor和vue上传图片前后端demo

【富文本编辑器】原生JS使用WangEditor上传图片前后端demo 第一步 HTML 第二步 初始化WangEditor与图片上传回调函数 第三步 后端返回数据体封装 第四步 后端接口上传图片&#xff0c;并返回图片地址 最近&#xff0c;我遇到了这样一个问题&#xff1a;因为我们的项目是基于…

MySQL和MongoDB简介以及它们之间的区别

本文主要介绍MySQL和MongoDB的简介以及它们之间的区别。 目录 MySQL简介MySQL的优缺点MySQL的应用场景MongoDB简介MongoDB的优缺点MongoDB的应用场景MySQL和MongoDB的区别 MySQL简介 MySQL是一种开源的关系型数据库管理系统&#xff0c;是世界上最流行的数据库之一。它支持多用…

DAPP开发【10】express.js的使用

Express.js 是一种流行、轻量级的开源 Web 应用程序框架&#xff0c;用于开发基于 Node.js 的服务器端 Web 应用程序。它提供了强大的功能集&#xff0c;适用于 Web 和移动应用程序。Express.js 旨在支持单页、多页和混合式 Web 应用程序的开发。Express.js 提供了广泛的功能&a…

Linux软件包管理器yum

yum—Linux应用商店 前言Linux的软件安装1. 源代码安装2. rpm安装使用rpm安装升级或者更新.rpm软件包卸载指定的.rpm软件包查询已安装的.rpm软件包优缺点 3. yum安装&#xff08;推荐&#xff09;yum源使用yum命令&#xff08;检测是否有网&#xff1a;ping指令&#xff09;优缺…

Nginx的反向代理与负载均衡

概念介绍 1). 正向代理 正向代理服务器是一个位于客户端和原始服务器(origin server)之间的服务器&#xff0c;为了从原始服务器取得内容&#xff0c;客户端向代理发送一个请求并指定目标(原始服务器)&#xff0c;然后代理向原始服务器转交请求并将获得的内容返回给客户端。 …