基于大模型的智慧零售教育科研平台——技术方案

一、概述

1.1背景

        随着数字经济的快速发展和全社会数字化水平的升级,人工智能的积极作用越来越凸显,人工智能与各个行业的深度融合已成为促进传统产业转型升级的重要方式之一。ChatGPT的出现掀起了又一波人工智能发展热潮,人工智能行业发展势头强劲,市场规模持续上升,正逐步进入效率化生产阶段,为用户带来了更加个性化的服务和产品

        近年来,中国人工智能行业受到各级政府的高度重视和国家产业政策的重点支持,国家陆续出台了多项政策,鼓励人工智能行业发展与创新,《关于支持建设新一代人工智能示范应用场景的通知》《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》《新型数据中心发展三年行动计划(2021-2023年)》等产业政策为我国人工智能产业发展提供了长期保障。而人工智能结合机器人,成为产业发展风向标,使机器人具有“智慧”,服务日常生活,成为机器人产业发展的流行趋势。

        2023年1月《“机器人+”应用行动实施方案》指出,当前,机器人产业蓬勃发展,正极大改变着人类生产和生活方式,为经济社会发展注入强劲动能。预计到2025年,制造业机器人密度较2020年实现翻番,服务机器人、特种机器人行业应用深度和广度显著提升,机器人促进经济社会高质量发展的能力明显增强。

        在智慧零售领域,大模型技术具有数据处理能力强、预测准确度高、智能化水平高等显著优势。通过构建庞大的数据集和复杂的算法模型,大模型能够实现对市场趋势的准确预测以及商品库存的智能管理,同时能够根据消费者的购物历史和偏好,提供定制化的购物体验,从而提高销售额和顾客满意度。

1.2简介

        以大模型技术与机器人技术在“智慧零售”这一垂直领域应用的实际需求为应用背景,模拟在无人零售店等新型零售模式场景中,大模型通过分析消费者行为数据,提供个性化的商品推荐;通过图生文技术和自然语言处理技术,提高交互效率和便捷性;通过智能机械臂完成对商品的识别、定位与抓取,通过图像识别技术实现商品识别和结算,提高购物体验,最终实现协助零售商户智能识别客户需求。功能如下:

  1. 智慧视觉辨识:利用大模型的强大计算能力和视觉识别技术,系统能够实现对货架上商品的高精度识别,确保每一个商品都能被精确地辨识和分类。
  2. 环境感知物体跟踪:结合大模型与深度学习算法,本功能可实时检测并追踪货架上商品的位置和状态,为智能物流和库存管理提供实时数据。
  3. 互动式语音交互:通过大模型集成的自然语言处理能力,平台可通过自然且友好的语音交互与用户沟通,提供即时信息反馈和导购服务。
  4. 洞察消费者辅助决策:利用大模型根据顾客行为、面部表情分析,生成消费者洞察报告,帮助零售商理解顾客需求,优化商品组合。
  5. 智能精准操控:以大模型技术为支撑,智能机械臂能够自动精准地识别目标商品,并完成复杂的抓取与搬运任务,展现了先进的自动化操作能力。
  6. 智能化结算分析:此功能集结大模型的数据分析和图像识别技术,能够在短时间内完成对结算区商品的自动识别和计价,提供一站式智能结算解决方案。​​​​​​​

 图1 .基于大模型的智慧零售教育科研平台

1.3特点

1.3.1

        基于大模型的智慧零售教育科研平台集主控与执行机构与一体,主控中采用目前主流的大模型与图文生成技术,通过自然语言处理,实现对外部环境的感知与分析;执行机构使用超轻量仿人机械臂,基于目标检测技术,通过机械臂运动规划等功能,完成任务执行与环境交互功能。基于大模型的智慧零售教育科研平台同时具备商业应用、教学实训及科研实验的特性,是融合应用与科教一体的平台,因此其支持各类型高校专业实训、课程设计、毕业设计等实训环节的教学,也满足各科研院所基础实验测试及二次开发需求,实训平台主要有以下优势:

  • 多功能性:基于大模型的智慧零售教育科研平台可以执行多种任务,包括语音交互、视觉抓取等。
  • 智能化技术支持:基于大模型的智慧零售教育科研平台集成了人工智能技术,例如机器视觉、深度学习及大模型等前沿技术,能够实现环境感知和自主决策,提升实验的智能化水平,并且对于前沿的人工智能技术具备良好的适配性,各类最新智能算法及AI解决方案能够轻松在平台上验证,对于高层次人才培养和深度科研探索有坚实的基础支撑。
  • 灵活性:平台结构设计灵活,可以在不同工作场景下自由移动和操作,适用于多种实验和项目需求。
  • 自动化程度高:基于大模型的智慧零售教育科研平台具备自动化控制功能,能够通过编程实现自动化操作和任务执行,提高实验效率和精度。
  • 跨学科应用:基于大模型的智慧零售教育科研平台涵盖了人工智能、控制工程、计算机等多个学科领域的知识和技术,可以为跨学科的实验和项目提供支持。
  • 实践创新教学:基于大模型的智慧零售教育科研平台为学生提供了实践创新的平台,可以进行项目设计、编程控制、系统集成等实践操作,培养学生的创新能力和实践技能。
  • 设备迭代更新:基于大模型的智慧零售教育科研平台采用模块化组成思想,每个组成部分都能够单独运行使用,因此后续升级与适配十分方便,用户无需整套返厂更新,使用配套器件即可更新硬件与软件。
  • 教学资料配套:基于大模型的智慧零售教育科研平台教学科研平台配套各类型教学资料,包括实训文档、开发文档、实训讲解视频、二次开发实践视频以及实践讲师现场教学等全面的教学支撑,为客户群体提供人性化与定制化的使用与开发服务。
  • 实训平台生态圈:基于大模型的智慧零售教育科研平台教学科研平台提供全方位的生态圈,用户可自行定制与替换各部件,以便完成特定的场景需求,并且基于大模型的智慧零售教育科研平台教学科研平台拥有独立的产品生态论坛,用户可以随时在论坛查找相关生态产品资料以及开发资料,极大地减少客户二次开发应用难度及周期。

1.3.2竞赛支持

        “中国机器人及人工智能大赛(CAAI)”是国内首个提出在机器人及人工智能领域,将关键技术的研发与应用有机结合的比赛。自1999年至2023年,中国机器人及人工智能大赛已成功举办了25届,已有600多所高校参与,累计超27万高校学生参赛是目前国内规模最大,影响力最强,专业水平最高的机器人竞赛。参赛院校及师生均可享受A类赛事奖励政策,其涉及计算机、电子、机械、信息、无人机、人工智能等方面,是多学科知识的本融合型大赛。产品能全面支撑师生参与CAAI的基于大模型的智慧零售赛项。

        智慧零售竞赛场景设置如下图所示,货架上摆放有矿泉水、可乐、薯片、牛奶等日常零售柜商品,直线导轨台放置在货架前方,机械臂固定在直线导轨台上,可水平移动。具体尺寸、商品类型、商品价格以后续赛事群公布为准。

1.4资源

        基于大模型的智慧零售教育科研平台配套全面的实训内容与资料,为教育客户群体提供涵盖机器人工程、人工智能、自动化、计算机、通信工程、电子信息等专业的课程教学与实训实验资源,并且提供产品论坛,用户可在论坛中交流与查找相关资料,产品的更新资料也会同步至论坛中,方便用户查收。

1.4.1课程

        基于大模型的智慧零售教育科研平台提供系统性的教学实验实训内容,包括实训文档及实训视频,深入浅出的讲解基于大模型的智慧零售教育科研平台相关原理与开发流程,以下是部分课程资源概览:

主题

课程

内容(简述)

课时

中控系统教学实训

Linux系统基础

  1. Linux系统说明;
  2. Linux系统安装;
  3. 常用Linux命令说明;

4

Python基础

  1. Python语言说明;
  2. Python环境搭建;
  3. Python基础语法;
  4. Python数据类型;
  5. Python函数说明;
  6. Python中Socket网络编程;

4

ROS操作系统

  1. ROS简介及ROS总体框架;
  2. ROS安装及测试;
  3. ROS中话题topic、服务Service、消息等介绍;
  4. 基于C++编写各节点;
  5. Launch文件说明及使用;
  6. TF变换说明;
  7. Rqt、RVIZ、Gazebo、Cvbridge工具介绍;

16

物联网平台

  1. 物联网简介及设备说明;
  2. 物联网通讯协议说明;
  3. 物联网传感器数据包获取及解读;

8

主题

课程

内容(简述)

课时

视觉系统教学实训

视觉传感器认知

  1. 视觉传感器简介及分类;
  2. 视觉传感器优缺点分析;
  3. 视觉传感器应用场景分析;

4

深度相机技术应用

  1. 深度相机简介及基础使用;
  2. 深度相机获取三维坐标;

4

深度学习及视觉识别技术

  1. 深度学习简介;
  2. YOLO5框架介绍及使用;
  3. 物体识别应用;
  4. 输出识别物体的坐标信息;

8

视觉识别二维码及颜色

  1. Opencv简介及环境安装;
  2. 基于Opencv的颜色识别实践;
  3. 基于Opencv的二维码识别实践;

6

手眼标定

  1. 手眼标定的意义;
  2. 使用Python实现基于六轴机械臂的手眼标定;

2

主题

课程

内容(简述)

课时

操作机构系统教学实训

执行机构本体

1.六轴机械臂简介及本体认知;

2.六轴机械臂通讯方法;

3.六轴机械臂示教器使用基础;

4.六轴机械臂示教器编程;

8

机械臂仿真系统

1.ROS机器人操作系统简介及认知;

2.RVIZ中显示机械臂模型;

3.使用Moveit工具编程;

4.Moveit控制Gazebo中的仿真机械臂;

5.Moveit仿真避障规划;

16

执行机构二次开发

1.JSON协议应用;

2.机械臂API应用;

3.机械臂透传移动控制;

4.在线编程及拖动轨迹文件编程;

16

执行机构集成技术

1.机械臂控制器对外接口应用;

2.机械臂末端对外接口应用;

3.机械臂集成2指夹爪及五指灵巧手应用;

4.机械臂集成真空吸盘应用;

8

主题

课程

内容(简述)

课时

智慧零售竞赛套件应用实训内容

机器人组成原理

1.机器人系统理论介绍;

2.机械臂运动规划详解及应用;

4

ROS机器人

操作系统

1.ROS通信原理;

2.moveit轨迹规划实践应用;

3.Gazebo仿真实践;

4

视觉抓取

  1. 3D视觉识别定位原理;
  2. 深度学习物体识别原理;
  3. 视觉抓取;

8

二次开发实训

  1. 语音语义识别实践;
  2. 人机交互实践;
  3. 具身智能应用实践;
  4. 大模型应用实践

8

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/20045.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux sudo用户权限管理小实验001

Linux sudo用户权限管理和审计-初步 1、设置历史指令的保存数量 默认history指令可以查看当前用户执行的1000条历史命令的条目 2、使用export指令设置HISTSIZE环境变量的数量为999999条。 3、基于date指令,输出日期和时间 4、设置linux系统history相关变量&…

预编码算法(个人总结)

引言 预编码算法是现代无线通信系统中的关键技术,特别是在多输入多输出(MIMO)系统中。它们通过在发送端对信号进行处理,减少干扰并提高信道容量。这种技术广泛应用于5G、Wi-Fi和卫星通信系统中。本教程将详细介绍预编码算法的背景…

FV悬浮球,安卓真正小而美的神器,满足你的一切需求。

如果你问安卓最强软件有哪些,不同的人可能会有不同的答案,但如果是问我,那我的答案中一定会有他。 FV悬浮球 他是ES文件浏览器,原作者的新作品,经过几年的开发,拥有了超过400项功能,但大小只有…

如何在 llama.cpp 服务器中实现用户登录功能的优化方案?(语言-c++)

🏆本文收录于「Bug调优」专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&…

HCIP-Datacom-ARST自选题库__BGP/MPLS IP VPN判断【10道题】

1.部署BGP/MPLSIP VPN时,当两个VPN有共同的站点,则该共同站点一定不能与两个VPN其他站点使用重叠的地址空间。 2.如图所示,运营商BGP/MPLSIP VPN骨干网通过LDP构建LSP,若想实现用户X两个站点之间通过BGP/MPLSIP VPN网络互通,则PE1和PE2之间必…

ZL-LGF-2离体心脏灌流系统适用于离体哺乳动物心脏灌流和离体心脏冠脉流量的测定

单介绍: 离体心脏灌流系统适用于离体哺乳动物心脏灌流(langendorff氏法)和离体心脏冠脉流量的测定.可直接进行恒压灌流,加上蠕动泵可进行恒流灌流. 详情介绍: 1、灌流数量:2个心脏…

10款实用软件工具推荐,从绘图到系统优化一应俱全!

AI视频生成:小说文案智能分镜智能识别角色和场景批量Ai绘图自动配音添加音乐一键合成视频https://aitools.jurilu.com/ 1.绘图软件——Adobe Fresco Adobe Fresco是由Adobe公司推出的一款绘图软件,适用于Windows平台。Adobe Fresco是一款功能强大的绘…

tinyrenderer-切线空间法线贴图

法线贴图 法线贴图分两种,一种是模型空间中的,一种是切线空间中的 模型空间中的法线贴图的rgb代表着每个渲染像素法线的xyz,与顶点坐标处于一个空间,图片是五颜六色的。 切线空间中的法线贴图的rgb同样对应xyz,是切线…

微信公众号开发(三):自动回复“你好”

上一篇做了服务器校验,但没有处理用户发来的消息,为了完成自动回复的功能,需要增加一些功能: 1、调整服务器校验函数: def verify_wechat(request):tokentokendatarequest.argssignaturedata.get(signature)timestamp…

如何让数据标注

1.用Anacoda创建一个新的虚拟环境 2.进入虚拟环境 conda activate stu_data(就是刚才创建的虚拟变量的名称) 3.在此环境中安装labelimg pip install labelimg 4.进入labelimg 直接输入 labelimg 快捷键:D:下一个图片 A&#xff1a…

apexcharts数据可视化之圆环柱状图

apexcharts数据可视化之圆环柱状图 有完整配套的Python后端代码。 本教程主要会介绍如下图形绘制方式: 基础圆环柱状图多组数据圆环柱状图图片背景自定义角度渐变半个圆环图虚线圆环图 基础圆环图 import ApexChart from react-apexcharts;export function Cir…

【工具免费】喜马拉雅 x2m转m4a,xm转mp3的简单方法!

喜马拉雅.xm文件转MP3,阿星来帮忙了! 大家好,今天咱们来聊聊一个超级实用的小技巧,特别是对于那些喜马拉雅的忠实听众来说,这绝对是个福音! 阿星发现,很多小伙伴们下载的喜马拉雅文件都是.xm格…

[深度学习]yolov10+bytetrack+pyqt5实现目标追踪

【简介】 利用YOLOv10、ByteTrack和PyQt5实现目标追踪是一个强大的组合,可以为用户提供一个交互式的实时目标追踪界面。以下是一个简化版的实现思路描述: 首先,YOLOv10是一个先进的目标检测算法,能够准确识别视频或图像中的目标…

CS61C | lecture2

# CS61C | lecture2 C 语言是一种编译语言。C 编译器将 C 程序映射到特定与体系结构的机器代码(实际上是一串 0 和 1)。 而 Java 会通过 JVM(Java 虚拟机) 将代码转换为独立于架构的字节码。 Python 则会直接解释代码。C 不会直接解释代码,而是将其编译成机器代码之…

ollama入门系列教程简介与目录

教程简介 Ollama教程系列是为那些希望深入了解并掌握Ollama框架的开发者设计的。通过这一系列的教程,用户将学习如何从基础设置到高级功能的各个方面,有效地在Ollama平台上开发和部署大型语言模型。本系列包括如何将模型导入Ollama框架、利用与OpenAI兼容的API、以及如何使用…

OceanBase开发者大会实录-李楠:4条路径+6大方案,关键业务系统数据库的升级之路

本文来自2024 OceanBase开发者大会,OceanBase 金融与政企事业部解决方案总监李楠的演讲实录 ——《关键业务系统分布式数据库升级路线选择和技术演进之路》。完整视频回看,请点击这里>> 大家好,我是 OceanBase 金融与政企事业部…

知网AI查重:AI工具如何助力通过检测?

论文降重一直是困扰各界毕业生的“拦路虎”,还不容易熬过修改的苦,又要迎来降重的痛。 其实想要给论文降重达标,我有一些独家秘诀。话不多说直接上干货! 1、同义词改写(针对整段整句重复) 这是最靠谱也是…

Zigbee +PC上位机 无线控制二维云台开发笔记

今日尝试开发一款简单好学的PC上位机无线控制二维云台的小试验品: 主要开发环境与工具介绍: 单片机 STM32F103C8T6 使用标准库函数编程 Visual Studio 2022软件C# Winform 开发 上位机控制软件 DL_20 无线串口模块 + USB-TTL 模块 实现无线通…

留给“端侧大模型”的时间不多了

端侧大模型(Edge AI models),也就是只在设备本地(如智能手机、IoT设备、嵌入式系统等)运行的大模型,过去一两年来非常流行。 具体表现在,终端设备厂商,如苹果、荣耀、小米、OV等&…