利用基于CNN的人员检测与关键词识别的TinyML实现无接触电梯

目录

说明

论文概述

摘要

引言

现有非接触式电梯解决方案

新解决方案的需求

tinyML实施

系统构建和算法管道

CNN和TinyML实现

结果与讨论

结论

视频演示和代码可用性

一点感想


说明

我一直使用Google Schloar订阅最新的论文消息,今天看到一篇论文的标题是《Towards Contactless Elevators with TinyML using CNN-based Person Detection and Keyword Spotting》,由Anway S. Pimpalkar和Deeplaxmi V. Niture撰写,来自印度浦那的COEP科技大学电子与通信系。论文提出了一种概念验证,旨在通过使用tinyML(微型机器学习)技术,实现一种无需接触即可操作的电梯系统,以减少人际交互,同时提高电梯系统的安全性、智能化和用户体验效率。由于我前面在测试聆思产品时做过一个语音控制电梯的演示,在测试K510时做过一个手势控制电梯的演示,所以对这篇论文非常感兴趣,就用Kimi生成了论文的摘要信息。

论文概述

以下是论文的主要内容概述,由Kimi自动生成:

摘要


- 目的:介绍一种无需接触即可操作的电梯系统概念验证,以最小化人际交互,增强安全性、智能化和用户体验。
- 设计/方法/途径:开发了一种基于微控制器的边缘设备,能够执行tinyML推理,用于电梯操作。
- 发现:实证结果显示,系统实现了83.34%的人员检测准确率和80.5%的关键词识别效率,整体延迟在5秒以下。
- 创新性:与现有高部署成本、有限可行性和不一致性能的非接触式电梯技术相比,提出的系统利用tinyML技术,为电梯行业带来了重大的范式转变。
- 研究限制/影响:尽管研究显示出有希望的结果,但可扩展性和与现有电梯系统的集成需要进一步探索。
- 实际应用:展示的能效、操作简便性和增强的安全性表明,tinyML在电梯系统中的应用可能会彻底改变该行业。

引言


- 电梯的发展对全球城市景观的形成起到了关键作用,电梯行业的研究和开发集中在提高速度、改进操作算法和加强安全协议上。
- 非接触式使用场景的出现提供了与用户交互的快速方式,减少了公共空间中设备的物理接触,具有卫生优势。

现有非接触式电梯解决方案


- 探索了多种创新技术,如红外传感器、被动RFID标签、手势控制、二维码、蓝牙连接和智能手机应用程序,以实现电梯的非接触式操作。

新解决方案的需求


- 现有的电梯系统通常配备有专用计算资源,将这些资源改造以适应新的非接触式技术可能对标准住宅和办公空间来说成本过高。
- 需要成本低廉的解决方案,这些解决方案需要对现有基础设施进行最小的改动。

tinyML实施


- tinyML提供了一种在低功耗、资源受限设备上有效运行机器学习模型的可行解决方案。
- 该研究介绍了一种新颖的非接触式电梯系统,利用tinyML技术,通过边缘微控制器创建与传统系统相比经济的解决方案。

系统构建和算法管道


- 描述了系统的硬件组件和接口,包括微控制器、摄像头和麦克风。
- 详细介绍了人员检测和关键词检测管道的步骤。

CNN和TinyML实现


- 讨论了如何在微控制器上使用卷积神经网络(CNN)进行系统两个管道的推理。
- 人员检测模型使用MobileNetV1架构,并在训练后进行量化,以优化有限资源。
- 关键词检测模型使用tiny_conv架构,针对嵌入式微控制器进行了预优化设计。

结果与讨论


- 测试了Arduino Nano 33 BLE Sense和OV7675模块的系统有效性,展示了在相机帧内外站立的主体的推理过程。
- 讨论了模型的准确性和延迟,并提供了一些实验数据。

结论


- 概念验证展示了可接受的准确性和延迟水平,但这些方面可能需要进一步改进才能在工业环境中部署。
- 未来的工作可能涉及将系统与现有电梯系统的CAN总线集成,以及探索与不同电梯型号和品牌的兼容性。

视频演示和代码可用性


- 提供了演示系统使用的视频,并在GitHub上提供了项目的源代码。

论文还包括了参考文献列表,提供了相关研究和技术的来源。

一点感想

这篇论文的思想并不是很高大上,做的内容还是比较细致扎实的,比我的简单测试肯定强不少。它的内容实际上是我非常感兴趣的,就是通过人工智能技术来感知用户的意图,从而改进人机交互的方式。这肯定是未来的一个重要的应用方向。

论文中提到的GitHub链接是:https://github.com/anwaypimpalkar/smartElevatorSystem。从这个链接可以看到作者这个作品经过多年的打磨,2021获得5th IEEE National Level Project Competition的最佳项目奖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/18207.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

H6246 60V降压3.3V稳压芯片 60V降压5V稳压芯片IC 60V降压12V稳压芯片

H6246降压稳压芯片是一款电源管理芯片,为高压输入、低压输出的应用设计。以下是对该产品的详细分析: 一、产品优势 宽电压输入范围:H6246支持8V至48V的宽电压输入范围,使其能够适应多种不同的电源环境,增强了产品的通用…

网络安全技术心得体会

网络与信息安全技术心得体会 通过对网络安全这门课程的学习,我进一步了解了网络安全技术的相关知识。大致来说,所谓网络安全指的是对网络系统中各类软硬件和数据信息等提供保护屏障,确保数据信息不受到恶意侵入、窃取等破坏,保证…

记一次重定向问题(浏览器安全)解决

近期做单点登陆功能,本身应该是一个很简单的功能,却发生了意向不到的问题…让我们看下: 首先第三方给出的地址需要通过JWT框架获取token拼接后跳转,我这边为了方便首选肯定是考虑用response.sendRedirect(url),但是做好…

基于朴素贝叶斯算法的微博舆情监控系统,flask后端,可视化丰富

背景: 微博作为中国最大的社交媒体平台之一,汇聚了海量用户生成的文本数据,承载着丰富的社会信息和舆论动向。随着互联网的快速发展,人们对于利用这些数据进行舆情分析和预测的需求日益增加。在这种情况下,以Python为…

Sui新共识协议刷新了区块链交易速度的标准

Sui是提供业界领先性能和无限水平扩展的创新Layer 1区块链,今日在官推上宣布其最新共识协议Mysticeti已成功部署到测试网。这一重大突破将Sui测试网的共识时间减少了80%,至390毫秒,同时保持协议的行业领先吞吐量。这一令人印象深刻的演示证明…

2024「618年中盛典」媒体邀约有哪些优惠活动?

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 51媒体网2024年618 活动正式开启,也预示着2024传播季—年中盛典的到来,从即日起下单的客户,即可享受满减增等优惠政策,新客更享受折上折的…

Clickhouse Bitmap 类型操作总结—— Clickhouse 基础篇(四)

文章目录 创建 Bitmap 对象Bitmap 转换为整数数组计算总数(去重)值指定start, end 索引生成子 Bitmap指定 start 索引和数量限制生成子 Bitmap指定偏移量生成子 Bitmap是否包含指定元素两个 Bitmap 是否存在相同元素一个是否为另一个 Bitmap 的子集求最小…

P7-P9【分配器】【源文件】【OOPvs.GP】

分配器 如何分配,如何释放 源文件 标准库源代码文件VC布局 标准库源代码文件GCC布局 OOP(面向对象编程) VS GP(泛型编程) 这两种编程的区别: 面向对象编程是将数据和方法联系在一起,更注重对不同的对象做出不同的响应,更适合…

狂暴少帅短视频:成都科成博通文化传媒公司

狂暴少帅短视频:热血与激情的碰撞 在当下这个信息爆炸的时代,短视频以其独特的魅力迅速占领了人们的视线。而在众多短视频创作者中,一位名为“狂暴少帅”的创作者以其独特的风格和引人入胜的内容,赢得了广大网友的喜爱和追捧。今…

OpenHarmony应用开启Service以及完成自启动和常驻

一.背景 由于有需求实现一个后台常驻服务,这里就是来实现在鸿蒙里面如何实现后台服务并且实现自启动和常驻 二.添加服务 如下来添加服务 然后此时直接运行这个hap是报错的,如下: 此处参考: 应用中添加ServiceExtensionAbility然后安装HAP时提示“code:9568344 error: inst…

SSH秘钥对简化github项目管理(外加Tortoise配置)

文章目录 使用SSH秘钥对简化github项目管理为什么要用密钥对?如何使用SSH方式克隆版本库呢?补充:使用TortoiseGit(小乌龟)快速访问github远程仓库!结尾:喜欢的小伙伴可以点点关注赞哦 使用SSH秘…

人才测评的应用:人才选拔,岗位晋升,面试招聘测评

人才测评自诞生以来,就被广泛应用在各大方面,不仅是我们熟悉的招聘上,还有其他考核和晋升,都会需要用到人才测评。不知道怎么招聘?或者不懂得如何实现人才晋升?都可以参考人才测评,利用它帮我们…

AI视频教程下载:零基础学会DALL-E 、Midjourney、Microsoft Designer、Adobe Firefly

学完本课程会得到什么: 掌握ChatGPT、DALL-E 2、Midjourney、Microsoft Bing Chat、Microsoft Designer和Adobe Firefly,全面理解生成性AI及其应用 了解OpenAI及其在生成性AI领域的尖端研究 理解提示工程的重要性以及它如何帮助产生更好的输出和数据 …

Llama模型家族训练奖励模型Reward Model技术及代码实战(一)

LlaMA 3 系列博客 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (三) 基于 LlaMA…

2024最新升级Stable Diffusion整合包v4.6版来了,附赠SD电商实战教程

Stable Diffusion无疑是最近最火的AI绘画工具之一,本期设计软件库给大家带来了2024最新升级的v4.6版!比之前推送的更加智能、快速和简单 2024全新Stable Diffusion 资料包 新版本使用更方便 独家附赠SD电商实战教程 让你快速上手 资源目录一览 01 新…

Git——pull request详细教程

当我们需要协助其他仓库完成更改时,往往会用到git中的Pull Request操作,从而方便团队的协作管理和代码持续集成。 下面是详细的教程步骤。 一. Fork目标项目 比如说我现在要fork以下Qwen-VL的项目,如图所示: 随后点击Create即可…

PENDLE会是打响LSDFI赛道的第一枪吗?以bitget钱包为例

Pendle Finance是什么? PENDLE是Pendle Finance的原生通证,因此,在介绍Pendle币之前,我们需要对Pendle Finance有一个简单的了解。、 Pendle是一个建立在以太坊区块链上的无需许可的去中心化金融(DeFi)协议&#xff…

【东山派Vision K510开发板试用笔记】WiFi配网问题

目录 概述 WiFi配网的修改 悬而未决的问题 概述 最近试用了百问网提供的东山派Vision开发板,DongshanPI-Vision开发板是百问网针对AI应用开发设计出来的一个RSIC-V架构的AI开发板,主要用于学习使用嘉楠的K510芯片进行Linux项目开发和嵌入式AI应用开发…

来自工业界的知识库 RAG 服务(二),RagFlow 源码全流程深度解析

背景介绍 前面介绍过 有道 QAnything 源码解析,通过深入了解工业界的知识库 RAG 服务,得到了不少调优 RAG 服务的新想法。 因此本次趁热打铁,额外花费一点时间,深入研究了另一个火热的开源 RAG 服务 RagFlow 的完整实现流程&…

1688 API接口介绍:开启您的电商新篇章

什么是1688 API接口? API(Application Programming Interface,应用程序编程接口)是一组协议和工具,用于定义不同的软件应用程序如何彼此交互。1688 API接口则是1688平台为商家提供的一套接口规范,允许商家…