因吹斯汀!只需上传照片,GPT-4V精准识别食物的卡路里和摄入热量

健身和减肥的朋友有福啦!

最近一篇文章探索了GPT-4V在膳食评估领域的强大能力,可以根据饮食图片精准判断食物的种类与重量,并给出营养成分的分析,包括碳水化合物、蛋白质、脂肪占比。

最最重要的是,它还能告诉我们这些食物的卡路里是多少,这对于我们减肥的朋友来说可是超级重要的!

你可以上传吃之前和吃之后的图片,GPT-4V可以轻松判断摄入了多少热量。

比如提供这两张图片:

图片

给模型一些任务提示:

识别提供的图像中的食物类型,包括食用前和食用后。使用周围的对象作为近似分量大小的参考。为每一类食物的摄入量提供合理的克数估计。请注意,这些食品来自加纳和肯尼亚。

输出结果:

为了估算份量,我将使用杯子和盘子作为参考,假设盘子是标准的餐盘大小,直径约为10-12英寸。以这些物体为尺度,我们可以做出以下估计: 食物1(炸鱼):初始份量约400克;消费份量约300克。食物2(淀粉类配菜,可能是banku或fufu):初始份量约300克;消费份量约250克。食物3(番茄酱):初始份量约150克;消费份量约75克。食物4(洋葱片):初始份量约50克;消费份量约20克。

看看营养成分呢:

计算一下300g炸鱼、250gbanku、75g番茄酱和20g洋葱片的营养成分,包括碳水化合物、蛋白质、脂肪和卡路里。请以下列格式列出结果:碳水化合物:[g],蛋白质:[g],脂肪:[g],卡路里:[千卡]。

输出:

300克炸鱼包括0克碳水化合物,78克蛋白质,33克脂肪,606千卡的热量。250g的banku含有120g碳水化合物,4.5g蛋白质,1g脂肪,527.5千卡热量。75g番茄酱,包含3g碳水化合物,0.75克蛋白质,0.225克脂肪,15千卡的热量。20g洋葱片含有1.8克碳水化合物、0.22克蛋白质、0.02克脂肪和8千卡热量。

它还能像个营养小贴士一样,告诉我们饮食中缺少了哪些营养,并给出合理的建议。这样我们就可以更好地调整自己的饮食。

这顿饭缺少什么营养,吃什么来补充呢?

图片

输出:

根据您提供的图片,这顿饭包括米饭和鸡肉,这可能提供了大量的碳水化合物、蛋白质和脂肪。然而,它似乎缺乏一些纤维和维生素:纤维:没有可见的蔬菜或水果,而这些是提供膳食纤维所必需的。为了增加纤维摄入量,可以考虑加一份混合蔬菜或新鲜沙拉。维生素和矿物质:新鲜水果和蔬菜也是维生素和矿物质的重要来源。乳制品或钙源:没有乳制品或其他富含钙的食物。可以从牛奶,奶酪,酸奶,或钙强化植物选择一份增加钙含量。

看着还挺像那么回事,有了GPT-4V督促,就不用担心一不小心吃多啦!

图片

但上面只是一些例子参考,GPT-4V在膳食评估方面的准确性到底如何呢?本文的作者还进行了多个数据维度的详细定量分析,让我们一起来了解一下吧!

论文标题:
Dietary Assessment with Multimodal ChatGPT: A Systematic Analysis

论文链接:
https://arxiv.org/pdf/2312.08592.pdf

实验数据

作者使用了居住在伦敦的肯尼亚和加纳裔成年人的饮食摄入数据。为每位参与者分配了eButton或AIM摄像机被动记录他们的饮食摄入量。使用标准化的Salter breknell体重秤记录食物初始重量和吃饱后剩余的食物重量。配备经验丰富的营养师作为人工评估基准,与GPT-4V的结果进行比较。

实验结果

食物检测能力

首先来看看GPT-4V能否准确识别食物的类别。

作者对比了是否包含食物来源信息的提示下的模型性能。从结果可以看出,指明食物来源可以显著提高语言模型的能力,准确识别特定文化的食物,**准确率达到了87.5%**,相比不说明食物来源提高了十几个点。

图片

当食物来源未指定时,GPT-4V经常错误将白色淀粉类食物误分类为米饭。当说明了食物来自肯尼亚或加纳时,模型能准确将食物识别为banku或ugali,这是传统的非洲食物。

食物分量估计

下图展示了三种方法包括GPT-4V、人眼估计和基准真值对食物分量的估计,图中观察到的趋势表明,GPT-4V的预测通常与基准真值非常接近。

图片

作者进一步使用绝对误差的度量来比较GPT-4V和人类估计。GPT-4V的估计的平均绝对误差为54.6g。相比之下,人类估计准确性稍微更高一些,平均绝对误差为43.6g。但也说明GPT-4V的表现与人类非常接近

图片

营养成分估计

在估算出食物分量之后,作者利用GPT-4V模型将食物的重量转化为特定的营养数据,重点关注关键的膳食成分:碳水化合物,蛋白质,脂肪和卡路里。获取的结果与真实值进行比较。

下表展示了10个不同膳食的分量和营养成分估计误差。可以看到,营养估计的准确性在很大程度上取决于分量估计的准确性。

图片

下图显示了GPT-4V预测32种食物的碳水化合物、蛋白质、脂肪和卡路里含量的预测结果,并与真实值进行对比,可以看出,GPT-4V预测的趋势在大部分食物上与真值一致

图片

处理低可见图像的能力

本文还突显了GPT-4V处理低可见度图像(如在黑暗环境中拍摄的图像)的能力。

图片

在光线暗的地方,如果没有足够的语境提示,GPT-4V可能倾向于会把食物当成米饭或面包这类常见的食物。但是,当我们给了它一些关于食物来源的信息时,它就能准确地识别出来,比如banku和ugali这种传统的非洲食物。

结论

本文分析了GPT-4V在膳食评估中的潜力。即使在没有使用特定食物数据集进行微调或适应的情况下,GPT-4V在食物检测方面准确率高达87.5%。另外GPT-4V可以利用周围的物体作为比例参考来推断食物项目的份量大小,进一步提高将食物重量转化为营养含量的准确性。

虽然GPT-4V很强大,但还不能完全解决复杂的空间关系和精确空间分析任务。比如,它对于估算食物的体积或分量不太准确,因为这需要三维感知能力,超出了它的能力范围。在本文的实验中发现它对重量不到30g的食物类别难以准确估计。

即便如此,它的表现也几乎达到了人类水平。期待未来版本的GPT-4V能更稳健,为我们提供更准确的膳食摄入评估。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/578393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何进行实例管理

目录 修改实例规格 修改网络带宽 网站的访问量每天都比较高,网站明显变慢了,这是怎么回事? 这说明你的网站的并发访问能力已经不足了,并发访问是指同一时间,多个用户请求访问同一个域名下的资源或服务,请…

掌握JWT:解密身份验证和授权的关键技术

JSON Web Token 1、什么是JWT2、JWT解决了什么问题3、早期的SSO认证4、JWT认证5、JWT优势6、JWT结构Header 标头Payload 负载 Signature 签名 7、代码实现添加依赖生成Token认证token 8、工具类9、JWT整合Web10、拦截器校验11、网关路由校验12、解决多用户登录的问题13、客户端…

线程学习(3)-volatile关键字,wait/notify的使用

​ 💕"命由我作,福自己求"💕 作者:Mylvzi 文章主要内容:线程学习(2)​​​​ 一.volatile关键字 volatile关键字是多线程编程中一个非常重要的概念,它主要有两个功能:保证内存可见性…

面向对象设计与分析40讲(15)简单工厂方法模式

文章目录 定义示例优缺点定义 简单工厂模式是一种创建型模式,用于根据客户端的需求创建对象实例,所谓的需求反映到编程语言里就是传入的参数。 简单工厂模式包括三个主要部分: 工厂类(Simple Factory):这是整个模式的核心。它负责根据客户端的请求来创建并返回相应的对…

Maven依赖管理项目构建工具

文章目录 Maven依赖管理项目构建工具目录一、Maven简介1. Maven介绍2. Maven主要作用理解3. Maven软件工作原理模型图(了解) 二、Maven安装和配置1. Maven安装2. Maven环境配置3. Maven功能配置4. IDEA配置本地Maven软件 三、基于IDEA创建Maven工程1. 梳…

Anylogic Pro 8.8.x for Mac / for Linux Crack

Digital twins – a step towards a digital enterprise AnyLogic是唯一一个支持创建模拟模型的方法的模拟建模工具:面向过程(离散事件)、系统动态和代理,以及它们的任何组合。AnyLogic提供的建模语言的独特性、灵活性和强大性使…

自恢复保险丝

自恢复保险丝 常用电子元器件类型 0467.500NRHF 文章目录 自恢复保险丝前言一、自恢复保险丝是什么二、0467.500NRHF总结前言 自恢复保险丝通常用于电子设备、电路板、电视机、计算机、通信设备、充电器、电源适配器等各种电路保护应用。需要注意的是,选择适当的自恢复保险…

Docker部署Nexus Maven私服并实现远程访问Nexus界面

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《linux深造日志》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 1. Docker安装Nexus2. 本地访问Nexus3. Linux安装Cpolar4. 配置Nexus界面公网地址5. 远程访问 Nexus界面6. 固定N…

Failed to resolve component: router-view

出现了这个问题,导致本该出现的页面没有出现,在网上看了解决办法,原来是没有挂载好app 原先代码: app.use(router) createApp(App).mount(#app) //这是又创建了一个新的app,无法使用到router改进: app.…

【51单片机系列】DS18B20温度传感器模块

本文是关于温度传感器的相关内容。 文章目录 一、 DS18B20数字温度传感器介绍1.1、 DS18B20温度传感器的特点1.2、DA18B20内部结构1.3、 DS18B20的温度转换规则1.4、 DS18B20的ROM指令表1.6、 计算温度1.7、 读写时序 二、DS18B20使用示例 一、 DS18B20数字温度传感器介绍 DS1…

Sublime Text 4 中文汉化教程(Version: Build 4169)

Sublime Text 4汉化 1 知识小课堂1.1 sublim简介1.2 其他编辑器 2 安装过程2.1 安装Install Package Control2.2 Install Package2.3 安装工具包2.4 常用的插件2.5 安装中文包 1 知识小课堂 1.1 sublim简介 Sublime是一款代码编辑器,致力于为开发人员提供快速、高…

解决企业TB或者PB级大文件传输速度和安全问题

随着企业数据不断增加,TB或PB级大文件的传输成为企业信息共享和数据备份的重要手段之一。然而,这些大文件的传输速度和安全问题成为制约企业发展的瓶颈,也是企业需要解决的重要问题。本文将探讨如何解决这些问题,并从以下几个方面…

海外短剧操作配置,海外短剧小程序功能介绍,海外短剧小程序搭建开发制作

一、海外短剧小程序操作&配置 完整文档联系趣图吖:nn7334n 二、海外短剧小程序功能 功能: 批量导入一键改价 多语言切换:英语、泰语、印尼、西班 更新) 前端: 安卓ios h5三端 营销功能强大:积分营销分销商入驻会员模式 卡密模式 单独付费 三、海外短剧小程…

如何免费下载5天以内的卫星影像?

现在,我们就详细分享一下如何下载5天以内卫星影像的具体操作方法。 如何下载5天以内卫星影像 在soar.earth网站中,点击“Enter the Atlas”按钮,打开地图图库。 打开地图图库 我们可以根据自己的需要,在右下角切换底图&#xf…

掌握的单词个数 - 华为OD统一考试

OD统一考试 题解: Java / Python / C++ 题目描述 有一个字符串数组 words 和一个字符串 chars。假如可以用 chars 中的字母拼写出 words 中的某个"单词"(字符串),那么我们就认为你掌握了这个单词。 words 的字等仅由 a-z 英文小写宁母组成,例如“abc”。 char…

Pytorch深度强化学习2-1:基于价值的强化学习——DQN算法

目录 0 专栏介绍1 基于价值的强化学习2 深度Q网络与Q-learning3 DQN原理分析4 DQN训练实例 0 专栏介绍 本专栏重点介绍强化学习技术的数学原理,并且采用Pytorch框架对常见的强化学习算法、案例进行实现,帮助读者理解并快速上手开发。同时,辅…

SQL server 数据库练习题及答案(练习3)

一、编程题 公司部门表 department 字段名称 数据类型 约束等 字段描述 id int 主键,自增 部门ID name varchar(32) 非空,唯一 部门名称 description varchar(1024) …

HTTP content-type内容类型的常见格式

本专栏是汇集了一些HTML常常被遗忘的知识,这里算是温故而知新,往往这些零碎的知识点,在你开发中能起到炸惊效果。我们每个人都没有过目不忘,过久不忘的本事,就让这一点点知识慢慢渗透你的脑海。 本专栏的风格是力求简洁…

分布式训练通信NCCL之Ring-Allreduce详解

🎀个人主页: https://zhangxiaoshu.blog.csdn.net 📢欢迎大家:关注🔍点赞👍评论📝收藏⭐️,如有错误敬请指正! 💕未来很长,值得我们全力奔赴更美好的生活&…

fpga 8段4位数码管verilator模拟

8段4位数码管verilator模拟 seg.v module seg(input wire clk,input wire rst_n,output wire[7:0] SEG,output wire[3:0] SEL );reg[7:0] digit[0:15] {8h3f, 8h06, 8h5b, 8h4f, 8h66, 8h6d, 8h7d,8h07,8h7f,8h6f, 8h77, 8h7c, 8h39, 8h5e, 8h79, 8h71};reg[31:0] cnt 32…