OneDiff加速“图生生”,解锁电商AI图像处理新范式

2024年,电商领域正目睹生成式AI软件工具的飞速发展,AI Generated Content (AIGC) 技术在电商应用中的普及率正在显著提升,这类技术能够显著提高商业运营的效率,并促进业绩的稳步增长。

硅基流动研发的图片/视频生成推理引擎OneDiff能够以高性能和低成本的优势为AIGC应用程序提供支持。因其加速性能突出、部署简单、稳定性高的特点,南京一言万相网络科技有限公司的图生生团队在实测对比多个推理加速引擎后选择了OneDiff,并在AI图像智能擦除工具中率先应用,显著提高了用户体验。

作者|图生生团队

“图生生”是为电商行业量身打造的一体化人工智能解决方案,运用先进的AI技术,为商家提供高效且成本低廉的高质量图片制作服务。我们平台的主要功能包括:AI商品图自动生成、AI基础绘图、AI图片编辑以及AI模型训练等。

图生生能够为电商商家提供商品实拍图模特及场景替换解决方案,多维赋能商家低成本、分钟级生成多元风格的高清商品图,以便批量产出新的营销物料,尤其面向国内、海外市场千万家以上中小型电商企业与广告主,主要解决传统实拍成本高与周期慢的痛点。

1

业务挑战与技术选型

我们专为电商环境打造的AI图像智能擦除工具,旨在帮助用户迅速去除商品图片中不必要的内容。该工具经过深度训练和优化,能够轻松去除图片中的文字、人物等元素。用户仅需用画笔在想要清除的区域轻轻涂抹,即可高效完成擦除,并自动生成与原背景和谐相融的内容。

在该项目的开发过程中,我们面临两大主要挑战:首先是构建高质量的训练数据集。在数据集构建环节,我们投入了大量的工作,涵盖了数据的清洗和标注等多个方面。其次是开发可信赖的训练代码。在训练阶段,我们充分利用了多卡训练资源,进行了大量的超参数优化(HPO)实验。此外,在产品上线后,用户反馈响应速度较慢,这直接影响了用户体验。

我们的技术团队早期就跟进过OneFlow的产品进展,了解到袁进辉老师的新创业方向硅基流动(SiliconFlow)后,得知了OneDiff的产品讯息,决定进行尝试。


结果证明,团队的AI图像智能擦除工具引入OneDiff后,显著提高了用户体验,同时保持了擦除效果的稳定性,为业务发展带来了正面效益。

a1b99fe9fbde8f86e13a624c53d45c4b.png

相较于其他加速引擎,OneDiff在加速效果和使用体验上都表现出色,不仅在大多数使用场景下都展现出优于其他引擎的加速效果,而且对现有代码的侵入性极低,只需简单几行代码即可实现推理加速。此外,OneDiff直接兼容PyTorch,简化了整个部署流程,提高了团队的开发效率。

5ac6f1de04108025162e5a71895d4723.png

尤其在优化产品中的图像生成推理性能时,我们对比测试了多个框架,发现OneDiff在加速性能上的表现最为突出,同时它保证了图像质量和原生PyTorch的一致性(注:DeepCache是有损加速。如果效果可接受,那么OneDiff可组合DeepCache一起使用,性能最高加速3倍)。

这进一步证明,OneDiff是产品优化过程中的理想选择。目前,我们已经计划在后续阶段开始试用OneDiff企业版。

2

业务场景展示

1.商品背景图:只需一张SKU产品图,快速生成千人千面产品场景图

使用图生生生成AI商品背景图,无需等待,出图效率高,出错率低。

功能支持:

(1)推荐场景:挑选合适的推荐场景生成商品图

e2a7d1713f730e630f685b2c2509a5fc.png

(2)参考场景:上传参考商品图,一键即可生成相似风格商品图

d30ec48d71e76b6c2cb501dc2efe111b.png

(3)自定义描述:根据特定描述语,也可同时配合参考图,生成高度可控的,多种风格的商品图

cc272216d2fdf977c41eff00aef2bfd2.png

2. 文生图:简单的文字描述,AI直接生图

图生生在简单易用性与专业生成效果之间取得平衡,以模块化的场景图模版代替传统视觉大模型流行的文生图。描述出一个专业的商品图场景需要专业的提示词表达,而大多数普通商家并不具备相关能力。

我们可以将适用在各个品类中的通用的部分加以提炼,按照不同品类的出图需求和特点,采用个性化的方式(算法、工程)区别对待,形成针对各个细分和垂直领域的专属解决方案。

224c65c0acba86960c8ee687fcebf9c7.png

3. AI图片编辑工具:自动化后期修图,高精度还原商品细节

该系列工具可以用于自动化生成电商主图,能够基于商品的属性、特点、评价等信息,创作高质量的商品图,增强商品的展示效果和吸引力。告别Photoshop中复杂的钢笔工具抠图,该工具允许用户仅用简单几笔勾勒出对象轮廓,随后一键实现智能抠图,操作简便,小白也能轻松上手。

97f6fa2c0538eaa563b9f9a897b6a556.png

4. 企业服务:提供贴合企业需求的定制方案,包含算力、模型、产品的一站式解决方案

对于初创公司而言,无论是训练模型还是图片后期的优化,都离不开语料库的积累、高质量数据输入以及对特定场景和行业的深入理解。客户方、平台方联合共创在初期是必经之路。通过专门为不同行业构建高效的数据集,并对模型参数进行持续的训练和优化,我们实现了对人工智能生成图片效果的更精确和成本效益的控制。

a1b7659648f28aa9255d0fcd26dfb564.png

3

结语

AI图像擦除工具是我们首次在生产环境中尝试OneDiff,我们计划将OneDiff的应用场景扩展到更多领域,包括文本生成图像、商品图像处理以及图像局部重绘等多个方面,以进一步提升我们产品的效率和性能。我们期待OneDiff能够提供更迅速而稳定的加速效果,并及时整合新的开源算法,支持更多种类的算法应用。

电商行业拥有庞大的市场容量和多样化的目标客户群。电商企业通常具有较高的数字化水平,对新科技的接纳能力强。在确保数据合规与安全的前提下,图生生团队致力于满足各行业和不同场景对AIGC的需求,高效地解决商家在图片素材处理上的需求,同时显著减少产品开发的时间和成本投入。未来,我们将不断提升模型的精度、扩展功能和适应更广泛的应用场景。

【OneDiff v0.12.1 正式发布(生产环境稳定加速SD&SVD)】本次更新包含以下亮点,欢迎体验新版本:github.com/siliconflow/onediff

*  SDXL 和 SVD 的 SOTA 性能更新

*  全面支持SD和SVD动态分辨率运行

*  编译/保存/加载HF Diffusers的pipeline

*  HF Diffusers的快速LoRA加载和切换

*  加速了 InstantID(加速1.8倍)

*  加速了 SDXL Lightning

b673bf7a205d394d4d5126d048380c2f.png

(SDXL E2E Time)

aa49c324f5f4f1e535a65346119b0b46.png

(SVD E2E Time)

更多详情:https://www.reddit.com/r/StableDiffusion/comments/1b8t3cu/onediff_v0121_is_releasedstable_acceleration_of/

其他人都在看

  • 800+页免费“大模型”电子书

  • 揭示语言大模型的采样过程

  • 混合输入矩阵乘法的性能优化

  • 强化学习之父:通往AGI的另一种可能

  • 好久不见!OneFlow 1.0全新版本上线

  • LLM推理入门指南:文本生成的初始化与解码

  • AIGC效率利器:OneDiff让图片/视频生成加速3倍

3e5eac7303dee6822577f376d1a44e1a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/777416.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux:Jenkins:参数化版本回滚(6)

上几章我讲到了自动集成和部署 Linux:Jenkins全自动持续集成持续部署(4)-CSDN博客https://blog.csdn.net/w14768855/article/details/136977106 当我们觉得这个页面不行的时候,需要进行版本回滚,回滚方法我这里准备了…

Hello算法2:复杂度分析

Hello算法2:复杂度分析 本文是基于k神的Hello 算法的读书笔记,请支持实体书。 https://www.hello-algo.com/chapter_paperbook/ 算法效率 算法效率评估 设计算法时,我们追求以下两个目标: 找出解法找出最优解 最优解通常包含…

实验7 内置对象response

编写代码&#xff0c;掌握request、response的用法。【参考课本4.6.2】 三、源代码以及执行结果截图&#xff1a; input.jsp <% page language"java" contentType"text/html; charsetutf-8" pageEncoding"utf-8"%> <!DOCTYPE html>…

Redis面试题-缓存穿透,缓存击穿,缓存雪崩

1、穿透: 两边都不存在&#xff08;皇帝的新装&#xff09; &#xff08;黑名单&#xff09; &#xff08;布隆过滤器&#xff09; 解释&#xff1a;请求的数据既不在Redis中也不在数据库中&#xff0c;这时我们创建一个黑名单来存储该数据&#xff0c;下次再有类似的请求进来…

Q-Day提前?IBM警告:「量子+AI」将触发巨大风险!

Q-Day&#xff0c;即量子计算机强大到足以破解当前加密方案的时刻&#xff0c;原本被视为一个从近期到长期可能面临的挑战&#xff0c;而非刻不容缓的现实问题。然而&#xff0c;最新的研究发现似乎加速了这一天的到来。 IBM的研究团队在一篇论文中提出&#xff0c;混合量子经典…

Redis入门到实战-第二十二弹

Redis实战热身Sentinel篇 官网地址 声明: 由于操作系统, 版本更新等原因, 文章所列内容不一定100%复现, 还要以官方信息为准 https://redis.io/Redis概述 Redis是一个开源的&#xff08;采用BSD许可证&#xff09;&#xff0c;用作数据库、缓存、消息代理和流处理引擎的内存…

谷歌DeepMind推出SIMA智能体,可以跟人一起玩游戏

谷歌 DeepMind 推出了 SIMA&#xff0c;这是一种通过训练学习游戏技能的人工智能代理&#xff0c;因此它玩起来更像人类&#xff0c;而不是一个只做自己事情的强大人工智能。 从早期与 Atari 游戏合作&#xff0c;到以人类大师级别玩《星际争霸 II》的 AlphaStar 系统&#xf…

【STM32CubeMX(2)】点亮第一个LED灯

通过本节可以学习到&#xff1a; 如何通过STM32CubeMX建立一个单片机工程如果是仿真下载需要注意些什么怎么通过HAL库使用外设功能 软件环境&#xff1a; STM32CubeMX version6.10.0 Keil_v5&#xff08;MDK-ARM&#xff09; version 5.32 硬件环境&#xff1a; STM32F103…

Mysql数据库:主从复制与读写分离

目录 前言 一、Mysql主从复制概述 1、Mysql主从复制概念 2、Mysql主从复制功能和使用场景 2.1 功能&#xff08;为何使用主从复制&#xff09; 2.2 适用场景&#xff08;何时使用主从复制&#xff09; 3、Mysql复制的类型 3.1 基于SQL语句的复制&#xff08;Statement默…

数字化对制造业生产效率的影响与优化策略

导 读 ( 文/ 1419 ) 在当今竞争激烈的市场环境下&#xff0c;制造业企业面临着日益增长的压力&#xff0c;需要不断提高生产效率以保持竞争力。数字化技术作为一种重要的生产力工具&#xff0c;已经在制造业中得到广泛应用。本文将探讨数字化对制造业生产效率的影响&#xff0c…

python可视化:tqdm进度条控制台输出模块

前言 在处理大量数据或执行耗时操作时&#xff0c;了解代码执行的进度是至关重要的。在Python中&#xff0c;通过使用进度条可以有效地实现对代码执行进度的可视化展示。 tqdm 是一个快速、可扩展的Python进度条库&#xff0c;能够实时显示代码执行的进度。并且它提供了简洁的A…

用Python机器学习模型预测世界杯结果靠谱吗?

看到kaggle、medium上有不少人用球队的历史数据来进行建模预测&#xff0c;比如用到泊松分布、决策树、逻辑回归等算法&#xff0c;很大程度上能反映强者恒强的现象&#xff0c;比如巴西、英格兰等大概率能进8强&#xff0c;就像高考模拟考试成绩越好&#xff0c;大概率高考也会…

Spring高级面试题-2024

Spring 框架中都用到了哪些设计模式&#xff1f; 1. 简单工厂&#xff1a; ○ BeanFactory&#xff1a;Spring的BeanFactory充当工厂&#xff0c;负责根据配置信息创建Bean实例。它是一种工厂模式的应用&#xff0c;根据指定的类名或ID创建Bean对象。2. 工厂方法&#xff…

爬取肯德基餐厅查询中指定地点的餐厅数据

进入肯德基官网 代码编写 import requests import jsonif __name__ __main__:get_url http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opkeywordheaders {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/1…

开源AI引擎:利用影像处理与目标检测技术对违章建筑排查

一、项目案例介绍 随着城市化进程的加快&#xff0c;城市规划和管理工作面临着前所未有的挑战&#xff0c;违章建筑的排查与处理成为了城市管理中的一项重要任务。传统的违章建筑排查方法依赖于人力巡查&#xff0c;效率低下且难以全面覆盖。为了解决这一问题&#xff0c;现代…

Webgl学习系列-Webgl 入门

Webgl学习系列 第二章 Webgl 入门 文章目录 一、最短的webgl程序二、通过webgl绘制一个点三、webgl三维坐标 一、最短的webgl程序 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title>…

【python基础教程】2. 算法的基本要素与特性

&#x1f388;个人主页&#xff1a;豌豆射手^ &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;python基础教程 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共同学习、…

docker 部署 gitlab-ce 16.9.1

文章目录 [toc]拉取 gitlab-ce 镜像创建 gitlab-ce 持久化目录启停脚本配置配置 gitlab-ce编辑 gitlab-ce 配置文件重启 gitlab-ce配置 root 密码 设置中文 gitlab/gitlab-ce(需要科学上网) 拉取 gitlab-ce 镜像 docker pull gitlab/gitlab-ce:16.9.1-ce.0查看镜像是不是有 Vo…

路由的完整使用

多页面和单页面 多页面是指超链接等跳转到另一个HTML文件,单页面是仍是这个文件只是路由改变了页面的一部分结构. 路由的基本使用 使用vue2,则配套的路由需要是第3版. 1)下载vue-router插件 2)引入导出函数 3)new 创建路由对象 4)当写到vue的router后只能写路由对象,因此只…

嵌入式软件工程师都需要安装哪些软件

文章目录 一、编程软件1.keil2.vscode①Chinese&#xff1a;中文②C/C、C/C Extension Pack③CMake、CMake Tools等代码调试运行的工具④Remote-SSH等&#xff0c;关于远程登录linux服务器的插件 3.Pycharm和Anaconda&#xff0c;用来写python脚本和配置环境&#xff0c;PYQT上…