OneDiff加速“图生生”,解锁电商AI图像处理新范式

2024年,电商领域正目睹生成式AI软件工具的飞速发展,AI Generated Content (AIGC) 技术在电商应用中的普及率正在显著提升,这类技术能够显著提高商业运营的效率,并促进业绩的稳步增长。

硅基流动研发的图片/视频生成推理引擎OneDiff能够以高性能和低成本的优势为AIGC应用程序提供支持。因其加速性能突出、部署简单、稳定性高的特点,南京一言万相网络科技有限公司的图生生团队在实测对比多个推理加速引擎后选择了OneDiff,并在AI图像智能擦除工具中率先应用,显著提高了用户体验。

作者|图生生团队

“图生生”是为电商行业量身打造的一体化人工智能解决方案,运用先进的AI技术,为商家提供高效且成本低廉的高质量图片制作服务。我们平台的主要功能包括:AI商品图自动生成、AI基础绘图、AI图片编辑以及AI模型训练等。

图生生能够为电商商家提供商品实拍图模特及场景替换解决方案,多维赋能商家低成本、分钟级生成多元风格的高清商品图,以便批量产出新的营销物料,尤其面向国内、海外市场千万家以上中小型电商企业与广告主,主要解决传统实拍成本高与周期慢的痛点。

1

业务挑战与技术选型

我们专为电商环境打造的AI图像智能擦除工具,旨在帮助用户迅速去除商品图片中不必要的内容。该工具经过深度训练和优化,能够轻松去除图片中的文字、人物等元素。用户仅需用画笔在想要清除的区域轻轻涂抹,即可高效完成擦除,并自动生成与原背景和谐相融的内容。

在该项目的开发过程中,我们面临两大主要挑战:首先是构建高质量的训练数据集。在数据集构建环节,我们投入了大量的工作,涵盖了数据的清洗和标注等多个方面。其次是开发可信赖的训练代码。在训练阶段,我们充分利用了多卡训练资源,进行了大量的超参数优化(HPO)实验。此外,在产品上线后,用户反馈响应速度较慢,这直接影响了用户体验。

我们的技术团队早期就跟进过OneFlow的产品进展,了解到袁进辉老师的新创业方向硅基流动(SiliconFlow)后,得知了OneDiff的产品讯息,决定进行尝试。


结果证明,团队的AI图像智能擦除工具引入OneDiff后,显著提高了用户体验,同时保持了擦除效果的稳定性,为业务发展带来了正面效益。

a1b99fe9fbde8f86e13a624c53d45c4b.png

相较于其他加速引擎,OneDiff在加速效果和使用体验上都表现出色,不仅在大多数使用场景下都展现出优于其他引擎的加速效果,而且对现有代码的侵入性极低,只需简单几行代码即可实现推理加速。此外,OneDiff直接兼容PyTorch,简化了整个部署流程,提高了团队的开发效率。

5ac6f1de04108025162e5a71895d4723.png

尤其在优化产品中的图像生成推理性能时,我们对比测试了多个框架,发现OneDiff在加速性能上的表现最为突出,同时它保证了图像质量和原生PyTorch的一致性(注:DeepCache是有损加速。如果效果可接受,那么OneDiff可组合DeepCache一起使用,性能最高加速3倍)。

这进一步证明,OneDiff是产品优化过程中的理想选择。目前,我们已经计划在后续阶段开始试用OneDiff企业版。

2

业务场景展示

1.商品背景图:只需一张SKU产品图,快速生成千人千面产品场景图

使用图生生生成AI商品背景图,无需等待,出图效率高,出错率低。

功能支持:

(1)推荐场景:挑选合适的推荐场景生成商品图

e2a7d1713f730e630f685b2c2509a5fc.png

(2)参考场景:上传参考商品图,一键即可生成相似风格商品图

d30ec48d71e76b6c2cb501dc2efe111b.png

(3)自定义描述:根据特定描述语,也可同时配合参考图,生成高度可控的,多种风格的商品图

cc272216d2fdf977c41eff00aef2bfd2.png

2. 文生图:简单的文字描述,AI直接生图

图生生在简单易用性与专业生成效果之间取得平衡,以模块化的场景图模版代替传统视觉大模型流行的文生图。描述出一个专业的商品图场景需要专业的提示词表达,而大多数普通商家并不具备相关能力。

我们可以将适用在各个品类中的通用的部分加以提炼,按照不同品类的出图需求和特点,采用个性化的方式(算法、工程)区别对待,形成针对各个细分和垂直领域的专属解决方案。

224c65c0acba86960c8ee687fcebf9c7.png

3. AI图片编辑工具:自动化后期修图,高精度还原商品细节

该系列工具可以用于自动化生成电商主图,能够基于商品的属性、特点、评价等信息,创作高质量的商品图,增强商品的展示效果和吸引力。告别Photoshop中复杂的钢笔工具抠图,该工具允许用户仅用简单几笔勾勒出对象轮廓,随后一键实现智能抠图,操作简便,小白也能轻松上手。

97f6fa2c0538eaa563b9f9a897b6a556.png

4. 企业服务:提供贴合企业需求的定制方案,包含算力、模型、产品的一站式解决方案

对于初创公司而言,无论是训练模型还是图片后期的优化,都离不开语料库的积累、高质量数据输入以及对特定场景和行业的深入理解。客户方、平台方联合共创在初期是必经之路。通过专门为不同行业构建高效的数据集,并对模型参数进行持续的训练和优化,我们实现了对人工智能生成图片效果的更精确和成本效益的控制。

a1b7659648f28aa9255d0fcd26dfb564.png

3

结语

AI图像擦除工具是我们首次在生产环境中尝试OneDiff,我们计划将OneDiff的应用场景扩展到更多领域,包括文本生成图像、商品图像处理以及图像局部重绘等多个方面,以进一步提升我们产品的效率和性能。我们期待OneDiff能够提供更迅速而稳定的加速效果,并及时整合新的开源算法,支持更多种类的算法应用。

电商行业拥有庞大的市场容量和多样化的目标客户群。电商企业通常具有较高的数字化水平,对新科技的接纳能力强。在确保数据合规与安全的前提下,图生生团队致力于满足各行业和不同场景对AIGC的需求,高效地解决商家在图片素材处理上的需求,同时显著减少产品开发的时间和成本投入。未来,我们将不断提升模型的精度、扩展功能和适应更广泛的应用场景。

【OneDiff v0.12.1 正式发布(生产环境稳定加速SD&SVD)】本次更新包含以下亮点,欢迎体验新版本:github.com/siliconflow/onediff

*  SDXL 和 SVD 的 SOTA 性能更新

*  全面支持SD和SVD动态分辨率运行

*  编译/保存/加载HF Diffusers的pipeline

*  HF Diffusers的快速LoRA加载和切换

*  加速了 InstantID(加速1.8倍)

*  加速了 SDXL Lightning

b673bf7a205d394d4d5126d048380c2f.png

(SDXL E2E Time)

aa49c324f5f4f1e535a65346119b0b46.png

(SVD E2E Time)

更多详情:https://www.reddit.com/r/StableDiffusion/comments/1b8t3cu/onediff_v0121_is_releasedstable_acceleration_of/

其他人都在看

  • 800+页免费“大模型”电子书

  • 揭示语言大模型的采样过程

  • 混合输入矩阵乘法的性能优化

  • 强化学习之父:通往AGI的另一种可能

  • 好久不见!OneFlow 1.0全新版本上线

  • LLM推理入门指南:文本生成的初始化与解码

  • AIGC效率利器:OneDiff让图片/视频生成加速3倍

3e5eac7303dee6822577f376d1a44e1a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/777416.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux:Jenkins:参数化版本回滚(6)

上几章我讲到了自动集成和部署 Linux:Jenkins全自动持续集成持续部署(4)-CSDN博客https://blog.csdn.net/w14768855/article/details/136977106 当我们觉得这个页面不行的时候,需要进行版本回滚,回滚方法我这里准备了…

电脑病毒详解(有bat版本 附代码)

众所周知,电脑病毒是所有用电脑的人最怕的东西。 它们是一种恶意软件,旨在破坏、感染或干扰计算机系统的正常运行。它们通过潜入计算机系统并在后台执行恶意代码来实现其目的。病毒可以通过互联网、可移动媒介(如USB驱动器)或下载…

Java基础知识总结(26)

MyBatis MyBatis框架解决的问题: 减轻使用JDBC的复杂性,不用编写重复的常见connection,Statement;不用编写关闭资源代码。直接使用java对象,表示结果数据。让开发者专注SQL的处理。其他分心的工作由MyBatis代劳。 三层架构 UI:&#xff0…

如何更好地收集软件需求并快速转换成软件功能

摘要 在软件开发过程中,需求收集与转换是确保项目成功的关键环节。本文详细探讨了如何更有效地收集软件需求,并迅速将这些需求转化为实际的软件功能,涉及的方法包括深入的用户研究、原型设计、敏捷开发方法以及持续的反馈循环。 关键词&…

【华为OD机试】机器人搬砖【C卷|100分】

题目描述 机器人搬砖,一共有N堆砖存放在N个不同的仓库中,第i堆砖中有bricks[i]块砖头, 要求在8小时内搬完。机器人每小时能搬砖的数量取决于有多少能量格, 机器人一个小时中只能在一个仓库中搬砖,机器人的能量格每小时补充一次且能量格只在这一个小时有效,为使得机器人损…

Hello算法2:复杂度分析

Hello算法2:复杂度分析 本文是基于k神的Hello 算法的读书笔记,请支持实体书。 https://www.hello-algo.com/chapter_paperbook/ 算法效率 算法效率评估 设计算法时,我们追求以下两个目标: 找出解法找出最优解 最优解通常包含…

Java 8中的Stream API及其用途详解

Java 8中的Stream API是Java函数式编程的一个核心组成部分,它允许你以声明性方式处理数据集合(如列表、集合等)。通过使用Stream API,你可以更方便地执行复杂的操作,如过滤、映射、排序和聚合,而无需编写大…

部署实施案例分析题

习题一 随着医院信息化程度的不断提高,各业务系统的全面上线,对IT基础架构的安全性、稳定性以及业务系统的连续性提出了较高的要求,运维工作也相同面临了前所未有的挑战。 为加强该医院的运维工作的规范化,并提高日常运维的工作…

实验7 内置对象response

编写代码&#xff0c;掌握request、response的用法。【参考课本4.6.2】 三、源代码以及执行结果截图&#xff1a; input.jsp <% page language"java" contentType"text/html; charsetutf-8" pageEncoding"utf-8"%> <!DOCTYPE html>…

LeetCode刷题笔记之动态规划(三)

一、子序列/子数组问题 子序列&#xff1a;按原数组的顺序排列&#xff0c;不一定是原数组中的相邻元素组成的。即子序列可以是不连续的。 子数组&#xff1a;原数组中连续的几个元素组成的数组。 1. 300【最长递增子序列】 题目&#xff1a; 给你一个整数数组 nums &#xff…

Redis面试题-缓存穿透,缓存击穿,缓存雪崩

1、穿透: 两边都不存在&#xff08;皇帝的新装&#xff09; &#xff08;黑名单&#xff09; &#xff08;布隆过滤器&#xff09; 解释&#xff1a;请求的数据既不在Redis中也不在数据库中&#xff0c;这时我们创建一个黑名单来存储该数据&#xff0c;下次再有类似的请求进来…

Q-Day提前?IBM警告:「量子+AI」将触发巨大风险!

Q-Day&#xff0c;即量子计算机强大到足以破解当前加密方案的时刻&#xff0c;原本被视为一个从近期到长期可能面临的挑战&#xff0c;而非刻不容缓的现实问题。然而&#xff0c;最新的研究发现似乎加速了这一天的到来。 IBM的研究团队在一篇论文中提出&#xff0c;混合量子经典…

测试学习1

学习目标 熟悉测试流程和规范&#xff0c;熟练掌握软件测试方法至少熟悉功能测试.性能测试.安全测试中的一种;熟练使用常用的测试工具&#xff0c;熟悉缺陷管理跟踪软件(禅道.Jira.QC等)&#xff0c;熟悉持续集成工具Jenkin;熟悉Linux操作系统&#xff0c;熟悉TCP/HTTPS等网络…

Redis入门到实战-第二十二弹

Redis实战热身Sentinel篇 官网地址 声明: 由于操作系统, 版本更新等原因, 文章所列内容不一定100%复现, 还要以官方信息为准 https://redis.io/Redis概述 Redis是一个开源的&#xff08;采用BSD许可证&#xff09;&#xff0c;用作数据库、缓存、消息代理和流处理引擎的内存…

利用出海、Socks5代理与代理IP

在当今数字化时代&#xff0c;跨界电商已成为企业扩展业务、拓展市场的重要策略。然而&#xff0c;这种扩展并非没有风险。网络安全问题一直是跨界电商必须面对的挑战之一。为了确保数据安全、保护用户隐私&#xff0c;以及有效应对地区限制&#xff0c;出海、Socks5代理与代理…

谷歌DeepMind推出SIMA智能体,可以跟人一起玩游戏

谷歌 DeepMind 推出了 SIMA&#xff0c;这是一种通过训练学习游戏技能的人工智能代理&#xff0c;因此它玩起来更像人类&#xff0c;而不是一个只做自己事情的强大人工智能。 从早期与 Atari 游戏合作&#xff0c;到以人类大师级别玩《星际争霸 II》的 AlphaStar 系统&#xf…

【STM32CubeMX(2)】点亮第一个LED灯

通过本节可以学习到&#xff1a; 如何通过STM32CubeMX建立一个单片机工程如果是仿真下载需要注意些什么怎么通过HAL库使用外设功能 软件环境&#xff1a; STM32CubeMX version6.10.0 Keil_v5&#xff08;MDK-ARM&#xff09; version 5.32 硬件环境&#xff1a; STM32F103…

vue 列表渲染

v-for​ 我们可以使用 v-for 指令基于一个数组来渲染一个列表。v-for 指令的值需要使用 item in items 形式的特殊语法&#xff0c;其中 items 是源数据的数组&#xff0c;而 item 是迭代项的别名&#xff1a; const items ref([{ message: Foo }, { message: Bar }]) <l…

Mysql数据库:主从复制与读写分离

目录 前言 一、Mysql主从复制概述 1、Mysql主从复制概念 2、Mysql主从复制功能和使用场景 2.1 功能&#xff08;为何使用主从复制&#xff09; 2.2 适用场景&#xff08;何时使用主从复制&#xff09; 3、Mysql复制的类型 3.1 基于SQL语句的复制&#xff08;Statement默…

态势感知平台简单介绍

什么是态势感知平台&#xff1f; 安全态势感知平台是一种综合型网络安全解决方案&#xff0c;其核心目标在于帮助企业提升对安全态势的感知能力&#xff0c;从而更有效地应对不断变化的网络威胁环境。 该平台具备多种核心功能。首先&#xff0c;它能够实现数据收集与整合&…