使用vscode + Roo Code (prev. Roo Cline)+DeepSeek-R1使用一句话需求做了个实验

摘要

使用vscode、Roo Code和deepseek-reasoner进行了一个实验,尝试使用一句话需求来生成小红书封面图片。工具根据需求提供了详细的架构方案,包括技术栈选择、核心模块划分、目录结构建议等。然后,工具自动化地完成了开发和测试,并记录了详细的逻辑和使用方式在Readme文件中。实验结果表明,工具能够生成小红书封面图片,但需要进一步调整和完善,作者认为,这次实验对于小白来说已经很不错了,价格也不算贵。未来可以继续完善和优化工具来生成更实用的封面图片。

使用vscode + Roo Code (prev. Roo Cline)+deepseek-reasoner 使用一句话需求做了个实验

最近在探索一些有趣的AI工具组合,就用vscode搭配Roo Code (以前叫Roo Cline)和deepseek-reasoner(DeepSeek-R1)做了个小实验,看看能不能用一句话需求实现一些有意思的功能。

一、准备工作

要开始实验,首先得把工具准备好。在vscode的插件市场搜索“Roo Code”,然后安装就行,安装过程挺简单的,很快就能搞定。
在这里插入图片描述
安装完插件,接着就是配置Roo Code 。配置步骤按照提示一步步来,也不算复杂。我配置了DeepSeek,选择deepseek-reasoner作为默认的模型
在这里插入图片描述

需要了解到模型的相关信息和价格,可以看看官方说明:https://api-docs.deepseek.com/zh-cn/quick_start/pricing/ 。

二、实验开始

  • 我给工具提的需求很简单,就是一句话需求:我想做一个小红书封面图片自动生成的本地工具,提供几种字体和图片模板,生成大字封面图片,你有什么建议么?

  • 工具开始分析我的需求,从技术栈选择、核心模块划分,到目录结构建议,都给出了详细的思路。比如技术栈方面,推荐了Python的Pillow/OpenCV 、Node.js的Sharp/Jimp等图像处理库;核心模块划分成模板管理、字体管理、渲染引擎和输出模块;目录结构也给出了像templates、fonts、assets这些建议。还考虑到了字体版权、图片分辨率适配等关键设计点,以及安全和扩展性方面的问题。当然,我是什么都不懂的。

  • 根据我的选择,工具基于Python技术栈开始构建详细架构方案,确定了Pillow、PyYAML等核心依赖,还给出了架构优化点、异常处理策略和扩展接口设计。以下是一些AI跟我的沟通交互过程记录:

首先分析用户需求:需要开发一个本地工具用于生成小红书封面图片,核心功能包括字体管理、模板选择和图片生成。基于架构设计角度,需考虑以下几个方面:
1. 技术栈选择:
图像处理库:Python Pillow/OpenCV 或 Node.js Sharp/Jimp
字体渲染:需支持多字体文件加载
模板系统:JSON/YAML配置模板参数
界面方案:CLI命令行或Electron轻量级GUI
2. 核心模块划分:
模板管理系统(存储布局参数)
字体管理系统(字体文件加载校验)
渲染引擎(图文合成核心)
输出模块(格式转换与导出)
3. 目录结构建议:
├── templates/       # 模板配置文件
├── fonts/           # 字体资源
├── assets/          # 背景图素材
├── output/          # 生成结果
└── config.json      # 全局配置
4. 关键设计考量:
字体版权合规性(建议集成开源字体)
图片分辨率适配(多尺寸预设)
模板热加载机制
缓存优化策略(预渲染常用元素)
5. 安全方面:
图片文件类型校验
字体文件安全检查
输出目录隔离
6. 扩展性设计:
插件式模板系统
支持自定义渲染管线
元数据标注(记录生成参数)
建议采用Python技术栈快速原型开发,使用Pillow+Click构建基础版本,后续可升级为PyQt图形界面
请确认偏好技术栈:Python或Node.js?这将影响后续架构细节设计

这是我确认使用Python之后的答复

根据用户选择Python技术栈,开始构建详细架构方案:1. 核心依赖确认:- Pillow 9.0+(图像处理)- PyYAML(模板配置)- Click 8.0+(CLI构建)- fontTools(字体解析)2. 架构优化点:- 引入缓存机制预加载常用字体- 使用LRU缓存模板配置- 支持多线程批量生成- 颜色管理系统支持PANTONE色卡3. 异常处理策略:- 字体文件校验(TTF/OTF)- 图片资源尺寸校验- 内存使用监控(大图处理)4. 扩展接口设计:- 插件式滤镜系统- 模板市场对接接口- 自动化测试框架
  • 接下来就是自动化的Coding,在操作的过程,我把Auto-approve全部勾选上,让工具自动发挥作用。
    在这里插入图片描述
  • 然后一顿自动操作,需要我确认的就点一下,完成开发,并且它已经帮我做了测试。
    在这里插入图片描述
  • 为了以后使用方便,我让工具把详细的逻辑和使用方式记录在Readme文件里,为了节约篇幅、省略展示,以下是文件的主要内容提炼,可以说想的还是很周全了。
# 小红书封面生成工具## 功能特性
- 基于模板的封面图片生成
- 支持多种字体和文字样式配置
- 智能布局系统(边距/对齐/行间距)
- YAML格式配置文件
- 安全校验机制(文件存在性/尺寸限制)## 快速开始### 1. 环境准备
- 创建虚拟环境(可选)
- 安装依赖### 2. 基础使用
- 生成默认模板封面
- 指定模板生成
- 自定义字体### 3. 参数说明
- `--template`:指定模板名称(默认default)
- `--font`:自定义字体路径
- `--output`:输出路径(支持时间戳占位符)
- `--help`:显示完整帮助信息### 4. 高级功能
- 批量生成模式(需准备titles.txt文件)
- 质量参数调整(0-100)
- 背景图片叠加## 项目结构
- config.yaml:全局配置文件
- templates/:模板目录
- fonts/:字体资源
- main.py:主程序
- template_loader.py:模板加载器## 配置说明 (config.yaml)
- defaults:输出图片宽度和高度、字体目录、默认字体
- quality_settings:输出图片质量
- template_settings:默认模板## 模板开发指南
- 创建 `templates/your_template.yaml`
- 定义模板名称、布局、背景等## 高级用法
- 使用自定义模板
- 指定字体文件
- 批量生成模式## 常见问题
- Q1: 字体加载失败
- Q2: 模板格式错误## 许可证
MIT License - 自由修改和分发,建议保留原始作者信息

三、测试结果

  • 我马上进行了测试,默认的模板图片就是一张白色的图片,结果发现生成的图片文字没显示出来。
    在这里插入图片描述
  • 后来我替换了一个电脑本地的黑色字体,测试就成功了,默认模板是一张白色的图片。我想着后面只要在yaml文件里调整一下字体的坐标、布局,再用AI生成图片的工具做几个图片模板,应该就能正常使用了。
    在这里插入图片描述

四、最后再看下调用的TOKEN数量

当然这个token数量不只是这个小实验产生的,姑且粗略计算一下
在这里插入图片描述
然后我把这张图和官方的价格表格的图丢给豆包帮我计算了一下,我比较懒,没有人工核对。
2025 年 1 月 25 日使用 deepseek - reasoner 的费用约为 0.89 元。

从第一张图可知,deepseek - reasoner 在 2025 年 1 月 25 日的 API 请求情况为:
输入(命中缓存):351744 tokens
输入(未命中缓存):65450 tokens
输出:17115 tokens
从第二张图可知,deepseek - reasoner 的价格为:
百万 tokens 输入价格(缓存命中):1 元
百万 tokens 输入价格(缓存未命中):4 元
百万 tokens 输出价格:16 元
计算输入费用
计算输入(命中缓存)费用:
(元)
计算输入(未命中缓存)费用:
(元)
计算输出费用
(元)
计算总费用
将输入(命中缓存)、输入(未命中缓存)和输出费用相加可得:
(元)
综上,2025 年 1 月 25 日使用 deepseek - reasoner 的费用约为 0.89 元。

五、实验感受

这次实验,工具调用的速度有点慢,不过对于我这样的小白来说,只提了一句话需求,就能做到这个程度,已经挺不错的了。价格也不算贵,要是一开始需求能更明确些,后续再不断完善,相信能做出更实用的小红书封面生成工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/69129.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言初阶牛客网刷题—— JZ11 旋转数组的最小数字【难度:简单】

1. 题目描述 牛客网在线OJ链接 有一个长度为 n 的非降序数组,比如 [1,2,3,4,5] ,将它进行旋转,即把一个数组最开始的若干个元素搬到数组的末尾,变成一个旋转数组,比如变成了 [3,4,5,1,2] ,或者 [4,5,1,2,3…

Coze,Dify,FastGPT,对比

在当今 AI 技术迅速发展的背景下,AI Agent 智能体成为了关键领域,Coze、Dify 和 FastGPT 作为其中的佼佼者,各有千秋。 平台介绍 - FastGPT:由环界云计算公司发起,是基于大语言模型(LLM)的开源…

如何解压7z文件?8种方法(Win/Mac/手机/网页端)

7z 文件是一种高效的压缩文件格式,由 7 - Zip 软件开发者所采用。它运用独特的压缩算法,能显著缩小文件体积,便于存储与传输各类数据,像软件安装包、大型资料集等。但要使用其中内容,就必须解压,因为处于压…

【Docker】ubuntu中 Docker的使用

之前记录了 docker的安装 【环境配置】ubuntu中 Docker的安装; 本篇博客记录Dockerfile的示例,docker 的使用,包括镜像的构建、容器的启动、docker compose的使用等。   当安装好后,可查看docker的基本信息 docker info ## 查…

豆包MarsCode 蛇年编程大作战 | 高效开发“蛇年运势预测系统”

🌟 嗨,我是LucianaiB! 🌍 总有人间一两风,填我十万八千梦。 🚀 路漫漫其修远兮,吾将上下而求索。 豆包MarsCode 蛇年编程大作战 | 🐍 蛇年运势预测 在线体验地址:蛇年…

【转帖】eclipse-24-09版本后,怎么还原原来版本的搜索功能

【1】原贴地址:eclipse - 怎么还原原来版本的搜索功能_eclipse打开类型搜索类功能失效-CSDN博客 https://blog.csdn.net/sinat_32238399/article/details/145113105 【2】原文如下: 更新eclipse-24-09版本后之后,新的搜索功能(CT…

求平均年龄(信息学奥赛一本通-1059)

【题目描述】 班上有学生若干名,给出每名学生的年龄(整数),求班上所有学生的平均年龄,保留到小数点后两位。 【输入】 第一行有一个整数n(1≤n≤100),表示学生的人数。其后n行每行有…

macos的图标过大,这是因为有自己的设计规范

苹果官方链接:App 图标 | Apple Developer Documentation 这个在官方文档里有说明,并且提供了sketch 和 ps 的模板。 figma还提供了模板: Figma

C++ —— 智能指针 unique_ptr (上)

C —— 智能指针 unique_ptr (上) 普通指针的不足普通指针的释放智能指针智能指针 unique_ptr智能指针初始化错误用法get()方法返回裸指针智能指针不支持指针的运算(、-、、- -) 普通指针的不足 new和new [] 的内存需要用delete和…

C++异步future

🌎 C11异步futrue 文章目录: C11异步futrue future介绍     应用场景     future操作       std::async函数模版       std::packaged_task类模版       std::promise类模版 🚀future介绍 std::future是C11标准库…

# AI绘图中的Embedding、CLIP、Flux中的Clip与LCM SDXL加速生成解析

AI绘图中的Embedding、CLIP、Flux中的Clip与LCM SDXL加速生成解析 在现代AI绘图和深度学习中,涉及了多个复杂的概念和技术,这些技术在图像生成、训练加速以及多模态学习等方面起着至关重要的作用。在这篇博客中,我们将讨论几个关键概念&…

linux下jsoncpp编译

折腾了一顿,我使用ubuntu16.04编译的jsoncpp,由于使用的芯片工程需要16.04,无法使用最新的ubuntu系统。 发现jsoncpp编译时, CMake Error: Could not find CMAKE_ROOT !!! CMake has most likely not been installed correctly. …

洛谷 P2846 [USACO08NOV] Light Switching G C语言

题目描述 Farmer John tries to keep the cows sharp by letting them play with intellectual toys. One of the larger toys is the lights in the barn. Each of the N(2≤N≤105) cow stalls conveniently numbered 1…N has a colorful light above it. At the beginnin…

批量创建ES索引

7.x from elasticsearch import Elasticsearch# 配置 Elasticsearch 连接 # 替换为你的 Elasticsearch 地址、端口、用户名和密码 es Elasticsearch([http://10.10.x.x:43885],basic_auth(admin, XN272G9THEAPYD5N5QORX3PB1TSQELLB) )# # 测试连接 # try: # # 尝试获取集…

大厂案例——腾讯蓝鲸DevOps类应用的设计与实践

蓝鲸体系架构图 蓝鲸CICD应用功能架构 降低DEVOPS门槛—开发者中心 CICD应用需要的后台服务 系列阅读 12306亿级流量架构分析(史上最全)实现电商平台从业务到架构的治理体系基于主数据驱动的数据治理什么时候需要分表分库?-CSDN博客

React和Vue有什么区别,如何选择?

React和Vue有什么区别,如何选择? React 和 Vue 是当前最受欢迎的前端框架之一,两者在开发者中都有极高的声誉。它们都旨在帮助开发人员构建用户界面,但在实现方式和适用场景上有所不同。如果你正考虑在项目中选择 React 或 Vue&a…

Unity环境搭建

在Unity中开发环境搭建的步骤如下: 1. 安装Unity 访问 Unity官网,并下载并安装Unity Hub。Unity Hub是一个用于管理Unity安装版本、项目和组件的工具。安装Unity Hub后,打开Unity Hub,登录您的Unity账号或创建一个新账号。在Uni…

ray.rllib 入门实践-5: 训练算法

前面的博客介绍了ray.rllib中算法的配置和构建,也包含了算法训练的代码。 但是rllib中实现算法训练的方式不止一种,本博客对此进行介绍。很多教程使用 PPOTrainer 进行训练,但是 PPOTrainer 在最近的 ray 版本中已经取消了。 方式1&#xff1…

uart、iic、spi通信总线

一、uart uart一种异步串行通信协议,用于在两个设备之间传输数据。它将数据按位发送,不需要时钟信号进行同步。在uart通信中,数据通过两根线路传输:发送线(TX)和接收线(RX)。它主要用…

LMI Gocator GO_SDK VS2019引用配置

LMI SDK在VS2019中的引用是真的坑爹,总结一下经验,希望后来的人能少走弯路.大致内容如下: (1) 环境变量 (2)C/C 附加包含目录 E:\GWQ\Gocator\GO_SDK\Gocator\GoSdk E:\GWQ\Gocator\GO_SDK\Platform\kApi (3&#…