用大模型搭建一个自己的新闻小助手

背景

信息快速增长的时代,及时获取到有价值的资讯是一件很必要的事情。已经有各类新闻app和获取信息的渠道了,为什么还需要在构建一个小助手来获取新闻资讯呢?其实原因很简单各类新闻app服务的是具体一类人群,个人和人群还是有偏差的。如果可以根据自己的需要简单的定制自己的新闻出版获取器不是一件很有意思的事吗。那么这个简单有简单到什么程度呢?为什么这么问呢,因为简单必然是要付出精度代价的。但是大模型的出现很多复杂的是变得更简单了,原因就是模型把做事流程做了抽象挖掘到更多更本质的或者更上层元策略。所以理论讲你可以既简单但又获得更多有价值的信息。
一下假设我们希望我们的新闻小助手具备几种能力(能力可分层,这一阶段有可能部分能力达不到要求)。
1.新闻获取能力:可以根据用户需要搜索到新闻,并对新闻资讯做简单整理
2.新闻摘要、解读、分类
3.可以得到的这么多类新闻做汇总可视化(比如用xmind方式成纲领)
4.可以把内容读取出来:新闻摘要、用户喜欢的新闻成篇读出
5.可以对新闻做深度解析,基于原文+关键词检索对信息作更全面的分析结构化解读(这一步到后面文章介绍)
这篇文章选择用字节开放的“扣子”编排工具来实现,DIfy、autoagent、chatglm、langflow理论上讲都可以实现。但是扣子目前提供的工具插件、以及工作流我觉得是比较容易上手的。并且很多插件是免费使用、把各种API使用需要的权限申请和配置问题解决了。所以这次实践选择用“扣子”来实现。

实现

1.创建Bot

进入扣子页面,点击“创建Bot”,给应用起好名字、做好描述,点击下一步就可以
image.png

2.Bot工作流构建

A.设定好人设与逻辑编排,这部主要是安排好助手指责、做事流程(比如我这边就是给了他两个角色:“提供新闻”、“新闻可视化”),具体要求可以参考下面图(或者可以大概让ai优化格式化指令)
b.设定流程调度的大模型,目前扣子只提供了三个选项:豆包、千问-max、minmax6.5但是长度是限制咋4k(感觉是不够用的,选择的模型效果不算事最好的),这边我是选择了Minmax6.5s 4k,豆包感觉对流程指令遵循能力不算好,千问-max给的指令长度不太够(其实千问系列有更长指令的)
c.构建两个分支工作流:新闻检索、新闻可视化

image.png

3.新闻检索工作流

image.png
这部分包括4道工序:
1.获取当前时间,根据用户需要查资讯时间推导出资讯查询周期
2.对用户的查询query分析生成适合新闻检索的query
3.用插件:“头条新闻”、“搜狐新闻”来实现新闻检索(这边你也可以用bing、百度搜索、谷歌duckduckgo、秘塔…其他插件实现,我选择的两个插件不一定是最好的)
4.对检索到的新闻用大模型做简单加工格式化,抽标题、url、摘要、解读(浅)
根据用户输入生成检索query的prompt设置:

任务:生成包含用户输入的时间和问题的检索词。1. 解析输入的时间格式(YYYY-MM-DD HH:MM:SS),例如 "2024-05-28 06:57:21"2. 根据输入时间推算出目标时间段,例如推算出一周内的时间段为 "2024-05-21至2024-05-28"3. 组合用户的query和推算出的时间段生成检索词。示例:
输入时间:"2024-05-28 06:57:21"
用户输入的query:"最新的科技新闻"任务步骤:
1. 解析输入时间→"2024-05-28 06:57:21"
2. 推算1周时间段→"2024-05-21至2024-05-28"
3. 生成检索词→"2024-05-21至2024-05-28 最新的科技新闻"请根据以上步骤生成检索提示词:
检索词:"[推算出的时间段] 用户输入的query"
用户输入:当前日期是{{current}},用户输入的时间{{day}};用户输入的query是{{query}}
只输出[推算出的时间段] 用户输入的query

新闻简单加工和格式化prompt设置:

请从下面的用户输入中提取并格式化每条新闻的名称、url,并判断新闻属于什么类。要求如下:
1. 将每条新闻单独列出,名称、url和类别分别输出。
2. 新闻名称:直接摘录内容,不需要做任何改动。
3. url:从提供的链接中提取,不需要修改。
4. 类别判断:根据新闻简介内容,判断其主要涉及的关键词。例如,如果新闻涉及健康、医学研究,判断其为“健康”。如果涉及宇宙、天文,判断其为“天文”。
5.输出的新闻标题,基于summary提取,不要用输入的"title"
6.并对每条新闻作出解读
7. 根据输入格式化并分类新闻条目,最终结果以 JSON 格式输出。
示例输入:

sitename : williamzhang51
summary : 1. 脑损伤揭示慷慨路径:一项研究表明,腹内侧前额叶皮层(vmPFC)在我们的帮助他人的意愿中起着关键作用。2. 微塑料入侵:新墨西哥大学的研究人员在人体和犬类的睾丸组织中发现了微塑料,提出了对生殖健康的担忧。3. 哈勃探索宇宙奇观:哈勃望远镜探索了处于处女座星系团的棒状螺旋星系NGC 4731,展示了其详细的颜色和结构。4. 新型冠状病毒可能引发下一次大流行:5. NASA的欧罗巴探测器准备发射:6. 纳米级3D映射揭示大脑结构革命性见解:7. 量子计算进展:8. 绿色科技:9. 平台工程:
title : 2024年5月28日科技新闻 1
url : http://m.toutiao.com/group/7373817664730300978/

示例输出:

[
{
“title”: “脑损伤揭示慷慨路径”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “健康”,
“新闻解读”:“脑损伤揭示慷慨路径: 一项研究表明,腹内侧前额叶皮层(vmPFC)在我们的帮助他人的意愿中起着关键作用。”
},
{
“title”: “微塑料入侵”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “健康”,
“新闻解读”:微塑料入侵: 新墨西哥大学的研究人员在人体和犬类的睾丸组织中发现了微塑料,提出了对生殖健康的担忧。"
},
{
“title”: “哈勃探索宇宙奇观”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “天文”,
“新闻解读”:“哈勃探索宇宙奇观: 哈勃望远镜探索了处于处女座星系团的棒状螺旋星系NGC 4731,展示了其详细的颜色和结构。”
},
{
“title”: “新型冠状病毒可能引发下一次大流行”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “健康”,
“新闻解读”:“新型冠状病毒可能引发下一次大流行”
},
{
“title”: “NASA的欧罗巴探测器准备发射”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “天文”,
“新闻解读”:“NASA的欧罗巴探测器准备发射”
},
{
“title”: “纳米级3D映射揭示大脑结构革命性见解”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “科学技术”,
“新闻解读”:“纳米级3D映射揭示大脑结构革命性见解”
},
{
“title”: “量子计算进展”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “科学技术”,
“新闻解读”:“量子计算进展”
},
{
“title”: “绿色科技”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “环境”,
“新闻解读”:“绿色科技”
},
{
“title”: “平台工程”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “技术”,
“新闻解读”:“平台工程”
}
]

用户输入{{input1}}、{{input2[0]}}

4.新闻可视化工作流image.png

包括两道工序:
a.把检索回来已经简单加工的新闻资讯做进一步的加工,适配treemind呈现格式
b.把大模型进一步加工好的数据输入给插件“TreeMind”来做可视化
大模型加工这边选择是Minmax6.5s(256k),指令如下:

Generate a mind map in xmind format from the following data. The mind map should be organized with top-level nodes as categories and under each category, include the articles as sub-nodes with their titles and URLs:Data:
[{"category":"健康","title":"脑损伤揭示慷慨路径","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"健康","title":"微塑料入侵","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"天文","title":"哈勃探索宇宙奇观","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"健康","title":"新型冠状病毒可能引发下一次大流行","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"天文","title":"NASA的欧罗巴探测器准备发射","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"科学技术","title":"纳米级3D映射揭示大脑结构革命性见解","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"科学技术","title":"量子计算进展","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"环境","title":"绿色科技","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"技术","title":"平台工程","url":"http://m.toutiao.com/group/7373817664730300978/"}
]The mind map should look like this:- 健康
- Title: 脑损伤揭示慷慨路径
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: 微塑料入侵
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: 新型冠状病毒可能引发下一次大流行
URL: http://m.toutiao.com/group/7373817664730300978/
- 天文
- Title: 哈勃探索宇宙奇观
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: NASA的欧罗巴探测器准备发射
URL: http://m.toutiao.com/group/7373817664730300978/
- 科学技术
- Title: 纳米级3D映射揭示大脑结构革命性见解
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: 量子计算进展
URL: http://m.toutiao.com/group/7373817664730300978/
- 环境
- Title: 绿色科技
URL: http://m.toutiao.com/group/7373817664730300978/
- 技术
- Title: 平台工程
URL: http://m.toutiao.com/group/7373817664730300978/用户输入:{{input}}

TreeMind对信息可视化结果如下:
image.png
或者如下:
image.png
最终模型执行结果如下,可以让机器给你读新闻,可以实现xmind可视化、可以设定每天定时给你推送加工好的新闻。后面如果要做深度解读可以再加一条链路。
image.png
根据你自己需要按上面格式输入你想看的周期类别的新闻。
image.png
可以点选朗读,让机器给你读新闻,如果你不想自己点也可以设定自动读。输入“新闻可视化”实现新闻的xmind格式呈现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/17815.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kafka-消费者组-发布订阅测试

文章目录 1、发布订阅测试1.1、创建消费者4并指定组 my_group21.2、列出所有的消费者组1.3、查看 my_group2 组的详细信息1.4、发送第六条消息accomplish1.4.1、查看 my_group1 组的详细信息1.4.2、查看 my_group2 组的详细信息 1、发布订阅测试 接着上一篇点对点博客测试 kafk…

LabVIEW控制Trio控制器

将LabVIEW与Trio控制器结合,可以实现对复杂运动系统的控制和监测。以下是详细的方法和注意事项: 一、准备工作 软件安装: 安装LabVIEW开发环境,确保版本兼容性。 安装Trio控制器的相关驱动程序和软件,如Trio Motion …

出现 Transaction rolled back because it has been marked as rollback-only 解决方法

目录 1. 问题所示2. 原理分析3. 解决方法1. 问题所示 用户反馈的Bug如下所示: Transaction rolled back because it has been marked as rollback-only截图如下: 浏览器终端同样显示: 2. 原理分析 错误表明,在事务的生命周期内,遇到了某个异常或条件,导致该事务被标记…

Shell编程中的循环语句和函数

一、for循环语句 当面对各种列表重复任务时,使用简单的if语句已经难以满足需求,这时就需要for循环语句。for语句的结构为: for 变量 in 取值列表 do 命令序列 done 使用for循环语句时,需要指定一个变量及取值列表,针对…

2、python环境的安装-mac系统下

打开官网,downloads下边有macOS,点击: 选择最新版本,点击,进入下边的页面,一直往下滑,看到files中有个macOS的版本,点击下载 点击下载后是pkg的安装包,点击安装。 一步步…

鸿蒙OS开发:【一次开发,多端部署】(app市场首页)项目

一多应用市场首页 介绍 本示例展示了应用市场首页,页面中包括Tab栏、运营横幅、精品应用、精品游戏等。 本示例使用一次开发多端部署中介绍的自适应布局能力和响应式布局能力进行多设备(或多窗口尺寸)适配,保证应用在不同设备或…

蓝桥杯第1022题 玩具蛇 基础DFS C++ Java

题目 思路和解题方法 问题理解:此题要求找出将一条由16节正方形构成的玩具蛇放入4x4的方格中的不同方式数。每节蛇可以是直线或直角转弯,且蛇的形状需要完全覆盖盒子里的16个格子,每个格子仅被蛇的一个部分占据。 状态表示:使用一…

爷爷看了都会,打工人必备的摸鱼AI神器!免费!

去年,AI技术无疑成为了最为引人注目的焦点,层出不穷的创新应用令人目不暇接。尽管许多人对这股AI热潮的持久性持怀疑态度,但现实却用事实给予了最有力的反驳。AI所展现出的强大生产力,足以令人刮目相看。 而今年以来,…

springboot链接kafka异步发送消息

<dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka</artifactId></dependency> spring:kafka:bootstrap-servers:- ip:端口producer:retries: 0acks: 1batch-size: 16384properties:linger:ms: 100buff…

centos 记录用户登陆ip和执行命令

centos 记录用户登陆ip和执行命令 在/etc/profile 文件末尾添加如下代码&#xff1a; #!/bin/bash USER_IPwho -u am i 2>/dev/null | awk {print $NF} | sed -e s/[()]//g HISTDIR/usr/share/.history if [ -z "$USER_IP" ]; then USER_IPhostname fi…

VUE3学习第一篇:启动ruoyi

1、找到ruoyi的vue3版本 然后下载代码到本地&#xff0c; 我刚开始用的nodejs14报错&#xff0c; 后面换成nodejs16&#xff0c;启动前端成功了。 页面如下图所示

go panic

panic 能够改变程序的控制流&#xff0c;调用 panic 后会立刻停止执行当前函数的剩余代码&#xff0c;并在当前 goroutine 中递归执行调用方的 defer。 // A _panic holds information about an active panic. // // A _panic value must only ever live on the stack. // // …

【JPCS出版,EI稳定检索会议推荐】第四届计算机、遥感与航空航天国际学术会议(CRSA 2024)已成功申请JPCS出版,火热征稿中!

【EI核心、Scopus】第四届计算机、遥感与航空航天国际学术会议&#xff08;CRSA 2024&#xff09;将于2024年7月5-7日在日本大阪举行。计算机、遥感与航空航天国际学术会议为来自世界各地的研究学者、工程师、学会会员以及相关领域的专家们提供一个关于“计算机科学”、“遥感技…

体验SmartEDA的高效与便捷,电子设计从未如此简单

SmartEDA&#xff1a;革新电子设计&#xff0c;让高效与便捷触手可及 在快节奏的现代生活中&#xff0c;科技日新月异&#xff0c;各行各业都在寻求更高效、更便捷的解决方案。对于电子设计行业而言&#xff0c;SmartEDA的出现&#xff0c;无疑是一场革命性的变革。它以其高效…

【PG16】后 EL 7 时代,PG 16 如何在 CentOS 7 上运行

↑ 关注“少安事务所”公众号&#xff0c;欢迎⭐收藏&#xff0c;不错过精彩内容~ ★ 本文写于 2023-09-29 PostgreSQL 16 Released 9/14, PostgreSQL 16 正式发布。从发布公告^1 和 Release Notes^2 可以看到 PG16 包含了诸多新特性和增强改进。 性能提升&#xff0c;查询计划…

快速核对两个表格数据

快速核对两个表格数据的方法取决于数据的规模、复杂性以及你使用的工具。以下是一些常见的方法&#xff1a; 使用Excel或其他电子表格软件: VLOOKUP 或 HLOOKUP 函数&#xff1a;这些函数可以在一个表格中查找与另一个表格匹配的值&#xff0c;并返回对应的结果。条件格式&…

Genzai:一款针对物联网安全的多功能实用性工具套件

关于Genzai Genzai是一款针对物联网安全的多功能实用性工具套件&#xff0c;该工具旨在识别与物联网相关的仪表盘&#xff0c;并扫描它们以查找默认密码和安全问题&#xff0c;广大研究人员可以使用该工具来检测和提升物联网设备的安全性。 Genzai支持用户以输入的形式提供一个…

npm install安装时卡死时尝试切换npm镜像地址

当使用npm时&#xff0c;为了提高下载速度和稳定性&#xff0c;特别是针对国内的开发者&#xff0c;经常需要配置国内的镜像源&#xff0c;如淘宝npm镜像。以下是如何添加淘宝源等镜像内容的详细步骤和说明&#xff1a; 1. 淘宝npm镜像地址 淘宝npm镜像的地址在2022年6月30日…

简爱的思维导图怎么做?从这三个角度

简爱的思维导图怎么做&#xff1f;《简爱》作为夏洛蒂勃朗特的代表作&#xff0c;不仅是一部经典的爱情小说&#xff0c;也是探索女性独立与自我成长的文学巨著。为了深入理解这部作品&#xff0c;制作思维导图是一种高效的学习和分析工具。以下是三种不同的角度来创建《简爱》…

探讨开源与闭源大模型在AI领域的发展前景与挑战

一、引言 随着人工智能&#xff08;AI&#xff09;技术的飞速发展&#xff0c;大模型已成为推动AI技术进步的核心动力。在AI大模型的发展过程中&#xff0c;开源与闭源两种不同的发展路径各自展现出了独特的发展前景与挑战。本文将深入探讨这两种路径在AI领域的发展前景&#…