大模型日报
2024-06-26
大模型资讯
大模型产品
- Pygma:Instagram的AI助手
- 摘要: Pygma通过分析您的Instagram数据,提供7天的内容创意,并为您创建个性化内容,直接建议在界面中安排发布。
- revid.ai:一站式短视频创作工具
- 摘要: 无需技能,输入链接或想法,AI自动生成TikTok、Instagram和YouTube短视频,强大编辑器助你轻松调整。
- Devv.AI:开发者专属AI搜索
- 摘要: Devv.AI结合LLMs与实时数据,提升开发者效率。支持GitHub仓库连接,实现无缝、上下文化搜索。
- Claude 3.5 Sonnet:前沿智能,速度翻倍
- 摘要: Anthropic发布Claude 3.5 Sonnet,性能超越竞争对手,速度是Claude 3 Opus的两倍,成本仅为五分之一。
- Zebracat:AI文本转视频神器
- 摘要: Zebracat是一款为营销人员和企业家设计的文本转视频平台,几分钟内将文本转化为具有冲击力的视频,配有人声AI配音、音乐和效果。
- Insights Hub:集中用户反馈,提取洞察
- 摘要: Insights Hub集中所有来源的用户反馈,利用AI进行分类和分析,提取有价值的用户洞察,并可进行后续调查。
- Latenode:低代码集成平台
- 摘要: Latenode提供低代码平台,支持自动化和后端系统构建。可用无代码应用或JavaScript AI快速创建集成,价格极具竞争力。
- Relay.app:AI自动化新选择
- 摘要: Relay.app是最易用的Zapier替代品,新增3种AI集成方式,结合人工审核步骤,确保控制与信心。
- Jobright.ai:AI求职助手
- 摘要: 使用Jobright.ai,让求职变得轻松高效。AI匹配职位,定制简历,社交推荐,1分钟内搞定,轻松获得更多面试机会。
- Bright: 健康超级应用
- 摘要: Bright整合身体重组、恢复评分、日记、餐食记录、能量跟踪、睡眠监测和营养分析于一体。
大模型论文
- EAGLE-2: 动态草稿树加速语言模型推理
- 摘要: EAGLE-2引入上下文感知的动态草稿树,提升语言模型推理速度,速度比EAGLE-1快20%-40%,且生成文本分布不变。
- 长上下文迁移提升视觉模型理解长视频能力
- 摘要: 本文提出通过扩展语言模型的上下文长度来增强多模态模型对长视频的理解能力,并开发了V-NIAH基准测试验证效果。
- 大型语言模型推理算法研究综述
- 摘要: 本文综述了大型语言模型在推理阶段的算法,包括逐字生成、元生成和高效生成三类方法,并统一了不同研究领域的视角。
- USDC: 长对话中用户立场与教条主义数据集
- 摘要: USDC数据集利用MistralLarge和GPT-4自动标注用户立场和教条主义,涵盖764个Reddit对话,助力小型语言模型微调。
- Ragnarök:TREC 2024 RAG系统评估框架
- 摘要: 提出Ragnarök框架和TREC 2024 RAG Track,用于评估和创新RAG系统。介绍MS MARCO V2.1数据集、开发主题和标准化I/O定义。
- GPT-4V在矿区自动驾驶中的应用探索
- 摘要: 本文探讨了GPT-4V在矿区自动驾驶中的应用,评估其场景理解、推理及驾驶功能,尽管面临识别车辆类型和动态交互的挑战,但展示了其有效导航和决策能力。
- RES-Q:评估代码编辑大模型系统
- 摘要: RES-Q提供100个GitHub提交任务,评估LLM系统在代码库编辑中的表现,发现Claude Sonnet 3.5优于GPT-4o。
- 彩票票据适应:缓解LLMs中的破坏性干扰
- 摘要: 提出彩票票据适应(LoTA),通过识别和优化稀疏子网络,避免任务间干扰和遗忘,提升多任务性能。
- M2Lingual:多语言多轮次指令微调数据集
- 摘要: M2Lingual是一个全合成的多语言多轮次指令微调数据集,涵盖70种语言和17种NLP任务,显著提升LLM性能。
- 输入顺序与强调对阅读理解的影响
- 摘要: 研究发现,先呈现上下文再提问能提高模型性能,强调上下文效果最佳,简单方法提升准确率达36%。
大模型开源项目
- 智能子代理编排框架Doriandarko
- 摘要: Doriandarko是一个用Python编写的框架,用于智能编排Claude Opus的子代理,提高任务处理效率。
- Modelscope: 体验扩散模型的魔力
- 摘要: Modelscope项目用Python编写,旨在让用户享受扩散模型的神奇效果。