大模型日报
2024-06-24
大模型资讯
大模型产品
- AI快速生成专业播客
- 摘要: MakePodcast.io使用AI语音,只需提供脚本并选择声音,即可在几分钟内生成专业质量的播客。
- Sherloq:SQL用户的AI协作仓库
- 摘要: Sherloq为SQL查询提供一站式管理,通过AI插件协作保存和分享SQL代码,专注数据分析,无需离开IDE。
- Intentional: AI专注工作屏蔽器
- 摘要: Intentional是一款应用,允许你为浏览会话设定目标,并屏蔽与你目标无关的网站,帮助你集中注意力。
- Tap4 AI工具目录:开源AI导航
- 摘要: 在Tap4 AI工具目录中发现超过1000种AI工具和200多个类别,免费访问你最喜欢的AI工具。
- WAIT - AI助力的间歇性断食应用
- 摘要: WAIT是一款AI驱动的间歇性断食应用,帮助你了解饮食习惯、轻松减重并提升整体健康。
- review.legal:轻松理解法律文件
- 摘要: review.legal帮助非律师快速全面理解法律合同,让您自信签署法律文件,告别法律盲区。
- Meeno:提升你的社交健康
- 摘要: Meeno每天提供关系建议,涵盖朋友、家庭、恋爱及职场。由专家指导,AI驱动,助你改善社交关系。
大模型论文
- 模型合并与安全对齐:应对模型失衡
- 摘要: 研究模型合并对对齐的影响,提出通过生成合成数据并在优化过程中使用,以提高合并模型的安全对齐能力。
- 跨模态思维的白板方法
- 摘要: 提出白板思维提示法,通过绘制图像来增强多模态大语言模型的视觉推理能力,显著提升任务准确率。
- 异步大语言模型增强的自动驾驶规划器
- 摘要: 本文提出AsyncDriver框架,通过异步结合LLM和实时规划器,降低计算成本并保持高性能,验证于nuPlan场景。
- GraphReader: 增强大语言模型长文本处理能力
- 摘要: GraphReader通过图结构和自主探索增强大语言模型处理长文本的能力,在多个基准测试中表现优异。
- 大语言模型中的数据泄露与记忆模式
- 摘要: 研究大语言模型中的数据泄露风险,量化记忆现象,揭示训练过程中潜在记忆序列的存在及其隐私挑战。
- 大模型可推理并表达隐性结构
- 摘要: 研究表明,大型语言模型能通过训练数据中的隐性信息推理出被屏蔽的知识,并应用于下游任务,尽管在复杂结构上表现不稳定。
- 揭示数据库漏洞:零知识文本到SQL攻击
- 摘要: 研究通过零知识框架提问,利用文本到SQL模型推断数据库模式,揭示潜在安全隐患。
- Prism: 分离与评估VLM能力的框架
- 摘要: Prism框架通过分离视觉感知和推理过程,评估VLM能力。该框架结合VLM和LLM,实现高效视觉语言任务处理,显著降低成本。
- 大型语言模型在生成表格数据中的局限性
- 摘要: 研究表明,现有的大型语言模型在生成合成表格数据方面存在显著不足。通过使模型感知排列,可以部分克服这些缺陷。
- PostMark:一种鲁棒的黑箱水印技术
- 摘要: PostMark是一种无需访问LLM logits的后处理水印技术,更能抵抗释义攻击,同时保持文本质量。
大模型开源项目
- MindsDB:企业数据AI平台
- 摘要: MindsDB是一个用Python编写的平台,旨在从企业数据构建AI。它简化了AI模型的创建和部署过程。
- 迷你自动微分引擎与神经网络库
- 摘要: karpathy项目提供一个小型标量自动微分引擎,并基于此构建了类似PyTorch的神经网络库,使用Jupyter Notebook编写。
- Claude Opus智能子代理框架
- 摘要: Doriandarko是一个用Python编写的框架,用于智能地编排Claude Opus的子代理。
- Lobe Chat: 多AI支持的开源聊天框架
- 摘要: Lobe Chat 是一个支持多AI提供商和多模态的开源现代设计聊天框架,支持插件系统,一键免费部署私人ChatGPT应用。