大模型资讯
- Databricks推出开源大型语言模型DBRX,与Llama 2、Mixtral和GPT-3.5竞争
- 摘要: Databricks近日推出了一款开源的大型语言模型DBRX,旨在与现有的Llama 2、Mixtral和GPT-3.5展开竞争。DBRX模型将使企业能够掌控自己的生成式AI工具开发,为商业应用提供更多控制权和灵活性。
- Databricks发布开源大型语言模型DBRX,性能超越现有模型
- 摘要: Databricks公司今日推出了其大型通用语言模型DBRX,并宣称其性能超越所有现有的开源模型。DBRX的开源策略意味着更广泛的开发者社区将能够访问并改进这一先进的语言处理工具。
- Databricks推出世界上最强大的开源AI语言模型DBRX
- 摘要: Databricks公司最近发布了DBRX,这是迄今为止最强大的开源大型语言模型。它的性能超越了Meta的Llama 2模型,标志着在人工智能领域的一大步。DBRX的开放性可能会促进更广泛的技术创新和应用,推动整个行业的发展。
- Databricks推出开源大型语言模型DBRX
- 摘要: 数据和人工智能公司Databricks近日推出了一款名为DBRX的通用大型语言模型(LLM)。该模型是开源的,Databricks声称其具备强大的功能。DBRX模型旨在提高数据处理和AI应用的效率,进一步推动AI技术的发展和应用。
- 罗格斯大学研究者提出AIOS:将大型语言模型嵌入操作系统
- 摘要: 罗格斯大学的研究者们提出了一种名为AIOS的新型操作系统。该系统的核心创新是将大型语言模型(LLM)嵌入到操作系统中,使其成为操作系统的“大脑”。这一突破性的设计旨在提升操作系统的智能化水平,使其能更好地理解和执行用户的指令。
- 大型语言模型使用简单机制检索知识
- 摘要: 据2024年3月27日波士顿消息,大型语言模型——例如驱动ChatGPT等流行AI聊天机器人的技术——被发现使用一种出人意料的简单机制来检索它们存储的知识。这一发现可能对人工智能领域的发展产生重要影响。
- MIT研究人员利用大型语言模型为机器人赋予常识
- 摘要: 麻省理工学院的工程师们开发了一个新框架,该框架采用大型语言模型,以帮助机器人获得常识性知识。这一进展意味着机器人在处理日常任务时能够更加类似人类地理解和反应,从而提高其自主性和效率。
- Databricks发布新AI模型,性能超越Llama 2、Grok和Mixtral
- 摘要: 据Wired报道,数据科学公司Databricks开发的新开源大型语言模型DBRX,在性能上超过了xAI、Meta和Mistral。DBRX的优越性能表明Databricks在人工智能领域取得了重大突破,对未来AI技术的发展趋势可能产生重要影响。
- 首次模型窃取攻击揭示黑盒生产语言模型的秘密
- 摘要: 近期,一项针对大型语言模型如GPT-4、Claude 2和Gemini的模型窃取攻击成功揭示了这些被视为黑盒的模型的内部工作机制。这一发现表明,尽管这些模型在处理语言任务方面表现出色,但它们的保密性可能并不如预期的那样强大。
- Databricks推出助力企业构建模型的AI新语言模型
- 摘要: Databricks是一家估值达430亿美元的AI数据分析公司,周三推出了一款新的语言模型。该模型旨在帮助企业用户更容易地构建自己的AI模型,以此提升他们在数据分析和人工智能领域的能力。
大模型产品
- Hoory AI:智能客服助手
- 摘要: Hoory AI是一个以对话AI为驱动的客户支持自动化平台,旨在帮助企业优化他们的客户支持流程,提高效率。
- Alice:AI动作执行助手
- 摘要: Alice是一款原生应用,与OpenAI、Perplexity、Claude等模型无缝对接。它不仅提供答案,还能通过快捷键和内置提示直接在你的应用中执行操作,旨在提高用户的工作效率。
- Talkie AI:与梦中角色亲密互动
- 摘要: Talkie AI创造独特体验,让你与梦想中的角色随时深入交流。24/7随叫随到,更有珍藏卡片记录美好时光,让你的虚拟伙伴栩栩如生。
- JobTrackerAI:免费职位申请追踪
- 摘要: JobTrackerAI帮助用户自动追踪工作申请进度,包括面试、录用和拒绝等。它通过Gmail安全记录信息,且已获得Google的隐私与安全认证,所有用户均可免费使用。
- RAFA:口袋里的AI投资专家团队
- 摘要: RAFA利用AI代理提供个性化投资见解,帮助你像专家一样投资。集合基本面分析、技术分析、动量和宏观分析等多领域专家智慧,全天候优化你的投资组合。
- Weavely:首款Figma AI表单构建器
- 摘要: Weavely是首款集成于Figma的AI表单构建器,允许用户无需编码即可设计并发布具有定制化用户体验和界面的网页表单。支持条件逻辑,可重用品牌资产,提高回应率。
- GoatStack.AI:科研论文洞察摘要
- 摘要: GoatStack.AI是一款自主AI助手,专为简化AI/ML最新研究资讯而设计。它能够总结最新论文,并通过每日定制新闻简报,根据您的AI兴趣点提供个性化洞察。
- Delfiny AI:智能营销视频助手
- 摘要: Delfiny AI提供AI驱动的数字营销助手,通过视频通话提供个性化会议服务。它能够提供数字广告的建议与洞察,进行竞争对手分析,帮助优化你的广告并获得竞争优势。
- Ribbon:智能加速求职助手
- 摘要: Ribbon,你的人工智能职业教练。与Ribbon对话,获取个性化职业建议,免费打造出色的求职申请。建立独特的个人档案,定制简历,提升面试技巧,以智慧的方式获得理想工作。让Ribbon助力你的求职之旅。
- voam:语音快速撰写CRM文档
- 摘要: voam应用通过接收简短的语音备忘,利用AI技术快速生成高质量的CRM文档,并直接发送至您的CRM系统。这款工具能大幅提高文档更新效率,特别适合会后和通话后的记录整理。使用voam,您只需控制大局,AI帮您完成繁琐工作。
大模型论文
- Mini-Gemini:提升多模态视觉语言模型
- 摘要: 本文提出了Mini-Gemini框架,通过三个方面提升多模态视觉语言模型(VLMs)的性能:高分辨率视觉令牌、高质量数据集和VLM引导的生成,有效拓宽了VLMs的应用范围,并在多个零样本基准测试中取得领先表现。
- 长篇事实性评估模型研究
- 摘要: 研究提出一种评估大型语言模型长篇事实性的方法——SAFE。通过分析响应内容的单个事实,并利用搜索查询验证其准确性,该方法显著降低了成本,同时保持了较高的准确率。
- 3P-LLM: 基于大型语言模型的概率路径规划
- 摘要: 本研究探讨了使用大型语言模型(GPT-3.5-turbo)进行自动机器人导航路径规划的可行性。通过模拟实验,比较了GPT-3.5-turbo与现有先进路径规划算法如RRT和A*的性能,发现GPT-3.5-turbo在实时路径规划反馈方面表现优异。
- CheckEval:大型语言模型评估框架
- 摘要: CheckEval是一种新型的大型语言模型评估框架,通过详细的子评估标准和布尔型检查清单,提高了评估的可解释性、稳健性和可靠性。经SummEval基准测试验证,与人类评判高度相关且具有一致的评注一致性。
- MLDT:复杂长时任务规划
- 摘要: 本文提出了一种名为MLDT的多级分解方法,用于解决复杂长时程机器人任务规划问题。该方法通过目标、任务和行动的多级分解,结合目标敏感的语料生成和指令调优,显著提升了开源大型语言模型在复杂长时任务规划中的性能。
- 理解基于人类反馈的学习动态
- 摘要: 本研究初步理论分析了人类偏好对齐的学习动态。论文展示了偏好数据集分布如何影响模型更新速度,并为训练准确性提供了严格保证。同时揭示了优化过程倾向于优先考虑可区分性更高的行为。研究结果通过实证验证,为未来对齐方法提供了理论洞察。
- 物理实验助手机器人研究
- 摘要: 本文提出了一个基于YOLOv8和大型语言模型(LLM)的多模态交互式机器人(PhysicsAssistant),用于辅助学生物理实验室学习。通过与人类专家的比较,验证了其在教育支持上的有效性。
- 减少大型视觉语言模型的幻觉问题
- 摘要: 本文提出了一种新颖的指令对比解码(ICD)方法,旨在减少大型视觉语言模型(LVLMs)在推理过程中产生的幻觉。通过对比标准和干扰指令分布,ICD有效降低了对象级和属性级的幻觉,并提升了模型的感知和识别能力。
- 密集检索模型的规模化律研究
- 摘要: 本研究探讨了密集检索模型的性能是否遵循规模化律。通过对不同参数数量的模型进行实验,发现模型性能与模型大小和注释数量有明确的幂律关系,并考察了数据增强方法和资源分配策略。
- 非线性ITI优化策略研究
- 摘要: 本研究提出非线性ITI(NL-ITI)框架,通过优化探针和多标记干预,显著提升大型语言模型在多项选择基准测试中的真实性信息处理能力,减少误信息输出。
大模型开源项目
- Amazon Bedrock基础模型服务教程
- 摘要: 此项目为Amazon Bedrock基础模型服务的工作坊,使用Jupyter Notebook语言编写,旨在指导用户深入了解并有效使用该服务。
- HumanAIGC:角色动画图像视频合成
- 摘要: HumanAIGC项目能够实现一致性和可控制的角色动画图像到视频的合成。该项目利用AI技术,让静态图像动起来,为用户提供了一种全新的动画制作方式。
- OpenDevin:低代码高效能AI项目
- 摘要: OpenDevin项目致力于简化代码工作量,通过Jupyter Notebook实现高效AI开发。它鼓励开发者用更少的代码创造更多价值。
- harry0703:AI一键生成短视频
- 摘要: harry0703项目通过大型AI模型,实现了一键生成短视频的功能。该项目使用Python编写,简化了视频创作流程,为用户提供了便捷的视频生成工具。
- 复旦3D人像动画生成AI
- 摘要: 该项目名为fudan-generative-vision,是一个使用3D参数引导来实现可控制且一致性的人像动画生成的Python语言编写的AI工具。
- CrewAI: 角色扮演AI代理框架
- 摘要: CrewAI是由joaomdmoura开发的一个用Python编写的框架。它旨在协调角色扮演的自主AI代理,通过共同智能使代理能够无缝合作,解决复杂任务。
- Devika:智能AI软件工程师
- 摘要: stitionai项目推出Devika,一款能理解人类指令、自主研究和编写代码的Agentic AI软件工程师。此项目旨在打造一个与Cognition AI的Devin相竞争的开源替代品,使用Python语言编写。
- AI研究更新与面试资源库
- 摘要: aishwaryanr项目是一个综合性的仓库,提供最新的生成式AI研究动态、面试资料、笔记等。该项目不限定编程语言。
- lencx:用AI赋能世界
- 摘要: lencx项目,以JavaScript编写,致力于通过AI技术探索无限可能,扩展现有边界,并赋予用户更大的力量。
- IDEA研究:T-Rex2文视觉提示
- 摘要: IDEA-Research项目推出了T-Rex2,旨在通过文本和视觉提示的协同作用,实现对通用对象的检测。该项目使用Python语言编写。