大模型日报
2024-04-30
大模型资讯
- 2024年:检索增强生成(RAG)技术的兴起
- 摘要: 2024年4月,Mikhail Mew报道,检索增强生成(RAG)技术近来成为热点。尽管大型语言模型(LLMs)在许多任务上表现出色,但它们无法访问实时知识。RAG技术的出现弥补了这一不足,通过结合检索机制,增强了LLMs的生成能力,使其能够提供更准确和丰富的信息。
- 微软发布Phi-3:掌中强大的语言模型
- 摘要: 微软最新推出的Phi-3 Mini是一款专为移动设备设计的紧凑型语言模型。这款口袋尺寸的语言模型不仅体积小巧,而且功能强大,能够在手机等移动设备上实现前所未有的语言处理能力,为用户提供变革性的移动体验。
- 苹果发布OpenELM:新一代开源大型语言模型
- 摘要: 苹果公司推出了名为OpenELM的新型人工智能模型家族,该系列包含8个开源的大型语言模型(LLMs)。这些模型可以自由修改和再分发,旨在提高模型的可访问性,为开发者和研究者提供更多资源和灵活性。
- PKSHA与微软日本合作开发日英大型语言模型
- 摘要: 东京,2024年4月29日,PKSHA Technology Inc.(东京证券交易所代码:3993)宣布成功开发了首个日英大型语言模型(LLM)。该项目是与微软日本联合进行的,旨在推动语言处理技术的发展,提高机器翻译和自然语言理解的准确性。
- 苹果发布八款OpenELM AI小型语言模型供设备端使用
- 摘要: 苹果近日推出了八款小型的AI语言模型,这些模型旨在用于智能手机等设备上。这些发布的模型被视为概念验证研究,展示了AI技术在移动设备上的应用潜力,有助于促进更广泛的研究和开发工作。
- 苹果发布OpenELM语言模型全套代码及策略
- 摘要: 苹果公司最近公布了其最新的语言模型OpenELM的全部代码、权重、检查点等资料。这一行动显示了苹果在生成性人工智能领域的战略布局。发布这些详细信息可能会对AI研究社区和相关产品开发产生重要影响,促进开源合作,并推动语言模型技术的进步。
- 法国研究人员推出首个公开的法语生物医学大型语言理解基准DrBenchmark
- 摘要: 一组法国研究人员为了评估遮蔽语言模型在法语领域的性能,推出了首个公开的法语生物医学大型语言理解基准,命名为DrBenchmark。该基准旨在促进相关领域的研究与发展,帮助提高法语遮蔽语言模型的准确性和效果。
- 苹果发布开源AI语言模型OpenELM
- 摘要: 苹果公司推出了名为OpenELM的八款开源人工智能大型语言模型(LLMs)。这些模型旨在提高语言处理的效率和效果,强调开源的重要性,以促进技术的共享和创新。
- IN2训练:革新长文本语境的语言理解
- 摘要: 长文本大型语言模型(LLMs)因其扩展的训练窗口能够处理更广泛的语境而受到关注。INformation-INtensive(IN2)训练正在改变这一领域,使语言模型能更好地理解长文本信息,从而在长文本语言理解方面实现重大突破。
- 海湾地区开发的大型语言模型如Jais促进阿拉伯语进入AI主流
- 摘要: 新闻报道指出,海湾地区开发的大型语言模型(LLMs),例如Jais,正在将阿拉伯语带入人工智能的主流。尽管阿拉伯语拥有4亿使用者,但在数字内容中的占比不足1%。LLMs能够模仿人类智能,其在理解和生成阿拉伯语方面的能力对于缩小这一差距至关重要。
大模型产品
- AI常见问题生成器
- 摘要: 该AI常见问题生成器通过分析输入的网站URL,智能生成与之相关的一系列常见问题及答案,提升网站信息完善度。
- Truva:AI代理客户引导与留存
- 摘要: Truva利用AI代理为用户提供实时个性化服务,指导他们使用应用内正确的工具和功能,并代表用户采取行动,以提升客户体验并增强用户留存。
- Wondershare EdrawMax:AI绘图创新
- 摘要: Wondershare EdrawMax通过AI驱动,释放创造力,轻松制作流程图、思维导图等。智能建议提升效率,让你的想法直观展现。
- Brizy AI:秒速生成网站的构建器
- 摘要: Brizy AI网站构建器,以白标方式提供,支持多语言,能通过引导式提示和自动内容生成功能,快速打造出色的网站。
- Notta Showcase:AI视频翻译扩展全球观众
- 摘要: Notta Showcase是一款AI视频翻译工具,能够轻松将视频内容翻译成15种以上语言。自然的配音效果,帮助内容创作者和企业快速、经济地触达全球受众。
- BrickCenter:AI乐高生成器
- 摘要: BrickCenter让创意释放,通过AI乐高生成器,将文字描述转化为定制乐高套装。你还可以用照片轻松打造个性小人偶,或是浏览由乐高爱好者精心打造的独特创作。现在就开始搭建你梦想中的乐高世界吧!
- TinderProfile.ai:约会头像AI生成
- 摘要: TinderProfile.ai是一款AI图片生成服务,通过分析用户自拍和照片,创造出一系列高质量、专业的头像图片,提升约会资料的第一印象,增加获得更多匹配的机会。
- Play AI:实时对话式语音AI平台
- 摘要: PlayAI是一款实时对话式语音AI平台,能够创建类人的语音代理。它支持上下文对话、轮流对话、打断处理、语音能量和情感调节,实现自然流畅的人际交流。
- Intellecta:AI驱动客户体验
- 摘要: Intellecta利用公司数据训练,采用GPT模型在聊天、社交媒体和电子邮件等多平台上回应客户咨询,相当于拥有个人定制的聊天GPT。
- PrometAI:智能商业计划估值工具
- 摘要: PrometAI是一款AI驱动,结合数据和框架的工具,专为初创期中小企业(SME)创始人设计。它能够方便地生成商业计划和估值分析,助力企业发展。
大模型论文
- 语言模型中的概率推断与扭曲SMC
- 摘要: 本研究应用顺序蒙特卡洛(SMC)工具解决大型语言模型(LLMs)中的概率推断问题,通过学习扭曲函数来优化潜在函数采样,提出了一种新颖的对比学习方法,并用于模型推断准确性评估。
- 大型视觉语言模型描述能力研究
- 摘要: 研究着重于评估大型视觉语言模型如Open-Flamingo、IDEFICS和MiniGPT-4在生成精确、细腻的文本描述方面的'独特性'与'真实性'。通过提出的TRAC框架,深入分析了这些模型的描述生成质量,发现MiniGPT-4在细粒度描述生成方面表现最佳。
- 语言模型辅助机械设计优化
- 摘要: 本研究提出一种结合预训练大型语言模型(LLMs)与有限元分析(FEM)模块的新方法。该方法能够引导LLMs持续学习、规划、生成和优化设计,无需特定域训练,通过结构化反馈和标准进行设计推理和细化。
- 利用大型语言模型生成能力本体
- 摘要: 本文研究了大型语言模型(LLMs)在创建系统或机器功能本体模型中的应用。通过一系列实验,评估了不同LLMs和提示技术生成的本体质量,使用RDF、OWL和SHACL方法进行半自动化质量分析。结果表明,即使是复杂的能力本体,生成的本体也几乎没有错误。
- 利用大型语言模型提升法规合规性
- 摘要: 本研究探讨了大型语言模型(LLMs),如BERT和GPT,用于自动化提取食品安全领域的法律要求内容,并检查法规合规性。研究成果表明,LLMs在提高法规分析效率和准确性方面具有显著潜力。
- 大型语言模型事件推理能力评估
- 摘要: 本文介绍了新的事件推理评测基准EV2,全面评估了大型语言模型(LLMs)在不同关系和推理范式下的事件推理能力。研究发现LLMs具备一定的事件推理能力,但与人类相比表现不佳,并提出了改进方法。
- 基于大型语言模型的会话辅导系统研究
- 摘要: 本文探讨并评估了一种新型会话辅导系统(CTS),该系统利用大型语言模型辅助内容创作,并通过学生与教授角色的AI代理实现教学互动。研究表明,用户参与度高,但在短期学习成效上并无显著差异。
- ChatGPT在CS课程中的学生观感
- 摘要: 本研究调查了52名计算机科学专业一年级学生对ChatGPT等大型语言模型在学术和职业应用中的看法。结果显示学生普遍支持在学术上使用GPT,但并不过度依赖,对其职业影响意见不一。
- InspectorRAGet: RAG系统评估平台
- 摘要: 本文介绍了InspectorRAGet,一款用于评估检索增强生成(RAG)系统的内省平台。该平台能够分析RAG系统的综合性能和单个实例表现,同时结合人类和算法指标以及评注者质量。InspectorRAGet适用于多种用例,并向公众开放。
- LLMs信心与质量对齐方法
- 摘要: 针对大型语言模型(LLMs)可能产生不正确或无意义文本的问题,本文提出了一个名为CONQORD的信心与响应质量对齐方法。该方法通过双重奖励函数的强化学习来提高信心与准确性的一致性,提升模型的可信度。
大模型开源项目
- Stable Diffusion Web界面项目
- 摘要: AUTOMATIC1111是一个流行的Github AI项目,提供了Stable Diffusion的Web用户界面。该项目使用Python语言编写,允许用户通过浏览器轻松地使用Stable Diffusion模型进行图像生成和编辑。
- PyTorch: 大模型训练原生库
- 摘要: PyTorch库专注于大型模型训练。这个由Python编写的项目在Github上受到广泛关注,旨在简化和加速大规模深度学习模型的训练过程。
- IDM-VTON:提升真实场景虚拟试衣
- 摘要: yisol的Github项目IDM-VTON使用Python开发,旨在改进扩散模型,提高野外环境下虚拟试衣的真实性和准确度。
- Open-Sora:高效视频制作民主化
- 摘要: hpcaitech推出的Open-Sora项目旨在普及高效视频制作。该项目使用Python语言编写,为广大用户提供了便捷的视频制作工具和解决方案,以支持创作需求。
- MyShell AI:即时声音克隆
- 摘要: MyShell AI项目能够实现即时声音克隆功能,用户可通过该项目复制特定声音。该项目使用Python语言编写,便于开发者学习和使用。
- Apple推出CoreNet深度学习库
- 摘要: Apple的CoreNet是一个用Python编写的库,专注于深度神经网络的训练。它在Github上趋势,吸引了开发者关注。
- Devika:智能AI软件工程师项目
- 摘要: stitionai推出的Devika项目,是一个能理解人类指令、自主研究信息并编写代码的AI软件工程师,旨在成为Cognition AI的Devin的开源竞争对手。项目使用Python语言编写。
- TrueFoundry的RAG框架项目
- 摘要: TrueFoundry推出的RAG(检索增强生成)框架,旨在构建模块化、开源的生产应用程序。该项目使用Python语言编写,便于开发者快速部署和使用。
- binary-husky:多功能大语言模型工具
- 摘要: binary-husky是一个针对GPT/GLM等大型语言模型的交互接口工具。它提供论文阅读、润色、写作等优化体验,支持模块化自定义功能,能够进行代码剖析、论文翻译总结,并能并行处理多个LLM模型。
- OpenInterpreter:自然语言电脑界面
- 摘要: OpenInterpreter是一个用Python编写的AI项目,旨在创建一个自然语言的电脑操作界面,让用户能够通过自然语言与计算机进行交互。