大模型日报
2024-05-30
大模型资讯
- 大型语言模型未来将超越人类金融分析师
- 摘要: 新研究表明,大型语言模型在金融预测方面表现优于人类专家,为交易策略提供了宝贵的洞见。
- DLM技术提高语音识别准确率
- 摘要: 本文介绍了通过去噪语言模型(DLM)提高语音识别准确率的方法。语音识别技术旨在将口语转换为文本,涉及声学建模、语言建模等过程。
- 苹果推出首个多模态AI模型
- 摘要: 苹果发布了MM1,一系列能够处理图像和文本的多模态模型。这标志着苹果在人工智能领域的重要进展,展示了其在多模态技术方面的创新能力。
- 大型语言模型在临床肿瘤学问题上错误率高于人类
- 摘要: 研究对五种公开的大型语言模型进行了比较评估,测试了2044个涵盖肿瘤学综合主题的问题。结果显示,大型语言模型在回答这些问题时的错误率高于人类。
- 亚利桑那州立大学研究ReAct提示:示例相似性在增强大语言模型推理中的作用
- 摘要: 亚利桑那州立大学的研究人员评估了ReAct提示,探讨了示例相似性在增强大语言模型(LLMs)推理中的作用。近年来,LLMs在自然语言处理(NLP)和自然语言理解(NLU)领域取得了迅速发展。
- IBM与新加坡AI合作本地化生成式AI
- 摘要: IBM与新加坡人工智能(AISG)签署合作协议,测试使用IBM人工智能的SEA-LION大型语言模型(LLM),以实现生成式AI的本地化。
- IBM测试东南亚大语言模型并推动本地化
- 摘要: IBM与AI Singapore合作,将在其AI平台上测试并提供SEA-LION大语言模型。这一合作旨在促进东南亚地区的语言本地化工作。
- 利用大型语言模型代理生成资产管理外壳:迈向语义互操作性
- 摘要: 本研究提出了一种新方法,通过大型语言模型代理实现数字孪生中的语义互操作性,并辅助创建资产管理外壳。
- 阿布扎比开发的AI模型推动中东科技发展
- 摘要: AWS高管Kevin Miller表示,阿布扎比开发的Falcon大型语言模型在全球范围内获得了强劲的关注。这些由阿联酋制造的AI模型正在帮助中东地区在全球科技版图中占据一席之地。
- SambaNova在最新速度测试中击败NVIDIA
- 摘要: SambaNova Systems,这家拥有最快模型和最先进芯片的生成式AI解决方案公司,在最新的速度测试中明显胜过了NVIDIA,成为此次测试的明确赢家。
大模型产品
- Frontly:无代码构建AI驱动应用
- 摘要: 使用Frontly,无需编程即可生成AI应用,通过拖放界面编辑,快速启动响应式布局,支持高级操作和自动化平台同步。
- Lawformer AI:法律团队的智能合约工具
- 摘要: Lawformer AI 提供合约解构工具,帮助法律团队创建个性化条款库,集中管理内部知识。
- VIVA: AI视觉设计平台
- 摘要: VIVA提供AI视频生成、4K视频增强和自动优化提示,助您轻松创作引人入胜的视频,体验无与伦比。
- ChainClarity:AI助力轻松掌握加密货币
- 摘要: ChainClarity利用AI技术解读白皮书,简化学习过程,促进讨论,提高加密货币认知。轻松进入加密货币世界,将复杂变简单。
- Tykr移动应用:AI助力投资信心
- 摘要: Tykr推出备受期待的iOS和Android应用,让初学者和高级投资者能在移动设备上自信管理投资。
- StartKit.AI:首个AI SaaS模板
- 摘要: StartKit.AI结合多年编程与AI经验,推出首个SaaS模板,助力您快速构建AI驱动的初创企业。
- timeOS 2.0:智能日程管理
- 摘要: timeOS 2.0 是一个AI驱动的新标签页,帮助您为下次会议做准备。悬停查看Gmail、会议记录和LinkedIn信息,点击与AI对话,秒级准备。
- Tonic Textual:AI数据湖解决方案
- 摘要: Tonic Textual是首个为生成式AI准备的安全数据湖,快速处理并部署非结构化数据。
- Syllaby V2.0:AI视频营销神器
- 摘要: Syllaby V2.0利用AI简化病毒视频创作,提供创意、排程、脚本和虚拟形象视频制作,优化营销流程。
- Squire AI:智能代码审查助手
- 摘要: Squire AI 是一个上下文感知的助手,帮助撰写拉取请求描述、审查PR,并学习您的代码审查偏好。
大模型论文
- 基于图神经网络的RAG重排方法改进
- 摘要: 本文提出G-RAG,利用图神经网络改进RAG,通过文档间连接和语义信息进行重排,性能优于现有方法。
- Instruct-MusicGen: 高效文本到音乐编辑
- 摘要: Instruct-MusicGen通过微调预训练的MusicGen模型,实现高效的文本指令音乐编辑,仅增加8%参数,训练5K步,性能优越。
- OwLore:内存高效的LLM微调方法
- 摘要: OwLore通过动态采样预训练层和低秩投影,实现了内存高效的LLM微调,性能优于基线方法。
- LLaMA-NAS: 高效大语言模型架构搜索
- 摘要: 提出基于LLaMA2-7B的一次性NAS方法,通过遗传算法优化模型架构,实现模型尺寸和复杂度的显著降低,同时保持精度。
- 基于MLLM的可靠性课程学习在SFDA中的应用
- 摘要: 本文提出了一种新的可靠性课程学习框架,利用多模态大语言模型在无源域适应中进行知识转移和伪标签生成,显著提升了适应性和鲁棒性。
- 泰语Winograd基准:评估常识推理的新数据集
- 摘要: 本文提出了一套泰语Winograd基准数据集,用于评估泰语中的常识推理能力。研究显示,当前大型语言模型在泰语中的表现显著低于英语,揭示了多语言常识推理的挑战。
- PromptWizard: 任务感知的提示优化框架
- 摘要: PromptWizard通过迭代生成和优化提示,提升模型性能。其特点包括计算效率高、适应性强,并在多任务评估中表现优越。
- 3D标记LLM在自动驾驶中的关键作用
- 摘要: 本文提出通过DETR风格的3D感知器作为3D标记器,结合LLM,实现可靠的自动驾驶。该方法在nuScenes数据集上表现优异。
- 提升多语言性能的动态学习策略
- 摘要: 本文提出三种策略优化多语言大模型性能,包括优化提示、混合RAG方法和动态选择策略,实现多语言理解和生成的显著提升。
- MMCTAgent:多模态批判性思维代理框架
- 摘要: MMCTAgent通过迭代分析和任务特定评估标准,提升多模态复杂视觉推理能力,超越现有模型表现。
大模型开源项目
- Grok开源发布:Python实现
- 摘要: Grok开源发布,由xai-org开发,使用Python语言编写,提供可解释人工智能解决方案,助力AI透明化。
- YOLOv10:实时端到端目标检测
- 摘要: THU-MIG推出YOLOv10,使用Python编写,实现实时端到端目标检测,提升检测速度与精度。
- iyaja: 自组织文件系统
- 摘要: iyaja是一个使用llama 3的自组织文件系统,采用Jupyter Notebook语言编写,旨在提升文件管理效率。
- TrueFoundry的RAG框架
- 摘要: TrueFoundry推出的RAG框架,用于构建模块化、开源的生产应用,基于Python语言开发。
- 企业级Agentic RAG工具
- 摘要: ragapp:最简单的企业级Agentic RAG使用方式,基于TypeScript语言开发,助力企业轻松实现智能化应用。
- FlashRAG高效研究工具包
- 摘要: RUC-NLPIR发布的FlashRAG是一个用Python编写的高效RAG研究工具包,旨在提升研究效率。
- Fabric:增强人类的开源AI框架
- 摘要: Fabric是一个用Python编写的开源框架,通过AI增强人类,提供模块化解决方案,利用众包AI提示解决特定问题。
- Khoj AI: 您的AI第二大脑
- 摘要: 使用Khoj AI获取问题答案,无论在线或笔记。支持GPT-4和本地LLM。可自托管或云端使用,支持多平台。
- SD.Next: 稳定扩散高级实现
- 摘要: SD.Next 是一个用 Python 编写的项目,提供了稳定扩散和其他基于扩散的生成图像模型的高级实现。
- 多语言OCR与布局分析工具
- 摘要: VikParuchuri项目实现了90多种语言的OCR、布局分析、阅读顺序和行检测功能,使用Python编写。