大模型日报 2024-07-10
大模型资讯
-
CVPR 最佳论文候选 | NeRF 新突破,用启发式引导分割去除瞬态干扰物,无需额外先验知识
-
介绍 NeRF 研究中消除瞬态干扰物影响的新方法。
-
-
彻底改变语言模型:全新架构 TTT 超越 Transformer,ML 模型代替 RNN 隐藏状态
-
全新大语言模型架构 TTT 有望代替 Transformer 模型。
-
-
没想到!AlphaZero 式树搜索也能用来增强大语言模型推理与训练
-
介绍大语言模型树搜索训练增强框架 TSLLM。
-
-
鄂维南院士领衔新作:大模型不止有 RAG、参数存储,还有第 3 种记忆
-
介绍新型语言模型 Memory3 及其优势。
-
-
第一次,语言的神经激活被定位到细胞级
-
报道关于语言理解的神经元活动研究。
-
-
70 万人争先体验!视频生成新王者「可灵 AI」又双叒升级了
-
快手旗下「可灵 AI」的升级及新功能。
-
-
DeepMind 新方法:训练时间减少 13 倍,算力降低 90%
-
DeepMind 提出新训练方法提高效率。
-
-
深度解析 RAG 大模型知识冲突,清华西湖大学港中文联合发布
-
分析 RAG 大模型的知识冲突问题。
-
-
人人可做提示工程师!Claude 上新:一键生成、测试和评估 prompt
-
Claude 工具助力生成和评估 prompt。
-
-
单一作者论文,谷歌提出百万专家 Mixture,超越密集前馈、稀疏 MoE
-
谷歌提出参数高效的专家检索机制 PEER。
-
-
WAIC 观察:隐私计算加速落地产业,全新的技术标准体系呼之欲出
-
介绍隐私计算技术的发展和标准体系建设。
-
-
LeCun 转发,首个半导体设计开源大模型 SemiKong 问世,重塑芯片制造流程
-
首个半导体开源大模型 SemiKong 有望改变行业。
-
-
AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评
-
AlphaFold 3 在预测生物分子复合物结构方面的进展。
-
大模型开源项目
-
首个半导体设计开源大模型 SemiKong 问世 -
为半导体行业带来变革。
-
以上是为您生成的 2024 年 7 月 10 日的大模型日报。
本文由 mdnice 多平台发布