大模型日报 2024-07-02

大模型日报

2024-07-02

大模型资讯

  1. Gemma 2 模型以 27B 的参数击败 70B 的 Llama 3-Instruct,成为开源模型性能第一,在 LMSYS Chatbot Arena 排行表现出色,但微调数据来源引争议。 🔗:http://www.jintiankansha.me/t/gHkDg76fPe
  2. 《奇点更近了》作者 Ray Kurzweil 预言 2045 年智能将扩展到 100 万倍,文中还提及计算能力增长和 AI 在医学领域应用。 🔗:http://www.jintiankansha.me/t/37eJiiIfLP
  3. 拓扑 Transformer 模型 TopoFormer 可将分子三维信息转化为药物相互作用模型可用数据,助力药物研发,研究发表在《Nature Machine Intelligence》。 🔗:https://www.jiqizhixin.com/articles/2024-07-02
  4. 长城汽车董事长魏建军直播展示长城汽车全场景 NOA 在重庆挑战性路段的实际表现,检验了 SEE 模型和全场景 NOA 的能力。 🔗:https://www.jiqizhixin.com/articles/2024-06-30-8
  5. 浙大、腾讯团队发布 SciKnowEval 评测基准评估大型语言模型的科学知识能力,国产大模型表现亮眼。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-2
  6. 研究指出层标准化(Layer Normlization,LN)及其计算退化版本 RMSNorm 具有非线性表达能力,分组层标准化技术(LN-G)可加强其非线性。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-4
  7. 麻省理工学院开发出全球首个神经连接机械腿,帮助截肢者恢复自然行走和空间感,相关论文发表于《自然医学》杂志。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-5
  8. 普林斯顿大学教授承现峻认为大语言模型的种子可追溯到克劳德·香农 1951 年提出的预测下一个单词的问题。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-6
  9. 国产 AI 编程助手豆包 MarsCode 上线,具备多项能力,能提高程序员工作和学习效率。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-8
  10. 2024 年 7 月 4 日上海世博中心将举办 WAIC 2024 科学前沿主论坛,主题为“可信 AI,善治共享”,嘉宾阵容强大,将发布多项成果。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-9
  11. WAIC 2024 将于 7 月在上海世博中心等地举行,涵盖多重点话题,完整论坛日程安排已公布。 🔗:https://www.jiqizhixin.com/articles/2024-07-02-10

大模型产品

  1. Arc 3.0:全球顶尖科技人才远程工作匹配
  • 摘要: Arc是一个全球市场,汇集顶尖开发者、设计师和营销人员。通过HireAI,快速匹配自由职业和全职远程工作,覆盖190个国家的35万+专家。
  1. Plus AI:快速生成专业PPT
  • 摘要: 使用Plus AI,几分钟内即可创建专业PPT。无需学习新工具,直接在PowerPoint中生成,兼容性无忧。
  1. Respired.io:AI社交媒体助手
  • 摘要: Respired.io 提供经济实惠的AI驱动社交媒体管理,自动生成和安排Instagram、Facebook和LinkedIn的帖子。
  1. AI梦想板:用AI可视化你的梦想
  • 摘要: 使用AI梦想板,从照片和文字生成你梦想中的逼真图像,并包含AI生活教练帮助你规划和实现梦想。
  1. Motiff: AI驱动的专业UI设计工具
  • 摘要: Motiff提供AI工具箱、AI设计系统和Motiff实验室,助设计师提升10倍效率,确保设计一致性。
  1. Summer AI:博客内容智能摘要按钮
  • 摘要: Summer AI为您的博客内容添加智能摘要按钮,读者点击即可获取内容摘要和相关产品列表。
  1. prompteasy.ai:5分钟内创建GPT微调数据集
  • 摘要: 使用prompteasy.ai轻松微调GPT。与我们的AI聊天,根据您的需求从零开始创建微调数据集。
  1. InsightAI:智能财务管理助手
  • 摘要: 使用AI工具简化财务任务、检测欺诈、提升客户服务。支持Tally和Zoho,提供精准数据匹配、详细财务洞察和智能聊天机器人。

大模型论文

  1. Web2Code: 网页到代码大规模数据集与评估框架
  • 摘要: Web2Code 提供网页截图到HTML代码的转换数据集和评估框架,提升多模态大语言模型在网页理解和代码生成任务中的表现。
  1. LLaRA:提升机器人学习数据的视觉语言策略
  • 摘要: LLaRA框架通过将机器人动作策略表述为对话,利用视觉语言模型生成最优策略决策,显著提升机器人学习效果。
  1. 基于十亿角色的多样化数据合成方法
  • 摘要: 提出一种利用大语言模型生成多样化合成数据的方法,介绍了包含十亿角色的Persona Hub,展示其在多种场景中的应用。
  1. LLaVolta:高效多模态模型的阶段性视觉上下文压缩
  • 摘要: LLaVolta通过阶段性视觉上下文压缩,在不损失性能的情况下显著提高多模态模型的训练效率和表现。
  1. ProgressGym:道德进步对齐算法研究
  • 摘要: 本文提出ProgressGym框架,通过学习历史文本中的道德进步机制,解决AI系统中道德对齐的挑战,并提供基准测试和开放排行榜。
  1. Auto Cherry-Picker: 基于高质量生成数据的自动挑选
  • 摘要: 提出Auto Cherry-Picker框架,通过大语言模型生成布局和图像,使用CLIS评估,提升下游任务性能,尤其在长尾分布和不平衡数据集上表现显著。
  1. 大模型事实验证中的分子化事实研究
  • 摘要: 本文探讨了上下文在原子化事实中的作用,提出并量化了去上下文化对最小化的影响,提出了生成分子化事实的基线方法。
  1. EVF-SAM: 文本提示的早期融合分割模型
  • 摘要: 本文提出EVF-SAM,通过早期视觉-语言融合提升SAM的文本提示分割能力,在RefCOCO/+/g数据集上取得了最先进的性能。
  1. 基于多智能体协作的任务自动化框架
  • 摘要: 本文提出了一种灵活的智能体工程框架,旨在通过多智能体协作解决复杂任务,适用于多领域工业应用。
  1. BioMNER: 生物医学方法实体识别数据集
  • 摘要: 本文提出了一个新的生物医学方法实体识别数据集,并探讨了多种NER方法,发现ALBERT与CRF结合效果最佳。

大模型开源项目

  1. 微软生成式AI入门教程
  • 摘要: 微软推出18节课的生成式AI入门教程,使用Jupyter Notebook编写,帮助初学者快速上手生成式AI技术。
  1. 微软LLM技术快速集成工具
  • 摘要: 微软提供了一款用C#编写的工具,帮助开发者快速、轻松地将前沿的LLM技术集成到应用程序中。
  1. VinciGit00:AI驱动的Python爬虫
  • 摘要: VinciGit00是一个基于AI的Python爬虫项目,能够高效地抓取并处理网页数据,适用于各种数据采集需求。
  1. 高速LLM推理工具
  • 摘要: EricLBuehler项目提供了一个用Rust语言编写的超快LLM推理工具,显著提升推理速度。
  1. Fabric: 开源AI增强人类框架
  • 摘要: Fabric是一个用Python编写的开源框架,通过众包AI提示模块化解决特定问题,增强人类能力。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/39541.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3快速上手--3小时掌握

1. Vue3简介 2020年9月18日,Vue.js发布版3.0版本,代号:One Piece(n经历了:4800次提交、40个RFC、600次PR、300贡献者官方发版地址:Release v3.0.0 One Piece vuejs/core截止2023年10月,最新的…

llama-factory训练RLHF-PPO模型

理论上RLHF(强化学习)效果比sft好,也更难训练。ppo有采用阶段,步骤比较多,训练速度很慢. 记录下工作中使用llama-factory调试rlhf-ppo算法流程及参数配置,希望对大家有所帮助. llama-factory版本: 0.8.2 一 rlhf流程 ppo训练流程图如下, 会…

【Kubernetes】加入节点Node及问题

命令 分别再node节点机器上,执行如下命令: kubeadm join [master机器ip:端口] --token [master机器初始化生成的token] --discovery-token-ca-cent-hash [master机器初始化生成的hash]问题 由于清屏没有记住token和hash的时候: 1&#xff…

Log4j日志框架讲解(全面,详细)

Log4j概述 Log4j是Apache下的一款开源的日志框架,通过在项目中使用 Log4J,我们可以控制日志信息输出到控制台、文件、甚至是数据库中。我们可以控制每一条日志的输出格式,通过定义日志的输出级别,可以 更灵活的控制日志的输出过程…

如何指定Microsoft Print To PDF的输出路径

在上一篇文章中,介绍了三种将文件转换为PDF的方式。默认情况下,在Microsoft Print To PDF的首选项里,是看不到输出路径的设置的。 需要一点小小的手段。 运行输入 control 打开控制面板,选择硬件和声音下的查看设备和打印机 找到…

【ubuntu18.04】 局域网唤醒 wakeonlan

ai服务器经常因为断电,无法重启,当然可以设置bios 来电启动。 这里使用局域网唤醒配置。 自动开关机设置 工具:ethtool 端口 : enp4s0 Wake-on: d 表示禁用Wake-on: g 激活 ,例如:ethtool -s eth0 wol g 配置/etc/rc.local ,这个文件不存在,自己创建工具下载 tengxun W…

【前端vue3】TypeScrip-类型推论和类型别名

类型推论 TypeScript里,在有些没有明确指出类型的地方,类型推论会帮助提供类型。 例如: 变量xiaoc被推断类型为string 如重新给xiaoc赋值数字会报错 let xiaoc "xiaoc"xiaoc 1111111111111如没有给变量指定类型和赋值&#xf…

专题七:Spring源码之BeanDefinition

上一篇我们通过refresh方法中的第二个核心方法obtainBeanFactory,通过createBeanFacotry创建容Spring的初级容器,并定义了容器的两个核心参数是否允许循环引用和覆盖。现在容器有了,我们来看看容器里的第一个重要成员BeanDefinition。 进入lo…

浙大版PTA《Python 程序设计》题目集 参考答案

浙大版PTA《Python 程序设计》题目集 参考答案 本答案配套详解教程专栏,欢迎订阅: PTA浙大版《Python 程序设计》题目集 详解教程_少侠PSY的博客-CSDN博客 01第1章-1 从键盘输入两个数,求它们的和并输出 aint(input()) # 输入a的值 bint(…

从需求是如何最终抽象成最基本的传参入参

第一层:出参和入参 用通俗的话讲,就是给客户提供服务的一种方式,需要包含入参和出参 。入口参数就是程序执行时会调用的参数,出口参数就是程序执行完会返回的参数。入参的值是被调函数需要, 出参的值是主调函数需要的…

【文件上传】

文件上传漏洞 FileUpload 0x01 定义 服务端未对客户端上传文件进行严格的 验证和过滤造成可上传任意文件情况;0x02 攻击满足条件: 1. 上传文件能够被Web容器解释执行   2. 找到文件位置   3.上传文件未被改变内容。(躲避安全检查&#…

【Linux系统】CUDA的安装与graspnet环境配置遇到的问题

今天在安装环境时遇到报错: The detected CUDA version (10.1) mismatches the version that was used to compile PyTorch (11.8). Please make sure to use the same CUDA versions. 报错原因:安装的cuda版本不对应,我需要安装cuda的版本…

Spark面试题总结

一、RDD的五大特性是什么 1、RDD是由一些分区构成的,读取文件时有多少个block块,RDD中就会有多少个分区 2、算子实际上是作用在RDD中的分区上的,一个分区是由一个task处理,有多少个分区,总共就有多少个task 3、RDD之间…

windows远程连接无法复制文件

windows远程桌面无法复制文件 解决方案 打开任务管理器管理器,在详细信息界面,找到rdpclip.exe进程,选中并点击结束任务,杀死该进程。 快捷键 win r 打开运行界面,输入 rdpclip.exe ,点击确定运行。即可解决无法复制文件问题。…

WebDriver 类的常用属性和方法

目录 🎍简介 🎊WebDriver 核心概念 🎉WebDriver 常用属性 🎁WebDriver 常用方法 🐷示例代码 🎪注意事项 🎐结语 🧣参考资料 🎍简介 Selenium WebDriver 是一个用…

产品设计的8大步骤

产品设计,通俗来说就是将创新想法或概念转化为落地实体的过程。一般来说,一个成功的产品应当具有创新性、美观性、实用性、可持续性以及经济效益,从而满足用户的使用需求以及市场的发展需求。产品设计也并不是一件简单的事情,产品…

Docker与微服务实战2022 尚

Docker与微服务实战2022 尚硅谷讲师:周阳 1. 基础篇(零基小白) 1 1.1. Docker简介 2 1.2. Docker安装 15 1.3. Docker常用命令 29 1.4. Docker镜像 43 1.5. 本地镜像发布到阿里云 50 1.6. 本地镜像发布到私有库 57 1.7. Docker容器数据卷 64 1.8. Docker常规安装简介 …

firewalld开放端口常用命令

在Linux系统中,常使用firewalld服务来管理防火墙,可以通过命令行来开放特定的端口。 查firewalld运行状态: sudo systemctl status firewalld 确保firewalld正在运行,可以使用以下命令来启动并使其在系统启动时自动运行&#xff1…

经典的卷积神经网络模型 - AlexNet

经典的卷积神经网络模型 - AlexNet flyfish AlexNet 是由 Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 在 2012 年提出的一个深度卷积神经网络模型,在 ILSVRC-2012(ImageNet Large Scale Visual Recognition Challenge 2012)竞赛中…

劳务工程元宇宙的探索与实践

随着元宇宙概念的不断深入,各行各业都在探索与这一新兴技术结合的可能性。劳务工程行业也未落后,开始思考和实验如何将元宇宙的概念与劳务工程相结合,以期提高效率、降低成本,同时创造更多价值。本文将探讨劳务工程元宇宙的现状、…