大模型日报-20240118

这里写目录标题

    • 微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案
    • 在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型
    • 上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描
    • 微软Copilot大会员来了:每月20刀,人人都能用
    • 智谱发布GLM-4全家桶:性能提升60%,多模态、128K长文本,全能All Tools及GPTs商店
    • MiniMax 国内首个 MoE 大语言模型全量上线啦
    • 开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了
    • MAGNeT:一个单一的非自回归模型,用于文本到音乐和文本到声音的生成,质量与SOTA模型相当,同时速度提高7倍
    • Mixtral 8x7B模型上线,Teknium:据我所知,这是第一个击败MistralAI的Mixtral Instruct模型的Mixtral基础模型
    • LLM幻觉检测:提升聊天机器人的可信度
    • 神经网络在余震强度预测中的突破
    • AI模型与工具的开源进展
    • .NET应用迁移到Azure的新工具
    • 给科研人的 ML 开源发布工具包
    • X-AnyLabeling v2.3.0发布
    • RAG技术与Elasticsearch应用
    • 京东AIGC与知识图谱结合实践

微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案

链接:https://news.miracleplus.com/share_link/15912

在这里插入图片描述
数据分析一直是现代社会中的重要工具,它帮助我们洞察本质、发现规律并指导决策。然而,数据分析过程往往复杂且费时,因此我们期望存在一个智能助手助力用户直接 “与数据对话 “。得益于大语言模型(LLM)的发展,虚拟助手和 Copilot 等智能 Agent 纷纷涌现,它们在自然语言理解和生成方面的表现令人叹为观止。但遗憾的是,在处理复杂数据结构(如 DataFrame, ndarray 等)和引入领域知识方面,现有的 Agent 框架仍然举步维艰,而这恰恰是数据分析和专业领域中的核心需求。为了突破这一瓶颈,微软推出了 TaskWeaver—— 一款代码优先的 Agent 框架。TaskWeaver 能够将用户的自然语言请求巧妙地转化为可执行代码,并支持丰富的数据结构、动态插件选择以及专业领域适应的规划过程。

在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15915

医学的核心在于医患对话,熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高护理的可及性、一致性和质量。然而,学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型(LLM)的人工智能系统,针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈(self-play)的模拟环境,具有自动反馈机制,可在不同的疾病状况、专业和背景下扩展学习。「据我们所知,这是第一次针对诊断对话和获取临床病史进行最佳设计的对话式人工智能系统。」 Google Health 的临床研究科学家、论文的合著者 Alan Karthikesalingam 说道。

上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15916
光学断层扫描已成为一种非侵入性成像方法,可提供对亚细胞结构的三维洞察,从而能够更深入地了解细胞功能、相互作用和过程。传统的光学断层扫描方法受到有限的照明扫描范围的限制,导致分辨率各向异性和细胞结构的不完整成像。为了克服这个问题,上海人工智能实验室、德国德累斯顿工业大学(Technische Universität Dresden)以及马克斯·普朗克学会(Max Planck Society)的研究人员采用了紧凑的多核光纤细胞旋转器系统,该系统有助于对微流控芯片内的细胞进行精确的光学操纵,从而实现具有各向同性分辨率的全角度投影断层扫描。此外,研究人员展示了人工智能驱动的断层扫描重建工作流程,它可以是从通常需要手动处理的传统计算方法到完全自主过程的范式转变。所提出的细胞旋转断层扫描方法的性能通过细胞模型和 HL60 人类癌细胞的三维重建得到验证。

微软Copilot大会员来了:每月20刀,人人都能用

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15917

去年 9 月,微软宣布了大模型 Copilot 能力加入 Office 和 Windows 11 的新计划。今天,该能力终于覆盖到了全体用户。1 月 15 日,微软正式发布 Copilot Pro,其每月订阅费用为 20 美元,可解锁访问 Word、Excel 和 PowerPoint 等 Office 常用办公软件中的大模型能力,同时优先访问最新的 OpenAI 模型。在其之上,你也可以基于需求构建起属于自己的 Copilot GPT。

智谱发布GLM-4全家桶:性能提升60%,多模态、128K长文本,全能All Tools及GPTs商店

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15918

国产大模型玩家智谱AI,交出最新成绩单——发布全自研第四代基座大模型GLM-4,且所有更新迭代的能力全量上线。作为国内唯一一个产品线全对标OpenAI的大模型公司,智谱年前攒了波大的:按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4。而同时推出的GLM-4-All Tools,能够完成用户意图理解-复杂指令规划-自由调用GLM生态的多种模型能力。值得一提的是,智谱发布了GLMs,为所有开发者提供AI智能体定制能力,简单prompt指令就能创建个性化GLM智能体。

MiniMax 国内首个 MoE 大语言模型全量上线啦

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15919

今天,经过了半个月的部分客户的内测和反馈,MiniMax 全量发布大语言模型 abab6,为国内首个 MoE 大语言模型。在 MoE 结构下,abab6 拥有大参数带来的处理复杂任务的能力,同时模型在单位时间内能够训练足够多的数据,计算效率也可以得到大幅提升。改进了 abab5.5 在处理更复杂、对模型输出有更精细要求场景中出现的问题。

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

在这里插入图片描述

链接:https://news.miracleplus.com/share_link/15920

从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。在前段时间的一篇论文中,该模型背后的公司 Mistral AI 公布了 Mixtral 8x7B 的一些技术细节,并推出了 Mixtral 8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5 Turbo、Claude-2.1、Gemini Pro 和 Llama 2 70B 聊天模型。在 BBQ 和 BOLD 等基准中,Mixtral - Instruct 也显示出更少的偏见。但最近,Mixtral Instruct 也被超越了。一家名叫 Nous Research 的公司宣布,他们基于 Mixtral 8x7B 训练的新模型 ——Nous-Hermes-2 Mixtral 8x7B 在很多基准上都超过了 Mixtral Instruct,达到了 SOTA 性能。

MAGNeT:一个单一的非自回归模型,用于文本到音乐和文本到声音的生成,质量与SOTA模型相当,同时速度提高7倍

链接:https://news.miracleplus.com/share_link/15923
很高兴分享MAGNeT 🧲!
https://pages.cs.huji.ac.il/adiyoss-lab/MAGNeT/
一个单一的非自回归模型,用于文本到音乐和文本到声音的生成,质量与SOTA模型相当,同时速度提高7倍。我们在audiocraft上开源了我们的代码(包括训练)!还有一个Gradio演示。

Mixtral 8x7B模型上线,Teknium:据我所知,这是第一个击败MistralAI的Mixtral Instruct模型的Mixtral基础模型

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15924

Teknium:终于到了这个时刻!我们的Mixtral 8x7B模型现在已经上线并可用了!

Nous-Hermes-2 Mixtral 8x7B有两种变体,一个是SFT+DPO和仅SFT,所以你可以尝试看看哪个对你更有效!

据我所知,这是第一个击败@MistralAI的Mixtral Instruct模型的Mixtral基础模型,在我自己的个人测试中,它可能是目前最好的开源LLM(大型语言模型)!

LLM幻觉检测:提升聊天机器人的可信度

链接:https://news.miracleplus.com/share_link/15929

探讨如何避免大型语言模型(LLM)在生成回复时产生幻觉或非事实陈述。介绍几种方法,包括调整温度参数、使用余弦距离和BERTScore进行相似度评估,以及自然语言推理(NLI)来检测输出的一致性。特别强调了LLM自相似性得分作为实时幻觉检测的有效方法,并展示了如何通过Streamlit构建一个实时幻觉检测的聊天机器人应用。这些方法有助于提高聊天机器人的输出质量,增强用户信任。

神经网络在余震强度预测中的突破

链接:https://news.miracleplus.com/share_link/15930

基于神经网络的地震余震强度预测模型在Nature杂志上获得认可,其性能超越传统模型。这些模型利用深度学习处理大量地震数据,提高了预测余震发生概率和震级范围的准确性。美国地质勘探局(USGS)的标准模型与神经点过程模型(neural-temporal point processes)相比,后者在捕捉地震复杂规律方面表现更佳。此外,智能地动系统利用AI技术实现了地震信息的实时自动检测与发布,展示了AI在地震预警领域的实际应用和潜力。这些进展表明,AI技术在提升自然灾害应对能力方面正发挥着越来越重要的作用。

AI模型与工具的开源进展

链接:https://news.miracleplus.com/share_link/15931

本周,机器之心SOTA模型平台发布了多个开源项目,包括8个基础模型/精调模型,覆盖中文对话、多轮对话、金融投资、医学对话等领域。此外,还有1个Agent开发工具,旨在提升Agent效率,以及1个必备工具,专为Mistral模型的快速推理设计。这些开源资源为AI研究和应用提供了新的工具和模型,有助于推动AI技术的进一步发展和行业应用。

.NET应用迁移到Azure的新工具

链接:https://news.miracleplus.com/share_link/15932

微软发布的Azure Migrate应用程序和.NET代码评估工具(AppCAT),旨在帮助开发者评估和迁移本地.NET应用程序到Azure云平台。AppCAT通过静态代码分析,识别迁移过程中的潜在问题,并提供修复建议。工具支持Visual Studio扩展和.NET CLI两种形式,能够生成详细的分析报告,帮助开发者评估迁移工作量和项目组件。未来计划包括集成AI功能和与Copilot的集成,以及根据Azure目标提供更精确的评估。鼓励开发者通过Visual Studio反馈渠道提供反馈,共同完善工具。

给科研人的 ML 开源发布工具包

链接:https://news.miracleplus.com/share_link/15933

指南介绍Hugging Face提供的ML开源发布工具包,旨在帮助科研人员将研究成果(包括论文、代码、数据集、模型等)公开发布,以增加研究的可见度和应用。分享如何使用arXiv、GitHub和Hugging Face Hub等平台进行发布,以及创建在线演示Space。强调开源的重要性,包括促进研究合作、推动领域发展和提高成果的可访问性。提供详细的步骤和工具使用指南,以及如何通过社交媒体和社区互动来推广研究成果。鼓励科研人员参与开源,共同推动AI领域的进步。

X-AnyLabeling v2.3.0发布

链接:https://news.miracleplus.com/share_link/15934

X-AnyLabeling v2.3.0,一款开源AI标注工具,支持多样化标注需求,集成YOLOv8、EdgeSAM等热门模型,提供一键导入导出功能,支持CPU/GPU加速,跨平台兼容。新版本增强了易用性,如标签背景高亮、数据统计预览等。工具支持视频标注,集成先进跟踪算法,提升标注效率。社区提供详细文档和支持,鼓励用户参与改进。展望未来,X-AnyLabeling将继续优化,满足更多业务场景。

RAG技术与Elasticsearch应用

链接:https://news.miracleplus.com/share_link/15935

检索增强生成(RAG)技术,这是一种结合检索和生成的方法,有效解决了大语言模型(LLM)的知识限制和幻觉问题。通过部署Elasticsearch(ES)并利用其向量检索功能,我们能够将文档向量化并存储,从而在问题提出时检索相关文档,为LLM提供上下文信息。此外,我们将介绍如何使用LlamaIndex框架结合ES进行文档索引和检索,以及如何自定义Embedding模型以实现文本向量化。最后,我们将展示如何利用RAG技术进行问题检索和内容生成,以及在不使用LLM的情况下,如何仅基于检索到的文档生成提示词模板。

京东AIGC与知识图谱结合实践

链接:https://news.miracleplus.com/share_link/15936

嘉宾分享了京东如何结合知识图谱与AIGC技术,提升电商场景下的商品文案自动生成质量。通过利用商品的多源输入信息,包括图片、文本和知识图谱,京东开发了一套系统,该系统能够提取商品卖点和要素,并通过编码器和解码器处理这些信息。此外,京东还引入了句间流畅度模型和标点纠错模型,以增强文案的连贯性和准确性。嘉宾还提到了如何通过领域和通用知识图谱的结合,以及大模型的探索,来提升文案的丰富度和可信度。这些技术的应用不仅提高了文案的生成效率,还显著降低了成本,提高了转化率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/631185.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3DGS 其一:3D Gaussian Splatting for Real-Time Radiance Field Rendering

3DGS 其一:3D Gaussian Splatting for Real-Time Radiance Field Rendering 1. 预备知识1.1 球谐函数1.2 Splatting1.3 α \alpha α blending1.4 多维高斯的协方差矩阵1.4.1 高斯与椭球体的关系1.4.2 世界坐标系下的三维高斯到二维像素平面投影过程 2. 3D Gaussia…

如何绘制出图像的色素分布直方图

效果 如图,可以展示出我们的图像的颜色分布直方图,表明的图像的亮和暗 实现可视化色素分布直方图方法 这里我们对我们的灰色图片和彩色图片进行了直方图显示 import cv2 import matplotlib.pyplot as plt image cv2.imread("test.jpg") # 彩色图片->…

k8s的对外服务---ingress

service的作用体现在两个方面: 集群内部:不断追踪pod的变化。他会更新endpoint中的pod对象,基于pod的IP地址不断变化的一种服务发现机制。 集群外部:类似负载均衡器,把流量IP端口,不涉及转发url(http、htt…

CNAS中兴新支点——软件测试7条原则

软件测试报告 最需要注意的就是测试思考,而非测试执行。而对软件测试菜鸟来说,初入行,首先要知道软件测试的7条原则,了解这些可以让你事倍功半。 软件测试的7条原则 1)测试的不可穷尽原则 是的!任何产品…

线性代数的学习和整理23:用EXCEL计算 向量/向量组的点乘 (内积) (建设ing)

目录 前言:EXCEL里的的向量相关计算公式 0.1 EXCEL里相关公式 0.2 先说结论:向量组的点乘公式和 向量组的点乘公式不一样 1 向量的点乘 (内积) 1.1 向量的点乘公式 1.2 EXCEL里向量点乘的计算 ​编辑 1.3 向量点乘的性质 1.3.1 内积的公式…

分析Unity崩溃日志(Android)

Unity版本: 这里Unity版本是Unity 2019.4.30f1 崩溃信息: 错误信息如下: Exception Appversion: versionName 1.0.1 versionCode 1 Process: sg.atla.f.c PID: 22716 UID: 10749 Flags: 0x3088be44 Package: sg.atla.f.c v1 (1.0.1) Fo…

[Node]yarn介绍、安装与常用命令 2024最新出炉!

介绍 Yarn 是一个由 Facebook 开发的开源的包管理工具,用于 JavaScript 应用程序的依赖管理。它旨在解决 npm(Node Package Manager)在处理依赖关系时的速度和安全性问题。Yarn 提供了如下特性: 速度:Yarn 通过缓存已…

系统架构的演变:从单体到微服务的旅程

文章目录 前言一、单体架构简图 二、垂直架构简图 三、水平架构简图 四、面向服务架构(SOA)简图 五、微服务架构简图 总结 前言 随着信息技术的快速发展,系统架构也在不断演变。从早期的单体架构到现代的微服务架构,每一次的变革都…

mac PyCharm 上传文件到远程服务器+远程服务器下载到本地

1 部署配置 选择SFTP name:test6 输入ssh账号和密码。保存密码和30s心跳。 2 目录映射 Local path(本地mac机器):/Users/clevercode/PycharmProjects/test6 Root path(远程服务机器):/home/…

【汇编】 13.3 对int iret和栈的深入理解

书中示例 assume cs:codecode segment start:mov ax,csmov ds,axmov si,offset lpmov ax,0mov es,axmov di,200hmov cx,offset end0-offset lpcldrep movsb ;lp到end0的指令传送到0:200处mov ax,0mov es,axmov word ptr es:[7ch*4],200hmov word ptr es:[7ch*42],0 ;设置7c表项…

Kafka-消费者-Consumer Group Rebalance设计

在同一个Consumer Group中,同一个Topic的不同分区会分配给不同的消费者进行消费,那么为消费者分配分区的操作是在Kafka服务端完成的吗?分区是如何进行分配呢?下面来分析Rebalance操作的原理。 方案一 Kafka最开始的解决方案是通过ZooKeeper的Watcher…

dubbo项目发布时Destroyed异常分析

1、问题现象 在发布项目时,elk有打印use dubbo version 2.6.2 is DESTROYED, can not be invoked any more!相关的报错日志,来提示dubbo消费者调用生产者时,生产者服务已经DESTROYED。 ChatGpt可知: 2、问题溯源 com.alibaba.dub…

序列到序列模型

一.序列到序列模型的简介 序列到序列(Sequence-to-Sequence,Seq2Seq)模型是一类用于处理序列数据的深度学习模型。该模型最初被设计用于机器翻译,但后来在各种自然语言处理和其他领域的任务中得到了广泛应用。 Seq2Seq模型的核…

【软件测试学习笔记6】Linux常用命令

格式 command [-options] [parameter] command 表示的是命令的名称 []表示是可选的,可有可无 [-options]:表示的是命令的选项,可有一个或多个,也可以没有 [parameter]:表示命令的参数,可以有一个或多…

VLAN区域间路由详解

LAN局域网 WAN 广域网 WLAN无线局域网 VLAN:虚拟局域网 交换机和路由器,协同工作后,将原来的一个广播域,切分为多个,节省硬件成本; 配置思路: 交换机上创建vlan交换机上的各个接口划分到对应的vlan中 T…

尚无忧【无人共享空间 saas 系统源码】无人共享棋牌室系统源码共享自习室系统源码,共享茶室系统源码

可saas多开,非常方便,大大降低了上线成本 UNIAPPthinkphpmysql 独立开源! 1、定位功能:可定位附近是否有店 2、能通过关键字搜索现有的店铺 3、个性轮播图展示,系统公告消息提醒 4、个性化功能展示,智能…

LED车灯电源解决方案SCT8162x、SCT2464Q、SCT71403Q、SCT71405Q、SCT53600等

随着LED封装技术的成熟和成本的下降,LED车灯渗透率迅速提升。车灯控制技术不断向节能化、智能化和个性化方向发展。ADB大灯配置门槛下探,像素数据急剧增加,LED 数量不断增加,陆续有智能车灯达到百万级像素,且动画效果需…

【算法小记】深度学习——循环神经网络相关原理与RNN、LSTM算法的使用

文中程序以Tensorflow-2.6.0为例 部分概念包含笔者个人理解,如有遗漏或错误,欢迎评论或私信指正。 卷积神经网络在图像领域取得了良好的效果,卷积核凭借优秀的特征提取能力通过深层的卷积操作可是实现对矩形张量的复杂计算处理。但是生活中除…

前端——框架——Vue

提示: 本文只是从宏观角度简要地梳理一遍vue3,不至于说学得乱七八糟、一头雾水、不知南北,如果要上手写代码、撸细节,可以根据文中的关键词去查找资料 简问简答: vue.js是指vue3还是vue2? Vue.js通常指的是…

Rust 错误处理(下)

目录 1、用 Result 处理可恢复的错误 1.1 传播错误的简写:? 运算符 1.2 哪里可以使用 ? 运算符 2、要不要 panic! 2.1 示例、代码原型和测试都非常适合 panic 2.2 当我们比编译器知道更多的情况 2.3 错误处理指导原则 2.4 创建自定义类型进行有效性验证 …