微软microsoft推出了最新的小型但强大的开源语言AI模型Phi-2

微软推出了最新的小型开源语言模型 Phi-2。该模型只有 27 亿个参数,却能超过比它大 25 倍的模型的性能。Phi-2 是微软 Phi 项目的一部分,旨在制作小而强大的语言模型。该项目包括 13 亿参数的 Phi-1,据称在 Python 编码方面实现了最先进的性能,以及擅长常识推理和语言理解的 Phi-1.5。Phi-2 比之前的版本更大,但性能更强。

它能实现与参数少于 130 亿个模型类似的最先进的性能。研究人员表示,与之前的 Phi 模型相比,该AI模型在输出方面更安全,并且比一些现有模型在毒性和偏差方面表现更好。为了提高 Phi 的性能,微软研究人员专注于使用 “教科书质量” 的数据进行训练,并利用合成数据集来支持模型。Phi-2 在各种基准测试中的表现优于 Meta 的 Llama 2-7b 和 Mistral-7B,甚至在编码方面超过了 Llama 2 的 700 亿参数版本。微软表示,Phi-2 的小尺寸使其成为研究人员的理想游乐场,可用于探索机械可解释性、安全性改进或对各种任务的微调实验。

微软研究人员还将 Phi-2 与谷歌新推出的 Gemini Nano 进行了测试,结果表明 Phi-2 在流行基准测试中的得分超过了 Gemini Nano。Phi-2 现在可以通过 Azure AI Studio 模型目录和 Hugging Face 获得。但需要注意的是,Phi-2 不能用于商业用途,只能用于非商业、研究导向的活动。任何试图以获取商业利益为目的的行为都将违反许可条款。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/224730.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

十几个软件测试实战项目【外卖/医药/银行/电商/金融】

项目一:ShopNC商城 项目概况: ShopNC商城是一个电子商务B2C电商平台系统,功能强大,安全便捷。适合企业及个人快速构建个性化网上商城。 包含PCIOS客户端Adroid客户端微商城,系统PC后台是基于ThinkPHP MVC构架开发的跨…

网站服务器/域名/备案到底有什么关联?

​  在一个网站的组成中,网站服务器、域名、备案这几个要素是要被常提到的。在谈及三者关联之前,我们先了解下三者的各自概念。 域名:它是网站的唯一标识符,通俗理解来说就是用户在浏览器地址栏中输入的网址。一般来说&#xff…

linux电源管理

【电源管理】Linux电源管理之RuntimePM模型_pm_runtime_put-CSDN博客 一文搞懂Linux电源管理(合集) - 知乎 Linux电源管理之 Power Domain-CSDN博客 电源管理子系统 - 蜗窝科技

迅为RK3588开发板瑞芯微国产化工业ARM核心板AI人工智能

性能强 iTOP-3588开发板采用瑞芯微RK3588处理器,是全新一代AloT高端应用芯片,采用8nm LP制程,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构,主频高达2.4GHz,8GB内存,32GB EMMC。 四核心…

2023.12.15 FineBI与kettle

1.结构化就是可以用schema描述的数据,就是结构化数据,能转为二维表格, 如CSV,Excel, 2.半结构化就是部分可以转换为二维表格,如JSON,XML 3.非结构化数据,就是完全无法用二维表格表示的数据,如Word文档,Mp4,图片,等文件. kettle的流程 新建转换-构建流图-配置组件-保存运行 使…

Java开发工具积累(符合阿里巴巴手册规范)

文章目录 一、命名规约二、集合篇1. 栈、队列、双端队列2. List的升序倒序3. Map的升序降序4. 二维数组排序5. 集合之间的转换6. Map键值对遍历 三、并发篇1. 创建线程池2. ThreadLocal的使用 四、时间篇1. LocalDateTime的使用2. String、Date、LocalDateTime转换 五、控制块1…

【Hive】——DDL(TABLE)

1 查询指定表的元数据信息 如果指定了EXTENDED关键字,则它将以Thrift序列化形式显示表的所有元数据。 如果指定了FORMATTED关键字,则它将以表格格式显示元数据。 describe formatted student;2 删除表 如果已配置垃圾桶且未指定PURGE&…

220V转3.3V单片机电源供电芯片WT5107

220V转3.3V单片机电源供电芯片WT5107 今天给大家介绍一款高效、精准的开关电源恒压控制驱动芯片WT5107。 WT5107适用于85VAC~265VAC全范围输入电压的非隔离Buck、Buckboost拓扑结构,220V降3.3V适用于小家电、白色家电等电源的驱动。WT5107内部集成高压功率管&#…

C#Winform+DevExpress打开相机拍照功能实例

1,先展示一下界面,点击打开相机会打开另一个界面 如下所示; 2,点击上图拍照 按钮 会把图片显示在第一个界面上 3, Dev还可以打开指定的相机,比如只打开平板电脑的后置摄像头 以Microsoft 为例 点击打开…

服务器数据恢复-EqualLogic PS存储硬盘坏道导致存储不可用的数据恢复案例

服务器数据恢复环境: 一台DELL EqualLogic PS系列存储,存储中有一组由16块SAS硬盘组成的RAID5。上层是VMFS文件系统,存放虚拟机文件。存储上层分了4个卷。 服务器故障&检测: 存储上有2个硬盘指示灯显示黄色,磁盘出…

Julia GitHub 组织及应用

系列文章目录 前言 Julia 语言的独特之处在于社区自我组织成 GitHub 组织的方式。这使得协作和结构化程度更高,最终使每个社区都能自我维持。 以下是按领域分类的 Julia GitHub 组织的非综合列表。如果您发现此处未列出的组织,请将其添加到相应的组中。…

华为数通——企业双出口冗余

目标:默认数据全部经过移动上网,联通低带宽。 R1 [ ]ip route-static 0.0.0.0 24 12.1.1.2 目的地址 掩码 下一条 [ ]ip route-static 0.0.0.0 24 13.1.1.3 preference 65 目的地址 掩码 下一条 设置优先级为65 R…

面向对象设计与分析40讲(24)上下文context在软件设计中的应用--依赖注入的典型应用

文章目录 上下文典型应用context的标准范例 上下文 首先,我们应该谈谈什么是上下文。 上下文(Context)是指某个事件、任务或问题所处的特定环境或情境。它包含了相关的信息、条件、状态和对象,用于帮助理解、解释和处理当前的情…

word2vec,BERT,GPT相关概念

词嵌入(Word Embeddings) 词嵌入通常是针对单个词元(如单词、字符或子词)的。然而,OpenAI 使用的是预训练的 Transformer 模型(如 GPT 和 BERT),这些模型不仅可以为单个词元生成嵌入…

Graylog 中日志级别及其对应的数字

在 Graylog 中,日志级别 level 通常使用数字表示,数字越低表示日志级别越高。以下是常见的日志级别及其对应的数字表示: DEBUG(调试):对应数字 7。INFO(信息):对应数字 …

全志V3s之Kernel移植

1、安装一些依赖: sudo apt install gcc flex bison libssl-dev bc kmod2、下载源码: Linux的kernel官网:Kernel官网,可以直接去荔枝派的Github仓库下载:荔枝派的Github仓库 git clone -b zero-5.2.y --depth 1 htt…

剑指 Offer(第2版)面试题 33:二叉搜索树的后序遍历序列

剑指 Offer(第2版)面试题 33:二叉搜索树的后序遍历序列 剑指 Offer(第2版)面试题 33:二叉搜索树的后序遍历序列解法1:递归 剑指 Offer(第2版)面试题 33:二叉搜…

高空抛物屡禁不止?智能分析视频监控如何保障空中安全?

日前,长春高空抛物事件已经落下帷幕,此事件的爆出一时间轰动全网,周某漠视他人生命的行为令人愤怒,而年轻女孩的生命也被无情剥夺。为什么高空抛物事件如此频繁,还屡禁不止呢?面对这样令人痛心的新闻作为智…

锁--07_1----插入意向锁-Insert加锁过程

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 插入意向锁MySQL执行插入Insert时的加锁过程MySQL官方文档MySQL insert加锁流程1.加插入意向锁2.判断插入记录是否有唯一键3. 插入记录并对记录加X锁插入意向锁----…

Vue 3与Composition API:入门指南

Vue 3是Vue框架的最新版本,它引入了Composition API,这是一个全新的API,与Vue 2的Options API有很大的不同。下面是Vue 3和Composition API的一些重要变化和使用要点: 1. **Setup函数** - 在Vue 3中,每个页面的入口…