Kimi Chat四大更新详细解读!模型能力提升,支持语音输入输出!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

Kimi Chat,slogan是“帮你看更的世界”,严格来说,应该是“帮你看更的世界”,毕竟Kimi是一款以上下文长度而闻名的AI工具,从最初的20万汉字到目前正在内测的200万汉字上下文。

Kimi Chat本身是国内AI领域的一股清流,因为它免费,能联网搜素,多端支持(网页、App、小程序),更有20万汉字的逆天上下文处理长度,但这里面却不包括模型“聪明”。所以,尽管月之暗面(Moonshot AI,开发Kimi Chat的公司)在全网猛砸广告做推广,在短期内让Kimi“爆火”,但时间一长,用户和从业者们还是会回归冷静,因为最基础的模型能力才是一款AI应用的立身之本。

Kimi官方显然也明白这一点。就在上周,Kimi Chat官宣四大更新,其中就包括“更强的模型能力”。

1. 更强的模型能力

Kimi Chat集成的是月之暗面(Moonshot AI)的自研LLM模型moonshot-v1。这次更新后,基础模型更新为moonshot-v1-20240416版本,据Kimi官方描述,该基础模型具有“Better, Faster, Stronger”的特点。

  1. 联网模式下的速度提升

    • Kimi在联网模式下的回答速度得到了显著提升。这意味着用户在提出问题后,将体验到更短的等待时间,从而获得更快速的响应。

  2. 逻辑推理能力增强

    • Kimi官方表示,更新后的Kimi在数学和编程领域的逻辑推理能力得到了加强。这项能力是在本质上对模型“智商”提升最大的,因为推理能力是解决复杂问题的核心要素。

  3. 翻译能力提升

    • Kimi的中英翻译能力得到了进一步的优化,提高了语言的准确性。对于翻译能力而言,词汇和短语的直接翻译固然重要,但模型对语言习惯、文化差异和上下文的理解同样很重要,后者能确保翻译后的文本自然流畅,更符合目标语言的表达习惯。

  4. 其他体验优化

    • 解决了之前版本中存在的一些问题,如单行数学公式的输出格式不稳定及部分场景下回答不够精炼的问题。

模型能力实测

还是以一道“简单”的逻辑推理问题来测试。大概一个月前,Kimi并未通过测试,今天我们再来试一试。

中文题目:如果一个房间里有1000本书,我读了2本,房间里还有多少本书?请简洁回答。

3月4日测试中Kimi Chat的回答

测试详情在这篇文章里:Claude 3有点东西!这个看似简单的问题只有GPT-4和Claude 3回答正确!通义千问和讯飞星火表现同样亮眼!。

今天(4月22日)测试中Kimi Chat的回答

房间里还有1000本书。

这个问题的表述可能有点误导性,因为通常当我们说“读了一本书”,这并不会影响房间里书的总数。“读了”这个动作并不会从物理上移除或消耗掉书籍,它只是意味着你已经阅读了书籍的内容。所以,即使你读了2本书,这2本书仍然存在于房间里,因此房间里的书的总数并没有因为阅读这个动作而减少。

因此,房间里的书的总数仍然是1000本,因为阅读书籍并不会改变房间内书籍的物理数量。

点评

我测试了多次,Kimi均正确地回答出了该问题。

2. 常用语功能

常用语”是我个人认为很实用的一个功能,它使得用户可以添加和定制自己的提示词,从而提高对话的效率和便捷性。Kimi推出这个功能旨在通过减少重复输入和快速引导期望输出来提升用户体验。此外,Kimi Chat官方提供了一个较为丰富的预设提示词库,覆盖了包括PPT制作、文案撰写、职业规划等多个场景,帮助用户在需要时快速获得灵感和指导。

关于这个功能的详细解读,我曾在这篇文章里写过: 跟着Kimi Chat学习提示工程Prompt Engineering!让AI更高效地给你打工!

放一个官方提供的提示词示例,小伙伴们可以感受一下。

【🎤 面试模拟】你的私人面试mock伙伴,根据简历信息和求职岗位进行模拟面试

你是一个性格温和冷静,思路清晰的面试官Elian。我将是候选人,您将对我进行正式地面试,为我提出面试问题。

  • 我要求你仅作为面试官回复。我要求你仅与我进行面试。向我提问并等待我的回答。不要写解释。

  • 像面试官那样一个接一个地向我提问,每次只提问一个问题,并等待我的回答结束之后才向我提出下一个问题

  • 你需要了解用户应聘岗位对应试者的要求,包括业务理解、行业知识、具体技能、专业背景、项目经历等,你的面试目标是考察应试者有没有具备这些能力

  • 你需要读取用户的简历,如果用户向你提供的话,然后通过询问和用户经历相关的问题来考察该候选人是否会具备该岗位需要的能力和技能

##注意事项:

  • 只有在用户提问的时候你才开始回答,用户不提问时,请不要回答

##初始语句:

""您好,我是您应聘岗位的模拟面试官,请向我描述您想要应聘的岗位,并给您的简历(如果方便的话),我将和您进行模拟面试,为您未来的求职做好准备!"

3. 语音输入和输出

在LLM模型相关的语境中,"多模态"(Multimodal)是经常被提起的一个词。具体说来,多模态就是指模型能够处理并理解多种不同类型的输入数据或信息,包括但不限于:

  1. 文本:自然语言文本。

  2. 图像:视觉内容,例如图片或视频帧中的物体、场景和活动。

  3. 音频:声音信号,识别语音或非语音音频。

  4. 视频:结合视觉和音频信息,模型能够理解和分析视频内容。

  5. 结构化数据:如表格、数据库条目等,模型能够解析和推理结构化信息。

Kimi本次的更新中就包括了这么一条“语音”输入和输出的支持。也就是,现在可以和Kimi Chat语音对话,它也能够把生成的内容以语音播报的形式读出来。

和ChatGPT一样,目前通过官方途径使用语音输入,只支持移动端,即App和小程序端,而网页端是不支持的。当然,ChatGPT网页端可以通过第三方插件使用语音输入的功能。

语音功能实测

小程序端

App端

操作简单,在文本输入框左边有一个语音按钮,点击后即可进入语音输入的模式。经过测试,Kimi Chat支持中文和英文语音输入,也支持语音输出,有点类似于ChatGPT的Text To Speech (TTS,文本转语音)功能。不足之处就是目前仅支持2种音色的切换,男生和女生。另外,朗读出的声音听起来机器味儿很浓,没有什么感情。

4. 增强搜索引用展示

这次更新中,Kimi Chat在网页版中新增了数字脚注功能,通过鼠标悬停展示原文段落和点击标题直接跳转原文链接的方式,目的是提升搜索结果的可追溯性和用户的交互体验。

在联网搜索的结果中,会直接将引用的来源以数字脚注的形式展示在回答里。

把鼠标悬停在数字脚注上时,会自动展示相关的引用信息。

总结

月之暗面官方终于开始重视起模型的基础能力了,毕竟这才是AI工具长期的核心竞争力


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/2069.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot集成Sharding-JDBC实现主从同步

SpringBoot集成Sharding-JDBC实现主从同步 1.mysql主从配置2.application.properties文件配置3.测试3.1 查询数据3.2 添加数据 1.mysql主从配置 详细内容请参考上一篇文章:MySQL8.0以上实现主从同步配置 2.application.properties文件配置 # ShardingSphere conf…

阿斯达年代记怎么下载 阿斯达年代记三强争霸下载教程

阿斯达年代记怎么下载 阿斯达年代记三强争霸下载教程 阿斯达年代记是一款三国争霸类型的游戏,在游戏中大家可以体验到三权争霸的刺激场景,在战场中大家不仅可以体验到体验到文化交织还可以感受到战场的残酷,本期小编将会给大家带来阿斯达年代…

基于vue+node+mysql的视频校对系统

一、登录注册:包括登录,注册,忘记密码,验证码等常用点。 二、用户管理:包括用户的增删改查 三、权限管理(请增加这个权限:任务分配——只有管理者才能发布和删除任务;管理员设置。 四…

R语言绘制动态网络图Network教程WGCNA

今天分享的笔记是使用NetworkD3对WGCNA的共表达网络进行可视化,创建交互式动态网络图,展示基因之间的相互关系,可以用于转录组或者其他调控网络展示。 加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同…

MQTT服务器EMQX的安装和使用(Windows)

一、下载地址: 下载 EMQX 二、安装环境: Windows Server2016 16G 500G 三、启动服务: 下载文件解压后放入以下目录(注意,目录名一定是英文,否则会造成启动不成功!)&#xff1a…

mybatis与mybatisplus

mybatis 基本使用 整合springboot 1.添加依赖 2.添加配置 spring:# 数据源相关配置datasource:username: rootpassword: 123456driver-class-name: com.mysql.cj.jdbc.Driver#时区必须配置否则报错,注意数据库名切换为自己的数据库名称url: jdbc:mysql://127.0.0.1/ithei…

论文略读:OpenGraph: Towards Open Graph Foundation Models

arxiv 2023 1 intro Graph大模型希望OpenGraph能够捕捉通用的拓扑结构模式,对测试数据进行Zero-shot预测 仅通过前向传播过程,就可以对测试图数据进行高效的特征提取和准确预测模型的训练过程在完全不同的图数据上进行,在训练阶段不接触测试…

【2024年5月备考新增】】软考极限冲刺 《项目质量管理1》

1 知识点 1.1 质量成本 一致性成本 项目花费资金规避失败 预防成本:(打造某种高质量产品) 培训文件过程设备完成时间评估成本:(评估成本) 测试破坏性试验损失检查非一致性成本 项目前后花费的资金(由于失败) 内部失败成本:(项目中发现的失败) 返工报废外部失败成本:…

windows安装nc命令的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

(mac)Prometheus监控之Node_exporter(CPU、内存、磁盘、网络等)

完整步骤 1.启动 Prometheus 普罗米修斯 prometheus --config.file/usr/local/etc/prometheus.yml 浏览器访问 http://localhost:9090/targets 2.启动Node_exporter node_exporter 访问:http://localhost:9100 3.启动grafana brew services start grafana 访问…

力扣146. LRU 缓存

Problem: 146. LRU 缓存 文章目录 题目描述思路复杂度Code 题目描述 思路 主要说明大致思路,具体实现看代码。 1.为了实现题目中的O(1)时间复杂度的get与put方法,我们利用哈希表和双链表的结合,将key作为键,对应的链表的节点作为…

2024年前端技术发展趋势

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

如何用idm下载迅雷文件 idm怎么安装到浏览器 idm怎么设置中文

如果不是vip用户使用迅雷下载数据文件,其下载速度是很慢的,有的时候还会被限速,所以很多小伙们就开始使用idm下载迅雷文件,idm这款软件最大的优势就是下载速度快,还有就是具备网页捕获功能,能够下载网页上的…

ESD+显示模组

ESD测试是指对消费电子设备进行静电放电测试,通常用于检查设备是否具有防静电能力,以及在正常使用过程中是否容易受到静电干扰,通过进行ESD测试,可以评估设备的抗静电能力,并采取相应的措施以提高设备的耐静电性能。 E…

小米汽车超级工厂智能物流

导语 大家好,我是智能仓储物流技术研习社的社长,老K。专注分享智能仓储物流技术、智能制造等内容。 小米汽车超级工厂以其先进的智能物流系统,标志着汽车制造业在智能化和自动化方面迈出了重要一步。该工厂采用物联网(IoT)技术,实…

架构师系列-MYSQL调优(五)- JOIN、in及exists优化

JOIN算法原理 JOIN 是 MySQL 用来进行联表操作的,用来匹配两个表的数据,筛选并合并出符合我们要求的结果集。JOIN 操作有多种方式,取决于最终数据的合并效果。常用连接方式的有以下几种: 驱动表的定义 什么是驱动表 ? 多表关联查询时,第一…

Bert语言大模型基础

一、Bert整体模型架构 基础架构是transformer的encoder部分,bert使用多个encoder堆叠在一起。 主要分为三个部分:1、输入部分 2、注意力机制 3、前馈神经网络 bertbase使用12层encoder堆叠在一起,6个encoder堆叠在一起组成编码端&#xf…

Spring Boot中判断轨迹数据是否经过设置的打卡点,且在PGSQL中把点拼接成线,判断某个点是否在线上或在线的50米范围内

问题描述 轨迹数据判断是否经过打卡点,轨迹数据太多,循环判断的话非常消耗内存。解决办法只需要把所有轨迹数据点拼成了一条线,然后只需要循环打卡点即可,打卡点不多,一般不会超过100个,如果多的话&#x…

R可视化:桑基图展示数据层流动

介绍 以桑基图形式展示数据分布情况 加载R包 knitr::opts_chunk$set(message = FALSE, warning = FALSE) library(tidyverse) library(ggalluvial)# rm(list = ls()) options(stringsAsFactors = F) options(future.globals.maxSize = 10000 * 1024^2) 导入数据 metadata…

【计算机毕业设计】大学校园图书角管理系统——后附源码

🎉**欢迎来到我的技术世界!**🎉 📘 博主小档案: 一名来自世界500强的资深程序媛,毕业于国内知名985高校。 🔧 技术专长: 在深度学习任务中展现出卓越的能力,包括但不限于…