AI大模型之花,绽放在鸿蒙沃土

0c4b422d25d4978abd7d70e132a29e6c.jpeg

随着生成式AI日益火爆,大语言模型能力引发了越来越多对于智慧语音助手的期待。

我们相信,AI大模型能力加持下的智慧语音助手一定会很快落地,这个预判不仅来自对AI大模型的观察,更来自对鸿蒙的了解。鸿蒙一定会很快升级大模型能力,放眼业界似乎也只有鸿蒙能够在短期实现这一点。

之所以这样说,是因为让大语言模型融入终端生态不仅是个算法问题,更需要让AI模型能够了解、指挥、交互操作系统生态中的海量能力。这不是短期内能够做到的,而是需要从操作系统与基础软件层面,不断去发展AI,适应AI,最终让大语言模型、生成式AI代表的新AI能力,水到渠成、瓜熟蒂落般成为用户体验的一部分。

而华为恰恰是最早将AI能力带到手机中的厂商,鸿蒙系统从最初就基于智能技术来打造和演进。可以说,AI就是鸿蒙最浓墨重彩的基因之一。这种基因会不断生长,满足更多用户对智能体验的想象和期待。

8月2日,华为常务董事、终端BG CEO余承东在微博分享了一个视频。内容是向用户“剧透”了HarmonyOS操作系统的一项重磅功能:让小艺来帮助用户生成内容。

accae7d0932d44f7cbcbc49759677f7d.png

从微博中展示的小艺新能力来看,其已经具备了AI大模型与生成式AI的典型特征,创作的一则HDC邀请文辞恰当、逻辑通顺,且能够准确描绘出关键词。

这也意味着,即将到来的鸿蒙4,极有可能带来业内首个植入系统的AI大模型语音助手。

这似乎是一段《红楼》里的木石前盟,无更无改,注定发生。鸿蒙与AI,就花开在这个夏天。

AI基因

鸿蒙一以贯之

46e3045a5ccee76f5bebbbe139e3c5c0.png

早在2017年,华为就在手机端发力AI能力。此后多年当中,AI摄影、AI智慧助手等大量AI能力逐渐成为了华为的招牌。而很多朋友没有注意到的是,今天广为人知的鸿蒙特性,也是建立在AI技术底座上的。

软件解耦、新一代物联网技术与AI,让鸿蒙从诞生之初就具备了更加智能的多终端协同体验。它通过软总线、分布式技术,将多个物理上相互隔离的设备融合成一个“超级终端”。而“超级终端”想要发挥作用,首先要解决两个问题:一是操作系统需要理解用户所在场景,二是用户可以灵巧、便捷地完成多终端操作。这两个目标,都需要大量依靠AI技术来实现。

在2019年正式发布的HarmonyOS系统中,就可以看到随处可见的AI算法与AI体验。

随后,在鸿蒙的高速进化中,智能化能力也随之演进。2021年6月,华为正式发布HarmonyOS 2,带来了统一控制中心、超级终端、万能卡片全新体验,大量用户开始了解、习惯全新的鸿蒙特性。

05aef306889e40b7b461eafc72f28e98.jpeg

2022年7月,HarmonyOS 3开启升级,带来了包括超级终端、万能卡片、流畅性能、隐私安全等特性在内的六大升级,智能化体验也得到了进一步提升。

提起鸿蒙生态中的AI能力,就不得不提到小艺。为了管理海量设备与服务,语音助手的中枢作用必不可少。因此,小艺基于其AI能力,就成为了鸿蒙生态所有设备的统一入口、服务精准推荐的统一助手。同时,通过AI弹性部署、优选触点、协同服务等技术,小艺也在不断提升自身的智能化体验。

由此可见,鸿蒙生态不是突然要发力AI,而是鸿蒙就发端于AI,成长于AI,并成为AI技术持续演进的沃土。深种在鸿蒙土壤中的AI灵根,在等它的花信年华。

c7b9969d1e4809f7158efc8616ab6247.png

大模型与小艺

水到渠成的缘分

在今天,智能语音助手已经无处不在,但它的体验却依旧有很多问题。比如说:

1.AI对话依旧不流畅,尤其是多轮对话、中长期记忆对话体验不佳,从而导致用户缺乏持续打开语音助手,提出复杂需求的意愿,久而久之降低了语音助手的使用价值。

2.语音助手的自然语言理解能力不强,逻辑推理能力不足。产生了用户必须用严格的词汇和读音才能准确进行语音交互,日常化、口语化的对话大量无法识别。这一点对于老人、孩子以及不了解AI语音交互的用户来说非常不友好。

3.语音助手仅够唤起服务,不能够生成内容。这就导致语音助手能够带给用户的价值极大降低,难以培养用户持续的语音交互习惯。

不难发现,大语言模型与生成式AI的能力,恰好可以填补语音助手的这些缺憾。但在此前,大模型的开发者普遍集中于AI厂商,距离消费终端的应用场景与软硬件体系距离较远。

如何才能弥补这个距离呢?答案是需要一个水到渠成,瓜熟蒂落的过程。

0e24be76e01de6d3c3e10f6bbd45c53f.png

大模型走向终端场景,首先需要算法本身的能力。这方面,华为已经有了足够的积累。7月6日,来自华为云的盘古气象(Pangu-Weather)大模型登上《Nature》正刊。这项研究成功解决了现有AI气象预报无法处理不均匀的 3D 气象数据等关键问题,让其成为了首个精度超过传统数值预报方法的 AI 方法,并且预测速度提升了超过10000 倍,可秒级完成对全球气象的预测。

在多年的积累下,盘古系列大模型已经在多个领域走到了全球前列。加上华为在AI开发平台、AI开发框架领域的积累,都让大模型与鸿蒙结合变得更加顺利、周全。

而在终端侧,华为对AI技术进行了丰富的探索。比如说,我们此前已经看到了小艺的智慧搜图功能。这一功能就结合AI多模态能力,通过对泛化语义的理解搭配模型小型化处理技术,率先在业界实现了手机自然语言搜图。

从模型到工具,从软件能力到开发者生态,鸿蒙都做好了准备,迎接AI大模型的到来。浪漫一点说,鸿蒙多年的AI耕作,可能就是在等待这个夏天。

鸿蒙4的AI约定

就在这天花开

f5a899f5935119df7809fcef91d25f8c.png

大语言模型、对话式AI的可能性,就应该在终端语音助手的角色上绽放出来,而其花开处,可能只会在鸿蒙的花园里。

从推测角度来看,鸿蒙4中我们可能就会看到深度融合了大语言模型的小艺。虽然我们现在对其具体能力还不得而知,但结合大模型的能力以及鸿蒙过往的表现,还是可以预判一下接下来会发生什么。

df39d6f39967aa4c51e9ae10731b7b25.png

在这里,我们不妨一起来进行些畅想:

1.像和真人对话一样与小艺交流。

大模型带来的强泛化,强鲁棒特性,极大增强了AI的自然语言处理能力。说白了,就是让AI可以更好理解语言,无论是谐音、比喻、指代都不成问题。这样的能力毫无疑问将是接下来鸿蒙4的升级重点。我们接下来将会像和真人一样与小艺交流,甚至忽略它语音助手的真实身份。

2.看到,听到,也能服务到。

基于小艺来唤醒服务闭环,是鸿蒙系统的一大特性。那么基于大模型带来的多模态理解能力,有理由相信接下来小艺会加强服务的触达能力。让小艺听和看,都将成为鸿蒙4的服务入口。

3.把简单留给自己,把复杂留给小艺。

在大语音模型刚刚兴起的时候,很多人都愿意故意说一大段话,让AI去逐层理解分析其中的意思。如果说在当时这只是游戏,那么在鸿蒙4中大模型的逻辑推理就会变成能力,更多更复杂的任务,将会由小艺在鸿蒙的世界中来执行。

4.不仅是找东西,更会创造东西。

长久以来,语音助手扮演的角色都是寻找服务和信息的入口。但在大模型时代,语音助手可以不止找到,而是去生成和创造。接下来,或许我们将依靠小艺来完成办公、生活、学习中的各种任务,帮我们创造各种内容。

不妨带着这些畅想,一起去看看其中有几个能够在鸿蒙4当中实现。鸿蒙与AI,这段木石盟注定要在这个夏天花开结果。

答案,就藏在接下来的HDC当中。当然,鸿蒙与AI的更多情缘还藏在未来,藏在万千开发者的脑洞中,藏在无数用户的期待里。

bfdaafc09e2334e8fd4f2712caf8b1be.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/21714.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

拥抱创新:用Kotlin开发高效Android应用

拥抱创新:用Kotlin开发高效Android应用 引言 在当今数字时代,移动应用已经成为人们生活中不可或缺的一部分。无论是社交媒体、电子商务还是健康管理,移动应用已经深刻地影响了我们的生活方式。随着移动设备的普及和功能的增强,A…

Android getDrawable()和getColor()

Android getDrawable() 1.过时代码 虽然过时,但是不妨碍使用 context.getResources().getDrawable(R.drawable.xxx) 2.建议代码 context.getDrawable(R.drawable.xxx) 有API限制 3.最新代码 ContextCompat.getDrawable(getContext(), R.drawable.xxx); 有A…

安达发|模具制造业对APS软件需求大幅增长

近年来,中国模具工业以每年15%左右的增速速度快速发展。然而,对于大型、精密、复杂及长寿命模具的需求增长将远超过每年15%的增幅。为应对这一挑战,模具制造业对APS软件的需求大幅度增长,助力行业提速发展。 据统计,中…

linuxARM裸机学习笔记(3)----主频和时钟配置实验

引言:本文主要学习当前linux该如何去配置时钟频率,这也是重中之重。 系统时钟来源: 32.768KHz 晶振是 I.MX6U 的 RTC 时钟源, 24MHz 晶振是 I.MX6U 内核 和其它外设的时钟源 1. 7路PLL时钟源【都是从24MHZ的晶振PLL而来…

一个3年Android的找工作记录

作者:Petterp 这是我最近 1个月 的找工作记录,希望这些经历对你会有所帮助。 有时机会就像一阵风,如果没有握住,那下一阵风什么时候吹来,往往是个运气问题。 写在开始 先说背景: 自考本,3年经验&#xff0…

回归预测 | MATLAB实现SO-CNN-LSTM蛇群算法优化卷积长短期记忆神经网络多输入单输出回归预测

回归预测 | MATLAB实现SO-CNN-LSTM蛇群算法优化卷积长短期记忆神经网络多输入单输出回归预测 目录 回归预测 | MATLAB实现SO-CNN-LSTM蛇群算法优化卷积长短期记忆神经网络多输入单输出回归预测预测效果基本介绍模型描述程序设计参考资料 预测效果 基本介绍 MATLAB实现SO-CNN-LS…

ASP.NET Core学习路线图

说明 1. 先决条件 - [C#](https://www.pluralsight.com/paths/csharp) - [Entity Framework](https://www.pluralsight.com/search?qentity%20framework%20core) - [ASP.NET Core](https://www.pluralsight.com/search?qasp.net%20core) - SQL基础知识 2. 通用开发技能 -…

uni-app:实现分页功能,单击行获取此行指定数据,更改行样式

效果&#xff1a; 分段解析代码 分页功能实现&#xff1a; 一、标签 1、搜索栏-模糊查询 <!-- 搜索框--><form action"" submit"search_wip_name"><view class"search_position"><view class"search"><…

SpringBoot项目中的web安全防护

最近这个月公司对项目进行了几次安全性扫描&#xff0c;然后扫描出来了一些安全漏洞&#xff0c;所以最近也一直在修复各种安全漏洞&#xff0c;还有就是最近在备考软考高级系统架构设计师&#xff0c;也刚好复习到了网络安全这一个章节&#xff0c;顺便将最近修复的安全漏洞总…

Debian/Ubuntu 安装 Chrome 和 Chrome Driver 并使用 selenium 自动化测试

截至目前&#xff0c;Chrome 仍是最好用的浏览器&#xff0c;没有之一。Chrome 不仅是日常使用的利器&#xff0c;通过 Chrome Driver 驱动和 selenium 等工具包&#xff0c;在执行自动任务中也是一绝。相信大家对 selenium 在 Windows 的配置使用已经有所了解了&#xff0c;下…

Jmeter 压测工具使用手册[详细]

1. jemter 简介 jmeter 是 apache 公司基于 java 开发的一款开源压力测试工具&#xff0c;体积小&#xff0c;功能全&#xff0c;使用方便&#xff0c;是一个比较轻量级的测试工具&#xff0c;使用起来非常简 单。因为 jmeter 是 java 开发的&#xff0c;所以运行的时候必须先…

在 3ds Max 中使用相机映射将静止图像转换为实时素材

推荐&#xff1a; NSDT场景编辑器 助你快速搭建可二次开发的3D应用场景 1. 在 Photoshop 中准备图像 步骤 1 这是我将在教程中使用的静止图像。 这是我的静态相机纸箱的快照。 静止图像 步骤 2 打开 Photoshop。将图像导入 Photoshop。 打开 Photoshop 步骤 3 单击套索工…

windows物理机 上安装centos ,ubuntu,等多个操作系统的要点

一、摘要 一般情况下&#xff0c;我们的笔记本或工作电脑都默认安装windows 分几个区&#xff0c;当下是win7 win8 win 10 win11 等&#xff0c;突然我们有需求需要安装个centos &#xff0c;后面我们应当怎么做&#xff0c;要点是什么&#xff1f;一定要根据网上的贴子一步步来…

Word导出高清PDF

通过word导出pdf清晰度较高的方法_word如何导出高分辨率pdf_Perishell的博客-CSDN博客通过打印机属性设置&#xff0c;让word打印出比较高清的pdf_word如何导出高分辨率pdfhttps://blog.csdn.net/weixin_45390670/article/details/129228568?ops_request_misc%257B%2522reques…

学习笔记|C251|STC32G单片机视频开发教程(冲哥)|第三集:开发环境搭建和程序下载

文章目录 1.STC-ISP软件的下载2.STC32手册下载3.PDF阅读器下载4.学会PDF阅读器查阅手册5.跟着手册搭建C251开发环境Tips:如何同时安装Keil的C51、C251和MDK 6.程序包的下载7.第一个工程的编译和下载 原作者/主讲人&#xff1a;冲哥 原始视频地址 1.STC-ISP软件的下载 STC-ISP …

应急响应-主机后门webshell的排查思路(webshell,启动项,隐藏账户,映像劫持,rootkit后门)

0x00 windows主机后门排查思路 针对主机后门windows&#xff0c;linux&#xff0c;在对方植入webshell后&#xff0c;需要立即响应&#xff0c;排查出后门位置&#xff0c;以及排查对外连接&#xff0c;端口使用情况等等 排查对外连接状态&#xff1a; 借助工具&#xff1a;p…

后端进阶之路——浅谈Spring Security用户、角色、权限和访问规则(三)

前言 「作者主页」&#xff1a;雪碧有白泡泡 「个人网站」&#xff1a;雪碧的个人网站 「推荐专栏」&#xff1a; ★java一站式服务 ★ ★前端炫酷代码分享 ★ ★ uniapp-从构建到提升★ ★ 从0到英雄&#xff0c;vue成神之路★ ★ 解决算法&#xff0c;一个专栏就够了★ ★ 架…

两数相加 II

给你两个 非空 链表来代表两个非负整数。数字最高位位于链表开始位置。它们的每个节点只存储一位数字。将这两数相加会返回一个新的链表。 你可以假设除了数字 0 之外&#xff0c;这两个数字都不会以零开头。 示例1&#xff1a; 输入&#xff1a;l1 [7,2,4,3], l2 [5,6,4] 输…

什么是 webpack?

Webpack 介绍 什么是 webpack&#xff1f; :::tip 官方描述 webpack 是一个用于现代 JavaScript 应用程序的静态模块打包工具。当 webpack 处理应用程序时&#xff0c;它会在内部从一个或多个入口点构建一个 依赖图(dependency graph)&#xff0c;然后将你项目中所需的每一个…

【SCSS】网格布局中的动画

效果 index.html <!DOCTYPE html> <html><head><title> Document </title><link type"text/css" rel"styleSheet" href"index.css" /></head><body><div class"container">&l…