定位AI交互技术服务商,声智科技完成近亿元A轮融资,将拓展安防、汽车等新场景

来源:36Kr

摘要:“语音交互是人工智能相关技术的重要应用场景,而语音交互的核心和关键突破点在于远场。而国内真正有实力做好远场技术的团队是非常稀少的。”


定位人工智能交互技术服务商的声智科技(SoundAI),宣布已于2017年9月份完成近亿元人民币A轮融资,本轮融资由百度、蓝港互动、洪泰基金、峰瑞资本联合财务投资,北京银行以投贷联动方式参与。融资将用于AI核心技术研发,持续提升远场语音交互产品的体验,拓展更多语音智能的垂直场景,服务更多品牌和中小企业客户。


声智科技成立于2016年4月,核心团队来自于中国科学院,公司聚焦声学技术、人工智能交互领域,致力于解决当前关键的远场语音交互问题,提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA到工业设计的Turnkey产品方案。公司成立之初,曾获得峰瑞资本、润浙资本等1200万元天使轮融资。2016年年底,获得1600万元Pre-A轮融资,由洪泰基金领投,峰瑞资本跟投。


声智科技告诉36氪,目前技术方面,公司的声学通信、麦克风阵列、远场语音唤醒和识别、端到端深度学习等软硬融合技术在行业具有优势;产品方面,搭载声智核心技术的产品包括360智能摄像机、360儿童故事机和小米AI音箱等已经大规模出货,另有一些合作产品即将问世;合作方面,声智科技在基础层与ARM、NVIDIA、Xilinx、Cypress、Knowles等芯片和器件厂商建立合作,在平台层与百度、阿里、腾讯、思必驰等AI平台企业达成合作。


人工智能时代,智能语音很可能是AI最先落地的突破口,已经成为全球互联网巨头关注的焦点和角逐的战场。从智能语音交互技术起家的公司,不少公司开始转型为AI平台或者全栈公司。声智科技则将自己定位于解决声学、AI智能交互的方案提供商,做好平台和客户之间的桥梁作用。之所以选择这种商业模式,是因为当前企业客户的需求千差万别,大客户更倾向于定制化,而AI产品依赖的算法、数据、软件、硬件和平台还无法解决这类差异化。这将直接导致AI平台很难几何级扩展客户,客户也很难直接快速接入AI平台,这甚至让国外巨头放弃了对生态伙伴的支持,而将重心转移到自行开发AI产品。声智科技解决的核心问题之一就是技术和服务的标准化,一开始就按照规模化和标准化应用架构设计,而且历经了合作厂商的检验,这就对于器件、芯片和平台等合作伙伴的扩展有帮助。


垂直场景拓展是AI落地中尤为重要的环节。创立之初,声智科技的主要场景聚焦在智能音响、家用摄像头、儿童机器人、智能电视和盒子等智能家居场景。这也是2016年、2017年智能语音最热的领域之一,为声智带来了小米、360、联想等客户。与此同时,团队也一直在拓展智能安防、智能汽车、智能金融、智能教育等场景。一般来说,有声音的场景都属于声智科技的业务范畴,声智科技通常与合作伙伴紧密合作,共同开发和服务这些不同行业的客户。目前,已经与行业客户达成一些关键合作,并进行了技术及产品研发,相关产品也会在后续继续推出。


AI场景的拓展,不仅意味着重新定义新的需求,也意味着器件、芯片、数据和算法等技术的不同。以声视频融合的智能安防为例,关键问题就是如何解决恶劣环境下超远场(10米以外)的语音获取和识别以获取高质量的声音信息,核心技术就是超远场拾音、超远场降噪和去混响、超远场语音识别等,但是以往因为这些技术难点未能充分解决,实现效果一直不理想,造成专业安防领域长期没有高质量声音数据的尴尬。再以语音转录为主的智慧法院为例,关键问题就是如何解决在众多会议系统上获取高质量局部场的声音信息,以保证语音识别的准确率,核心技术就是局部场的拾音和语音识别以及技术兼容性问题,这些技术难题都需要一个标准化方案。


企业客户往往除关注技术的实现水平外,也会看重产品是否已经被验证。声智科技认为,因为团队起步较早,已经和一些知名客户合作推出了产品,历经了企业客户和广大用户的苛刻检验和口碑验证,这方面具有一定的优势。而在新的场景中,团队一般首选行业最具代表性的标杆客户,帮其解决行业中最为困难的问题,进而再标准化拓展其他客户。


除了面向企业客户,声智科技也为开发人员设计和供应AI开发板,普及智能语音的应用开发技术。目前已经推出十多款型号的麦克风阵列开发套件,方便各个不同场景的智能语音应用开发,同时与百度合作的DuerOS开发套件也将随后发布。


随着互联网巨头、大量资本入局,智能语音产品也正逐步成熟。在获得近亿元的投资后,声智科技也有自己的规划。技术方面,声智科技计划持续更新和迭代技术,解决更复杂声学场景下的远场语音唤醒和识别、远场声纹识别、声视频融合交互、多人追踪和识别等影响用户体验的关键问题,以及超远场拾音与识别、局部场识别与重放等行业关键技术。产品方面,将与麦克风器件厂商和芯片厂商合作,联手研发下一代人工智能交互的专用器件和芯片。运营方面,基于研发生产、数据处理、应用开发、工业设计和内容服务的大量需求,以及对于声学实验和语音测试的专业需求,声智科技正与地方政府合作,筹建地区性研发和运营中心。


36氪也在获知消息后,采访了声智科技的投资人。峰瑞资本创始合伙人李丰告诉36氪,“峰瑞在 2016 年投资声智科技时,看好陈孝良团队在端上所具备的技术优势。此外,声智的发展恰逢其时。 2017 年上半年,中国市场迎来智能音箱热潮,语音交互技术需求集中涌现。这加速了声智的业务进展,并为他们带来了百度、小米等重要的合作伙伴。未来,峰瑞将持续看好具备语音交互技术优势,以及能够在端上做计算和数据处理、分析的团队及公司。” 


洪泰基金Aplus执行董事赖蕴琦在谈及对声智科技的投资时,也表示,“语音交互是人工智能相关技术的重要应用场景,而语音交互的核心和关键突破点在于远场。而国内真正有实力做好远场技术的团队是非常稀少的。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498375.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

德国电信:5G有重复3G命运的风险!

来源:5G 摘要:德国电信:5G有重复3G命运的风险! 行业深度观察

DARPA发布产业振兴计划,继承摩尔智慧

来源: 传感器与物联网 摘要:高登摩尔(Gordon Moore)赖以成名的摩尔定律(Moores law)几十年来一直引导着产业的发展,也为DARPA日前发布的“电子产业振兴计划”(ERI)计划附加条例提供许多想法。 根据美国国防部先进研究计划署(DARPA)微系统技术…

图解全球无人驾驶产业链:这些公司在主宰人类出行的未来

来源:战略前沿技术、华尔街见闻 摘要:与通常的报告不同,Comet Labs图表集合了整个产业链。 无人驾驶技术可以算是如今硅谷创投中最火的名词。作为人工智能的终极场景,无人驾驶技术已经成为了许多创业公司和投资者参与AI的机会。 …

2017全球最具影响力机器人公司TOP排行榜

来源: Future智能 摘要:全球最有影响力的 50 家机器人行业上市公司和非上市公司名单。 近日,美国《机器人商业评论》公布了它们的第六个年度「RBR50 名单」,即 2017 年《机器人商业评论》认为最值得关注、全球最有影响力的 50 家机…

AI公共政策成全球热点,美国ITI发布《人工智能政策原则》|AI观察

来源:腾讯研究院 概要:AI研究开发和行业应用的热度仍在持续,在此背景下,AI公共政策成为了全球公私部门关注的热点。 一、AI公共政策成AI领域全球热点 AI研究开发和行业应用的热度仍在持续,在此背景下,AI公共…

Java做抽卡_游戏王:无限抽卡怎么做?拥有这一套组合你就能抽完整个卡组!...

各位游戏王的小伙伴们大家好,今天咱要讲解的事情是如何将自己的牌组全部抽完,当然这和游戏王一代的剧情(法老王对战马利克)可不是一样的,不是让对方抽到没有卡抽后直接输局,而是通过自己的套路组合抽到自己想要的卡片并一举拿下胜…

什么是数据科学?数据科学的基本内容

来源:36大数据 概要:现代社会的各行各业都充满了数据,这些数据的类型多种多样,不仅包括传统的结构化数据,也包括网页、文本、图像、视频、语音等非结构化数据。 什么是数据科学?它和已有的信息科学、统计学…

Java实现熵值法计算_熵值法确定权重的步骤及适用范围

日常工作中经常需要确定各个指标的权重,利用熵值法确定权重属于客观赋权法,从数据出发,避免过强的主观性,但是也同时带来了一些问题。在某个论坛的帖子中,作者提出了这样的一个问题:“熵值法用于确定权重是…

终于,Geoffrey Hinton那篇备受关注的Capsule论文公开了

来源:机器之心 概要:9 月份,Axios 的一篇报道指出,Geoffrey Hinton 呼吁研究者们对反向传播保持怀疑态度,并准备在深度学习之上重构人工智能的理论体系。 9 月份,Axios 的一篇报道指出,Geoffrey…

【业界】Facebook的基础AI算法是如何驱动社交网络的发展?

来源:专知 概要:尽管Instagram的工程师对算做了很多调整,事实上这些调整的大部分功能都来自Facebook的新闻推送算法,这显示了社交媒体基础引擎的主导地位和成功。 Facebook的基础AI算法是如何驱动社交网络的发展。 Instagram工程师…

java xml textview居中_android—图文垂直居中 TextView+SpannableString

自我感觉做什么事情都是事倍功半,同样性格还是丢三落四的人。记录每一次解决问题的思路经过,以供自我学最终效果前几天让做一个效果如上图,于是引发了一些列的思路风暴:(思路1)TextViewHtml的形式:html在网页实现很常见…

java 动态添加定时器_quartz实现任务动态增加和删除

场景这几天做项目的时候遇到了个状态自动切换的场景。该场景具体情况如下:用户可以创建多个活动活动有开始时间和结束时间活动有个状态:未上线、未开始(上线但未到开始时间)、进行中(上线且处于开始时间和结束时间之间)、已结束(上线且处于活动结束时间之…

未来IT的三驾马车:AI、物联网和混合云

来源:物联网智库 概要:未来的信息技术系统日益专注于数据在哪里生成和处理、数据如何提供和收集,以及这些数据移动起来有多快。找到一条最高效的路径是关键。 物联网、AI和混合云是同一个三角形的三条边,是同一条凳子的三条腿&…

梅宏院士:软件定义的未来——万物皆可互联,一切均可编程 | CNCC 2017

作者:杨文 摘要:结合当下的人工智能热潮,梅宏教授认为我们正在进入一个软件定义的时代。软件定义的技术本质是把原先一体化的硬件设施打破,将基础硬件虚拟化并提供标准化的基本功能,然后通过管控软件,控制其…

php字符串转int,php怎样将字符串转为int类型

php将字符串转为int类型的方法:可以利用内置函数intval()来实现。intval()函数用于获取变量的整数值,如果执行成功则返回integer值,如果执行失败则返回0,例如:【intval(“1”)】。函数介绍:intval() 函数用…

对抗攻击最新研究:仅修改「一个像素」即可骗过神经网络!

编译:BaymaxZ 作者:Jiawei Su、Danilo Vasconcellos Vargas、Sakurai Kouichi(九州大学) 摘要:在图像识别领域,基于DNN的方法克服了传统的图像处理技术,甚至达到媲美人类的结果。 最近的研究证实…

php 去掉不可见字符串,php删除不可见的Unicode字符

在论坛/社区中一般帖子/文章的标题肯定是要求不为空的,但是今天发现了一个神奇的事情,我在后台php代码中限制了title不能为空。if(preg_match(/^\s*$/, $val)) return false;但是神奇的发现在数据库中有几篇文章文章的title是空的(眼睛看起来)而且鼠标点…

李飞飞新研究:基于深度学习和视觉化语言来了解不同物体间的关系

来源:凤凰科技 概要:最近她所在的实验室正在做一项新研究,基于深度学习和视觉化语言模式了解不同物体之间的关系。 2017未来科学大奖颁奖典礼暨未来论坛年会28、29日在京举办,斯坦福大学终身教授、谷歌云首席科学家李飞飞在人工智…

php设置文件权限问题,php以fastCGI的方式运行时文件系统权限问题及解决方法

今天准备将一个php demo放在IIS下运行,网站在IIS下的配置是这样的:应用程序池是集成模式下的.net framework 2.0(2.0或4.0没什么关系,因为php以fastCGI的方式在跑), 应用程序池标识配置为IIS内置的NETWORKSERVICE, 使用的认证方式为匿名身份验…

马化腾公开信:AI将成为基础设施,腾讯要打造“数字生态共同体”

来源:亿欧 概要:马化腾认为,云计算、大数据、人工智能等技术逐渐成为新型基础设施。在数字化背景下,不同产业和区域的生态之间,开始发生越来越多的关联。 马化腾认为,云计算、大数据、人工智能等技术逐渐成…