专访云知声李霄寒博士:可预见的通用智能生活
简介:
李霄寒,1994年考入中科大少年班,2003年获得中科大博士学位。现为云知声联合创始人、IoT 事业部副总裁,主要负责产品研发。曾先后加入联想、摩托罗拉中国、Nuance中国、盛大语音创新院等国内外知名科技公司。
主要成就:
2005年,参与研发世界***款嵌入式非特定人中文语音识别软件,后者广泛用于摩托罗拉手机系列产品之中;2006 年,参与研发世界***款嵌入式说话人识别软件;
2010 年,代表盛大参加 NIST 国际说话人识别评测,获得六个单项***,总分***。
在科技真实而稳步地发展中,我们的生活正在从移动互联网时代向物联网IoT时代缓步过渡。而这两个时代的一个区别是:人机互动的操控屏幕不一定会存在。
听和说是人类最自然的交流方式,也极有可能是***的人机交互方式。因此以语音交互形态为主的人机交互操控方式,有望成为智能物联网普及的标配和入口。
北京云知声信息技术有限公司是一家专注物联网人工智能服务,在语音技术、语言技术、知识计算、大数据分析等领域,建立了***的核心技术体系的高新技术企业。在应用层面,AI芯、AIUI、AI Service三大解决方案支撑起了云知声核心技术的实现和落地,目前该技术已经在家居、汽车、医疗和教育等领域有广泛应用,形成了完整的“云端芯”生态闭环。
云知声凭借自身的优质基因,以一种合契的姿态切入了万物联智联时代的入口。未来这个刚过完4周岁生日,年轻有为的公司,将如何把握科技浪潮的时代契机,值得我们展望。
日前,中国服务机器人产业联盟“约见?服务机器人”栏目组对云知声联合创始人、IoT事业部副总裁李霄寒博士进行了采访,李博士就云知声布局物联网时代,以及人们未来的通用智能生活做了一番贴近生活而又引人想象的见解。以下为采访实录。
记者:云知声从2012年成立以来,发展迅速,是中国人工智能行业成长最快的创业公司之一,您能从联合创始人的角度为我们介绍一下云知声发展轨迹吗?
李博士:云知声的发展轨迹要从语音技术的发展进程说起。语音技术在2000年前后处于低谷期,那时对语音技术的研究,包括工业化,多为少数***,像Nuance和科大讯飞,一些如IBM、英特尔和摩托罗拉等大公司的研究机构,还有国内高校和院所,比如中科院的自动化所。当时主要由于两方面的限制,语音技术并没有太大的突破。***是由于当时对语音技术的需求并没有爆发,智能手机并不是人们生活的标配,人们所接触到的智能终端产品非常少。另一方面,从技术角度讲,移动网络并不发达,所以从终端上说,对于语音的计算和计算量是有约束的,没有达到人们的期望。
在2010年前后,移动互联网开始发展,人手一部智能手机的时代到来了。人们在智能终端上有了强烈的语音功能需求,同时由于移动网络的发展,使得语音计算、复杂算法和大数据模型可以放到云端。
这两方面的推进使得语音技术达到了燃点,云知声踏着语音技术的步伐在2012年成立,创始团队分别来自于科研院所和大公司的研究机构,可以说我们代表了当时语音界的***。所以在成立之后,云知声在原有***组成的强大团队地迅速运作下,在当年9月份就推出了完全免费的公有云。通过公有云,云知声能做快速的数据迭代以及算法演进。有云、有数据以及很强的计算能力,加之深厚的行业背景,我们在2013年1月份很快地就提升了中文语音识别准确率。因此,当时在全国我们也算是***家把深度学习应用在真正商业化和产业化语音识别云服务上的公司。
云知声的快速发展得益于***人才储备,这也使得我们能够在短时间内在技术上达到国际***水平。同时云知声踩住了移动互联网和市场需求爆发步点,包括后面布局物联网也是一样的原因。
记者:云知声全新的品牌战略升级——专注物联网的人工智能服务是怎样一种概念?
李博士:在2012年的时候,我们专注于语音识别,由语音到文字或者命令的转换,无论在线的、还是离线的(嵌入式),我们都做得非常好。但是我们意识到只有语音识别本身并不能解决用户的实际需求,用户要的不是语音识别,而是为了满足某种目的。
在2012年底,我们发现实现语音交互才能满足用户。也是从那时开始,我们开始做语音合成。语音识别是把语言转化为文字,语音合成是反过来把文字转化成语音。实现两者结合,机器才能和人对话。
在那时,我们还开始了另一件事。我们为自然语言理解,或者说是语意理解做储备工作。因为我们意识到,语音识别虽把语音转化成了文字,但是机器仍然不能理解文字里面蕴含的信息和所表达的目的,不明白你想要从机器身上获得何种价值。而有了语意理解,机器人不但能和人聊天,还可以知道用户的意图。不论用户想查天气、看视频、导航,它都可以理解,然后再去对接后续服务,而最终把服务反馈给用户。所以在2013年上半年,我们已经完成了从语音到文字、从文字到语意转换的研究,通过语意分析到到达用户,再到服务,从而反过来把服务进行推送,做语音合成,通过语音合成把文字做成语音向用户播报出来,形成了一个服务上完整的闭环。
基于以上,在2013年5月份,我们推出了一个语音对话方案形式的产品,乐视超级电视就内置了我们的语音交互方案。所以在物联网领域,云知声在电视——物联网的一个终端,是最早做语音交互的。
随着时间的推移,到了2014年,我们又在考虑下一个问题:智能。当时我们意识到仅仅停留在交互层面是远远不够的,机器和人对话,乃至简单的服务,这都是非常机械的,我们需要有更智能的服务,比如说要知道用户的使用习惯,知道用户经常看的电视、常去的地点,进而对对话用户的身份、年龄、性别甚至角色有更深的了解。这要做大量数据挖掘工作,才能使得我们的交互服务更智能。所以,我们开启研究人工智能相关的服务。
到2014下半年,云知声在我国智能硬件前沿城市之一——深圳,成立了新公司。我们的团队也更坚定了往智能硬件和物联网方向走的目标,这也是我们为什么要做物联网的原因。物联网与手机、Pad和电视不一样,很可能没有屏幕。所以在物联网领域,我们想做智能,仅仅把物和物连接起来是不够的,更要为物和人打交道提供一种便利的、智能的交互方式,这种交互方式就是语音,是一种面对面的交流。
记者:云知声的物联网人工智能服务在服务机器人产业有何运用空间?
李博士:云知声的应用领域不仅仅是服务机器人,还有许多东西,比如家里所有联网设备只要加了麦克风,在某种层面上来说,都有可能成为一个智能的机器人,只不过它们不能动而已。我们会在服务型机器人的某些垂直领域做一些相应的优化,比如说陪伴机器人,不可能是老中少皆宜的,一定是有细分的。专门陪伴老人和孩子的机器人是有区分的,我们会在全智能之外做各式裁剪,让云知声的服务更适合某些垂直领域,更好地服务于服务机器人。这是我们的一个方向。
记者:您是如何看待服务机器人行业的?
李博士:我觉得服务机器人在近几年会有一个非常爆发性的增长,我更看重的是:在这样一个行业背景下,云知声有怎样的机会,我们又做了哪些事去把握这些机会。
首先,我们云知声对服务机器人行业是做了提前布局的。从12年至今,我们所做的每一件事情都为今天的发展打下了一个非常坚实的基础,而且我们的投入一直都在物联网和人工智能方面,这和服务机器人是非常契合的。
我们现在比较关注的一个领域是儿童类陪伴机器人,包括怎么样让我们的对话更加适合儿童的声音,怎么样让播放出来的语音让小朋友们喜欢,怎么样在对话里增加更多小朋友喜欢的内容,从而了解孩子的情绪,让机器人传达给家长更多的信息,最终使得家长更加了解孩子。我们要考虑产品与用户之间的连接,这是我们关注的而且一直坚持在做的,现在也有相应的储备方案,有相应的产品落地,比如去年和康力优蓝合作的小优机器人,今年我们还会有更多的产品面世。
我们关注的另一个领域是医疗。由于目前普通大众就医困难,就算度过排队、挂号、付费、就诊等看病过程,回家以后的监护过程也是非常漫长,这是一个耗时耗力耗钱的过程。服务机器人在这个场景下是非常有发展空间的,语音交互在这个场景中是非常方便、重要,并且而很有必要的。从人类思维来说,脱离了语音的机器人就不太像一个机器人了,这就不是简单的语音识别的问题了。针对不同的场景,从最前端开始,继而到语音识别,最终到服务的提供,是一个完整的方案。这就是我们在做的,这个方案会很快落地。
记者:从互联网时代逐渐进入万物互联(IoT)的时代,我们的生活将会有怎样的改变,您能给我们大致描绘一下场景吗?
李博士:在既浪漫又好玩的电影HER里:男主人公西奥多通过随身携带的类似于智能手机的***人工智能系统OS1,和只有虚拟形象的Her萨曼莎,从对话开始,他们开展了一段不被世俗理解的奇异爱情。未来我们可能接触到的存量电子设备,以及可能会出现的新电子设备、互联网设备都会具备和人语音对话、交互,以及贴心的智能服务功能。
我们可以畅想未来的一天。早上出门你会坐上一辆无人驾驶的汽车,时间地点都已经预设。上车后你只需用语音就可以控制电子和娱乐设备。当然我不太赞成用语音控制刹车,因为它不安全。车子里面所有的导航设备,娱乐设施,信息链接设备都可以通过语音控制,你只需要躺在车里的沙发上,再漫长的堵车也可以变成一种享受。经过一天上班的忙碌,回到家,有陪伴机器人与孩子一起互动聊天和玩耍,并且在虚拟老师寓教于乐地指导下教孩子学习。你能通过语音开启智能家居,比如你在厨房里,可以使用语音操控电饭煲来帮你煮饭,当你冰箱里食材不够时,还可以自动下指令,享受自动送货上门的服务。比如你在客厅娱乐时,可以用语音打开电视,并向其询问最近有何好看的节目,评分高的电影。而且你只要坐着就可以操控家里所有的电器,包括音响、空调和可穿带设备。当然你还可以通过语音和它们交流,而不仅仅是操控。未来你睡觉的时候,会有各种健康监测设备为你服务,比如智能床垫能分析你的健康问题,早上起来给你一份健康报告,提醒你日常生活的禁忌,以及应该进行的运动。像这样比较贴心的服务,你不需要操心或者花太多的心思去操控机器,机器会主动来为你服务,这是我对未来的设想。
2025年8月8日-10日
上海新国际博览中心
2025年4月17日-19日
合肥滨湖国际会展中心
2025年10月23日-25日
杭州大会展中心(新馆)
2025年10月15日-18日
武汉国际博览中心
2025年10月15日-18日
武汉国际博览中心