科技时报 全球最新科技资讯专业发布平台

专访蓦然认知戴帅湘:如何让机器听懂你 以及这个钱怎么赚

2017-12-21 09:50:37已围观次来源:凤凰网科技 作者:王玄璇编辑:夏雪

  12月20日,成立一年半的AI公司蓦然认知在北京的发布会上发布新一代决策引擎MorUI 2.0。主打千人千面、高效自然的人机交互服务。

  MorUI 2.0的一个个性化、多轮交互场景是:

  男主人问:最近有什么新闻?

  搭载该引擎的电视开始播报体育+科技新闻。

  女主人问:最近有什么新鲜事?

  搭载该引擎的电视直接播放《演员的诞生》和袁立的短视频新闻。

  女主人还可以继续发问:《演员的诞生》最新一期什么时间播?袁立演过什么?她得过什么奖?她是什么星座?

  在现阶段,让机器理解语义还不太容易。图像识别、语音识别的准确率已经达到一定程度,但自然语言处理仍处在攻坚期。要让机器真正实现智能,必须提升语义理解的准确度与可用性。蓦然认知想做的,就是实现人机间的多轮对话,让上述场景更加顺畅自然。

  如何提高准确度?如何让这一技术快速落地?如何实现商业化?近日蓦然认知创始人兼CEO戴帅湘接受了凤凰网科技的采访,分享了技术背后的故事。

  今年1月,蓦然认知宣布完成1000万美元融资,经纬创投和源码资本合投,襄禾资本跟投。其中,经纬创投与襄禾资本为蓦然认知的天使轮投资方。创始人戴帅湘对凤凰网科技透露,明年年初将启动新一轮融资。

  蓦然认知是如何诞生的?

  “众里寻他千百度,蓦然回首,那人却在灯火阑珊处。”

  在百度工作了9年后,时任主任架构师的戴帅湘决定离职创业,当时他已经是百度主任架构师,长期担任百度Query理解方向负责人。

  离职后,去年5月他在北京成立了一家主攻自然语言处理的AI公司,并给这家公司取名“蓦然认知”。

  “我们之所以叫‘蓦然’,和‘百度’是有关系的。百度是搜素引擎,搜索一个东西你自己挑选。我们做的是决策引擎,帮你找到信息并筛选出来。”戴帅湘说,决策引擎可以通过对话的方式和人交互,任何设备都可以互相连接起来。

  在办公室中,他演示了如何和装有这个系统的电视对话,告诉它需要播放一部“90年代的动作片”,或者“我要一杯焦糖玛奇朵”、“订一张明天下午去上海的机票”。

  在这一过程中,技术要解决三大问题:首先是自然语言交互,让机器理解人的语义;其次是知识的表示和推理,让机器准确推理出人们说这句话,究竟是想让机器做什么;第三是连接服务提供商,如视频网站、订餐网站。

  戴帅湘用“认知”这个词概括这一套流程。他说“感知”这件事已经做的差不多了,已经不是特别有前瞻性的东西,无论是图像识别还是语音识别都到了一定阶段。“认知”则是指各种信息的综合处理、分析、推理和学习,使模拟人脑决策的过程,在下个时代显得更为重要。

  这就是公司名“蓦然认知”的由来。

  如何选择落地场景?

  蓦然认知没有面向C端的产品,而是作为语音交互和决策引擎,将前端SDK提供给B端客户,由他们定制用户界面并集成到各种智能产品中。

  这就像Amazon Alexa,在这款智能控制设备上,你可以点星巴克、叫一辆Uber,它提供了超过25000种用于语音技术的应用,接入它的智能设备覆盖了生活的方方面面。

  国内很多公司做了智能音箱,巨头和创业公司都已入场,他们视音箱视为下一个入口,将语音应用整合到音箱中。蓦然认知选择to B的方向,为合作公司提供这一套决策引擎的解决方案,或者也在特定场景中提供硬件设备,销售给有需要的公司。

  家居是蓦然认知今年主攻的一大场景,明年他们会将更多精力放在汽车场景中。

  在家居领域,他们选择从电视切入,为电视提供一套引擎。已经合作的有暴风TV和另外几家传统电视厂商,接入了外卖、电影票,并正在接入代驾、停车、跑腿、购物等更多服务,形成交易闭环。

  为什么是电商而不是音箱?戴帅湘的回答是:“我觉得我有一个逆反思维,我觉得大家都很热烘烘的弄一件事,这个事八成有问题。”他认为首先要解决存量市场,有大量存量的设备需要技术去革新,这就是有价值的。而音箱在中国家庭中并不普及。

  另外,汽车也是一个需要革新而且正在飞速发展的行业。目前蓦然认知和一家德系厂商和一家中国厂商已经谈成合作。其中一家蓦然认知会提供决策引擎,搭载到车的硬件中;另一家是蓦然认知直接提供硬件,他们自己设计,找第三方生产。找合作商的过程中,戴帅湘发现,和新兴造车公司相比,传统车厂对技术革新的诉求更强烈。但是谈合作并不是件容易的事,前后大约准备了半年,合作又谈了半年,合作周期可以长达3-4年。

  在拓展汽车场景的前期,蓦然认知尝试过后装的途径,选择一家中间服务商来搭载引擎,服务商再和车厂合作。但他们发现如果技术的验证需要通过中间商,效果非常不可控。“技术要产品化,产品要市场化。如果产品化的过程你自己不能掌握,市场化的过程就更难。”戴帅湘告诉凤凰网科技。

  机器到底有多智能?

  产品化的思路有了,但究竟能达到什么效果才是核心问题。和图像识别与语音识别不同,自然语言处理目前还处在非常不成熟的阶段,语义的复杂是落地应用中最大的困难。深度学习算法也不是语义识别的最优算法。

  戴帅湘说,语义识别可以用多种模型去解决问题,缺乏一个综合性的框架将各种模型统一起来。蓦然认知在成立之初就确定了一个统一的框架,这对技术落地十分必要。“并不是说这个框架是最好的,只是说我找到了一个可行的框架,在当前状态、当前场景中很有效。之后是个逐步优化、让它更有效的过程。”

  蓦然认知的Mor引擎可以关联上下文,进行多轮对话。例如对电视说“我要订一张明天下午北京到上海的机票”,电视呈现出来了,你再说“南苑机场出发的”,它能识别出这是和上文有关的。

  由于目前搭载Mor引擎的电视中,只有暴风TV开售了,能收集的数据量还较少。明年年初当另外几家合作方的电视销售出去后,有了更大的数据量,蓦然认知会快速开发自适应机制,通过增强学习让系统根据用户反馈等进行自我学习。

  蓦然认知目前主要做的是一步决策或两步决策,戴帅湘表示明年会做多步决策。就是对电视说要订机票,电视会推荐几点的飞机、推荐落地后住哪个酒店。现在的增强学习是分场景的,电影是电影,咖啡是咖啡,明年要实现跨场景学习。还要逐步打通用户数据,根据用户喜好,主动的进行个性化推荐。

  如何和大公司竞争?

  就是因为语义识别尚未成熟,行业还未出现绝对垄断者,蓦然认知这样的公司才有机会。

  戴帅湘认为,和大公司相比,创业公司能够快速的在单一场景落地,然后迁移到其他场景,来进行规模,这是小公司的优势。大公司适合做平台,很难实现快速落地小场景或是迁移到其他场景。

  蓦然认知目前有100多人,技术人员约50名。他们还刚刚在上海还设立了一个主攻汽车业务的研发中心,有11人,都是技术研发。团队计划明年扩张至200人。新一轮的融资规划也已提上日程。

  “AI是软硬件结合体,手机的时代要逐步过去巅峰期,新设备契机来了,我们正好就是可以做到软硬件结合,让AI技术落地。”戴帅湘认为,新的交互方式会让更多硬件设备变得智能,车里、家里、办公区内的设备都可能替代手机。让一切更智能,也是他们的使命。


window.onload = function (){ var oLi = document.getElementById("tab").getElementsByTagName("li"); var oUl = document.getElementById("ms-main").getElementsByTagName("div"); for(var i = 0; i < oLi.length; i++) { oLi[i].index = i; oLi[i].onmouseover = function () { for(var n = 0; n < oLi.length; n++) oLi[n].className=""; this.className = "cur"; for(var n = 0; n < oUl.length; n++) oUl[n].style.display = "none"; oUl[this.index].style.display = "block" } }}