专访蓦然认知戴帅湘:如何让机器听懂你 以及这个钱怎么赚
12月20日,成立一年半的AI公司蓦然认知在北京的发布会上发布新一代决策引擎MorUI 2.0。主打千人千面、高效自然的人机交互服务。
MorUI 2.0的一个个性化、多轮交互场景是:
男主人问:最近有什么新闻?
搭载该引擎的电视开始播报体育+科技新闻。
女主人问:最近有什么新鲜事?
搭载该引擎的电视直接播放《演员的诞生》和袁立的短视频新闻。
女主人还可以继续发问:《演员的诞生》最新一期什么时间播?袁立演过什么?她得过什么奖?她是什么星座?
在现阶段,让机器理解语义还不太容易。图像识别、语音识别的准确率已经达到一定程度,但自然语言处理仍处在攻坚期。要让机器真正实现智能,必须提升语义理解的准确度与可用性。蓦然认知想做的,就是实现人机间的多轮对话,让上述场景更加顺畅自然。
如何提高准确度?如何让这一技术快速落地?如何实现商业化?近日蓦然认知创始人兼CEO戴帅湘接受了凤凰网科技的采访,分享了技术背后的故事。
今年1月,蓦然认知宣布完成1000万美元融资,经纬创投和源码资本合投,襄禾资本跟投。其中,经纬创投与襄禾资本为蓦然认知的天使轮投资方。创始人戴帅湘对凤凰网科技透露,明年年初将启动新一轮融资。
蓦然认知是如何诞生的?
“众里寻他千百度,蓦然回首,那人却在灯火阑珊处。”
在百度工作了9年后,时任主任架构师的戴帅湘决定离职创业,当时他已经是百度主任架构师,长期担任百度Query理解方向负责人。
离职后,去年5月他在北京成立了一家主攻自然语言处理的AI公司,并给这家公司取名“蓦然认知”。
“我们之所以叫‘蓦然’,和‘百度’是有关系的。百度是搜素引擎,搜索一个东西你自己挑选。我们做的是决策引擎,帮你找到信息并筛选出来。”戴帅湘说,决策引擎可以通过对话的方式和人交互,任何设备都可以互相连接起来。
在办公室中,他演示了如何和装有这个系统的电视对话,告诉它需要播放一部“90年代的动作片”,或者“我要一杯焦糖玛奇朵”、“订一张明天下午去上海的机票”。
在这一过程中,技术要解决三大问题:首先是自然语言交互,让机器理解人的语义;其次是知识的表示和推理,让机器准确推理出人们说这句话,究竟是想让机器做什么;第三是连接服务提供商,如视频网站、订餐网站。
戴帅湘用“认知”这个词概括这一套流程。他说“感知”这件事已经做的差不多了,已经不是特别有前瞻性的东西,无论是图像识别还是语音识别都到了一定阶段。“认知”则是指各种信息的综合处理、分析、推理和学习,使模拟人脑决策的过程,在下个时代显得更为重要。
这就是公司名“蓦然认知”的由来。
如何选择落地场景?
蓦然认知没有面向C端的产品,而是作为语音交互和决策引擎,将前端SDK提供给B端客户,由他们定制用户界面并集成到各种智能产品中。
这就像Amazon Alexa,在这款智能控制设备上,你可以点星巴克、叫一辆Uber,它提供了超过25000种用于语音技术的应用,接入它的智能设备覆盖了生活的方方面面。
国内很多公司做了智能音箱,巨头和创业公司都已入场,他们视音箱视为下一个入口,将语音应用整合到音箱中。蓦然认知选择to B的方向,为合作公司提供这一套决策引擎的解决方案,或者也在特定场景中提供硬件设备,销售给有需要的公司。
家居是蓦然认知今年主攻的一大场景,明年他们会将更多精力放在汽车场景中。
在家居领域,他们选择从电视切入,为电视提供一套引擎。已经合作的有暴风TV和另外几家传统电视厂商,接入了外卖、电影票,并正在接入代驾、停车、跑腿、购物等更多服务,形成交易闭环。
为什么是电商而不是音箱?戴帅湘的回答是:“我觉得我有一个逆反思维,我觉得大家都很热烘烘的弄一件事,这个事八成有问题。”他认为首先要解决存量市场,有大量存量的设备需要技术去革新,这就是有价值的。而音箱在中国家庭中并不普及。
另外,汽车也是一个需要革新而且正在飞速发展的行业。目前蓦然认知和一家德系厂商和一家中国厂商已经谈成合作。其中一家蓦然认知会提供决策引擎,搭载到车的硬件中;另一家是蓦然认知直接提供硬件,他们自己设计,找第三方生产。找合作商的过程中,戴帅湘发现,和新兴造车公司相比,传统车厂对技术革新的诉求更强烈。但是谈合作并不是件容易的事,前后大约准备了半年,合作又谈了半年,合作周期可以长达3-4年。
在拓展汽车场景的前期,蓦然认知尝试过后装的途径,选择一家中间服务商来搭载引擎,服务商再和车厂合作。但他们发现如果技术的验证需要通过中间商,效果非常不可控。“技术要产品化,产品要市场化。如果产品化的过程你自己不能掌握,市场化的过程就更难。”戴帅湘告诉凤凰网科技。
机器到底有多智能?
产品化的思路有了,但究竟能达到什么效果才是核心问题。和图像识别与语音识别不同,自然语言处理目前还处在非常不成熟的阶段,语义的复杂是落地应用中最大的困难。深度学习算法也不是语义识别的最优算法。
戴帅湘说,语义识别可以用多种模型去解决问题,缺乏一个综合性的框架将各种模型统一起来。蓦然认知在成立之初就确定了一个统一的框架,这对技术落地十分必要。“并不是说这个框架是最好的,只是说我找到了一个可行的框架,在当前状态、当前场景中很有效。之后是个逐步优化、让它更有效的过程。”
蓦然认知的Mor引擎可以关联上下文,进行多轮对话。例如对电视说“我要订一张明天下午北京到上海的机票”,电视呈现出来了,你再说“南苑机场出发的”,它能识别出这是和上文有关的。
由于目前搭载Mor引擎的电视中,只有暴风TV开售了,能收集的数据量还较少。明年年初当另外几家合作方的电视销售出去后,有了更大的数据量,蓦然认知会快速开发自适应机制,通过增强学习让系统根据用户反馈等进行自我学习。
蓦然认知目前主要做的是一步决策或两步决策,戴帅湘表示明年会做多步决策。就是对电视说要订机票,电视会推荐几点的飞机、推荐落地后住哪个酒店。现在的增强学习是分场景的,电影是电影,咖啡是咖啡,明年要实现跨场景学习。还要逐步打通用户数据,根据用户喜好,主动的进行个性化推荐。
如何和大公司竞争?
就是因为语义识别尚未成熟,行业还未出现绝对垄断者,蓦然认知这样的公司才有机会。
戴帅湘认为,和大公司相比,创业公司能够快速的在单一场景落地,然后迁移到其他场景,来进行规模,这是小公司的优势。大公司适合做平台,很难实现快速落地小场景或是迁移到其他场景。
蓦然认知目前有100多人,技术人员约50名。他们还刚刚在上海还设立了一个主攻汽车业务的研发中心,有11人,都是技术研发。团队计划明年扩张至200人。新一轮的融资规划也已提上日程。
“AI是软硬件结合体,手机的时代要逐步过去巅峰期,新设备契机来了,我们正好就是可以做到软硬件结合,让AI技术落地。”戴帅湘认为,新的交互方式会让更多硬件设备变得智能,车里、家里、办公区内的设备都可能替代手机。让一切更智能,也是他们的使命。
图文推荐
- 马云:企业家要会控制欲望 付比员工更大的代价
人物报道2019-04-23
- 小米上市雷军发公开信:厚道的人运气不会太差
人物报道2018-05-03
- 觅跑创始人毕振:三年铺设2万个健身仓,计划明年盈利
人物报道2017-11-16
- 阿里文学CEO:好IP要素是正能量、好的世界观与喜闻乐见
人物报道2017-10-25
- 原经纬中国董事总经理黄云刚加入源码资本任合伙人
人物报道2017-10-11
- 吴恩达重返在线教育领域 推出深度学习课程
人物报道2017-08-09