除了唱歌跳舞写诗画画,微软小冰还有什么故事可讲?

钛媒体2019-09-12 16:02:01

钛媒体 TMTPost.com

|科技引领新经济|

 

微软亚洲互联网工程院副院长、小冰负责人李笛:“框架可以孕育整片森林,小冰只是其中一棵树。工具是一个桥梁,它让第三方,甚至于未来普通人(个人)都可以通过这个工具去操作这个框架。”


钛媒体编辑丨赵宇航


8月15日,微软发布第七代小冰,通用框架Avatar Framework也首次公开亮相。


微软小冰一直是比较特殊的人工智能产品。相较于其他助手型人工智能产品,以少女形态出现在人们面前的小冰,会唱歌、画画、作诗,更加有情感和温度。现场发布的第七代小冰有了更强大的能力,在对话、唱歌、创作上都有了质的飞跃。



但在本次发布会上,更重要的是通用框架Avatar Framework工具包的发布。这系列底层工具包的发布,标志着微软小冰人工智能产品线,不再以小冰一个单一人工智能为主打,而是向行业输出面向toB大规模应用的、能大规模产业化复制、快速进行商业化的更底层能力。微软小冰将开始靠ToB生意赚钱。


通过Avatar Framework,更多具备小冰一样能力的AI Beings将会出现,小冰将是Avatar Framework的成熟“样板”。未来,更多与合作伙伴开发的AI Beings将会具备更多不一样的人设,担任不同的职能,但他们将同样具备小冰的灵动、感性和创造力。


“我们最开始的时候并不确定,我们只是认为她会很重要,不想错过这个机会,现在看起来幸亏我们没有错过这个机会。”


在发布会后,钛媒体编辑对话微软小冰负责人李笛。在对谈中,李笛详细介绍了“小冰”的身份、产品线规划,下一步工作等等。


但在专访中,他也表示,无论是小冰在初期看起来多么“不务正业”,未来能怎样服务产业、最终走向通用型人工智能技术,都是团队在研发起步阶段就带入思考的。


第七代小冰能做什么?


第六代小冰具备的共感模型,让小冰学会察言观色,具备引导对话能力。而第七代小冰,不仅基于过去,还能着眼未来,在对话开始时预先筹划对话未来的走向,在某些场合甚至可以主导对话。


这是由于第七代小冰具有全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达68%,比上一个版本的转化率提高21%。


”过去AI主要是问答中的被动地位,但当人工智能在对话中处于主导地位时,人类可以在对话中获得更多的信息。”



在现场的演示中,AI可以根据人类不同的反映,引导对话进入不同的分支,同时在对人类追问的问题中引导对方,给出更详尽的信息。

一个比较通俗易懂的对应场景是在线零售。


比如在电商购物中,小冰设计的目标是在10轮对话中迅速了解一个人,从零售店中选出满足他需求的商品。据现场介绍,在美国一个实际案例中,小冰将一件商品的实际转化率从47%提高到了68%。


而在交互上,全双工语音交互感官升级,让小冰有了更多落地场景。

小冰于2017、2018年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。


小冰也在探索更多与人类交互的方式,本次第七代小冰也具备面向未来的多模态交互感官,这是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。也就是说,小冰不止能通过对话与人交谈,还可以通过现场“看到”的场景与人类进行对话。继去年宣布率先开始多模态感官的研发后,今年2月,微软日本小冰团队已邀请当地媒体进行了公开测试。


不仅停留在微软亚洲互联网工程院,微软小冰线所开发出来的技术已经应用到微软内部的各种产品上。


“小冰给微软在计算机视觉、计算机语音和自然语音处理方面带来很多。”李笛向钛媒体透露,不止体现在小冰身上,实际上微软内部的很多产品都已经在用了由小冰开发出的技术,比如全双工语音技术。学术论文方面,大概有五六十篇顶级学术论文都是小冰的。“像Harry很多年不写论文了,他最近两篇论文都是关于小冰的。”


可以孵化各种AI beings的通用框架

微软Avatar Framework初次登场


当18岁的少女小冰出现在人们眼前时,更多质疑是关于,这样一个会唱歌跳舞画画的人工智能,究竟能怎么替微软赚钱?


而当Avatar Framework框架出现时,问题被无声地回答了。


微软(亚洲)互联网工程院同时宣布,面向全部合作伙伴及客户的Avatar Framework版本正式发布,面向个人使用者的版本预计将于2020年春季发布。


李笛像钛媒体解释道,微软的DNA就是做平台工具化,而EQ路线的人工智能太新了,“我们没有把握一上来就做一个平台型的工具,只能是不断迭代演进。”


而这时,18岁少女小冰则是最好展示情感人工智能作用的一个例子。


“比如说,小冰可以跨越多种平台,比如智能音箱、手机。当我们说一个通用框架可以无处不在,我们就通过小冰这样一个例子,告诉你她是怎么无处不在的。”


而在通用框架Avatar Framework的支撑下,人们将会很快体验到能说会动、会唱歌会写作画画的多个AI Beings。


工具化的EQ人工智能开发体验


本次对外开放的Avatar Framework工具是一套完整工具包,与微软小冰框架同源,可轻松构建具有完整情感计算能力的人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等。 


工具包包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,并可驱动兼容的3D人物模型进行实时交互,支持跨平台部署。


不管是哪个AI beings,都需要一个统一性的框架。Avatar Framework就是一个赋能其他AI Beings创造的能力。通过工具包实现。可以帮助企业、个人开发展创造属于自己的AI beings。



在工具包的支撑下,创建一个具备独特“人设”的AI beings可以被分为三步。


第一步是通过设定输入Profile信息,创造一个AI beings的完整人格。目前开放的框架工具中,profile的设定包括76项基础信息和27项性格特征参数。人设不同会导致动作、对话等等细节不同。


“profile是一切的基础。性格特别重要,这些决定了对话的风格,看事物的态度,决定了在传递知识、实用技能、提供服务的基本理念。性格设定会影响到方方面面。” 

 

通过拖拽即可设置,还有模板


图中两个AI beings人设设置不同,在对话中的回应截然不同。


Avatar Framework拥有数种工具,比如特色的具备共感能力的对话工具,声如其人的声音工具、能够令AI形成对眼前事物独特评价的视觉工具等等。



第二阶段是帮助AI打造三观,Avatar Framework通过知识图谱,三观构建提供各种三观工具:包括工作管、劳动关系、责任观、爱情观、沟通观、吵架观、宠物观等等。


第三阶段是创造阶段,这一系列工具包将赋予其他AI Beings跟小冰一样的创作能力,比如写作、绘画。另外,还可以通过3D 模型跨越现实,驱动3D模型。


而通过这几个阶段,商业用户可以很快开发出一个符合自身企业形象、需求的AI Beings。而创造出的AI Beings和小冰一样,具备跨平台部署能力,可以支持智能音箱、PC、智能手机等多种终端。


就在前不久,通过通用框架Avatar Framework工具包,在全职高手的世界观与背景知识下,微软与阅文集团已经成功“复生”了全职高手五位主人公,即创作出了五位主人公的在线实体AI,让这五位主人公不再停留在书本和荧屏上,而是可以与读者进行实时、多模态下的互动。


而这只是与阅文集团合作的一小部分,据现场宣布,微软与阅文的合作已经扩展至100部小说,可以将这100部小说的主人公“复生”。沈向洋称,这也是历史中最大一次把小说中人物进行赋能的一次计划。


李笛向钛媒体介绍,当小冰更新到第五代时,整个框架已经基本完整,框架的各个部分已经具备。而在第六代时,团队开始进一步将整个框架工具化,开始具备输出能力。


而在工具化之外,微软小冰在去年启动商业化进程,今年快速发展。


如今,小冰商业客户已经遍布媒介、纺织服装、IoT、地产、零售、汽车、金融、音乐等等十多个行业。微软小冰给万得做金融摘要,目前已经平稳运行了21个月,衍生开发了金融电台,帮助万得巩固金融信息服务商的地位。



李笛向钛媒体表示,未来,他的团队还是会沿着两条线走,第一,小冰作为微软自己100%拥有的一个产品,仍然会进行各种创新尝试。一是让她融入各种新平台,尝试多模态感官等等。


第二条线是通过Avatar Framework去赋能大量的第三方,这一条ToB商业模式深度融入客户,输出完整的框架能力。这条路现在开始正式大张旗鼓地进行。


“框架可以孕育整片森林,小冰只是其中一棵树。工具是一个桥梁,它让第三方,甚至于未来普通人(个人)都可以通过这个工具去操作这个框架。”(本文首发钛媒体,作者/赵宇航



发现钛媒体,72问新生机;

碎片时间,系统学习


点击阅读原文或识别上方图片二维码下载钛媒体App」精彩不容错过
我就知道你“在看”
https://www.wxwenku.com/d/201363620