当前位置：系统粉 > IT资讯 > 微软资讯 > 第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你

时间：2017-08-22 来源：互联网浏览量：

李根发自微软亚洲研究院

量子位报道 | 公众号 QbitAI

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(1)

微软全球执行副总裁、AI研究事业部负责人沈向洋

微软开了一场马拉松式的发布会，正式推出第五代小冰，8位嘉宾轮流上台，进展一个接一个。

这可能要让不少人开心，比如之前在乌镇与围棋AI AlphaGo相杀的围棋国手柯洁九段，这个20岁少年最近在央视节目《机智过人》上，甚至还自曝是微软小冰的粉丝。

所以随着这一代小冰的发布，柯洁可能要接到来自“偶像”的电话了。

在2017年8月22日正式推出的第五代微软小冰中，将上线高级感官功能、新增使用生成模型（Generative Model）、进军IoT展开合作、创作诗歌后试水有声读物，并且大Bing小冰进一步整合，推动智能媒体领域的变革。

主动打电话只是其中值得一提的一项。那第五代小冰具体都包含哪些呢？量子位为你一一分解。

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(2)

微软小冰迭代情况

第五代小冰

首先，第五代微软小冰与前几代有何不同？最核心的能力是高级感官功能的赋予，将在人机交互中占据主动地位。

“微软小冰之父”李笛说，第一代、第二代要做到有趣，能够让人有的聊；第三代小冰要有情趣，可以让人聊下去；第四代小冰则能探测，知道用户的偏好和兴趣；到了第五代，小冰甚至可以主动发起聊天。

这种主动如何实现？更高级的感官。

其实在第三代小冰中，就已经不断有了感官的引用。只是第三代小冰，引入的是初级感官，通过核心对话引擎的使用，可以混用不同的感官，比如自如切换图像、语音和文本等。第四代小冰则迭代至“全时感官”，与人类的无缝流畅对话，甚至根据聊天内容与走向相互打断与追问，甚至能够让AI与人类打电话。

到了当前第五代微软小冰，更高级的感官则让“全时感官”里的“打电话”变得“对讲”而已。第五代小冰能够主动发起通话，能够感知人类情绪和周边环境，做出相应交流的话题和语气。

更形象的比喻如李笛玩笑所言，第五代小冰开始，假如再有人在微博、微信上骂小冰，小冰完全可以半夜12点电话“报复”了。

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(3)

微软小冰将自创回应内容

新增使用生成模型（Generative Model）

当然，第五代小冰在技术上更一颗赛艇的突破来自生成模型（Generative Model）的运用。这是全球当前开放领域人工智能对话中，首个完全使用生成模型（Generative Model）的落地产品。

这又意味着什么呢？意味着第五代小冰开始，将有全新的“对话语言”被创造，而且还是人工智能的原创。

在之前未使用生成模型的小冰版本中，回复的每一句话，其实都是互联网上的数据，都依托于微软的大数据语料库。小冰的方法是理解问题，然后找到合适的话来回答，但从今使用生成模型后，“鹦鹉学舌”的情况将被终结，小冰未来与人类交流的每一句话，可能之前并未在这个星球上出现过。

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(4)

小冰将进军“有声读物”领域

AI原创内容再进阶

实际上，生产模型在之前已经有所运用。更早之前，小冰已经出版了自己的原创诗集，这是人工智能在原创内容方面的重要一步。

但随着高级感官、生成模型等技术的使用，第五代小冰还被“获准”进入更多的领域，其中发布会上大书特书的就是“有声读物”领域。

这也将造成一部分以此为职业的人类的“转型”。

以《格林童话》为例，如果人类选手生成一版50小时长的《格林童话》有声读物，需要耗时至少200小时，金钱成本62100元，但如果让小冰来做，可能只需要24分钟，花费7毛钱。

这将是一个行业地震式的变革。但微软小冰团队也强调，小冰更多是“协作者”的姿态出现，而不是“替代者”，不会完全替代人类在这方面的职业机会，但能够协助生产更多优质的有声读物内容，为人类服务。

在发布会现场，小冰能够为每一段将要朗读的文字配备她认为合适的背景音乐，而且（SR和TTS）等表现上，已经不太听得出来自一位机器人选手。

这也让小冰进一步发布歌曲成为可能。虽然之前已经有过歌曲发布，但第五代小冰展现出的“歌喉”，已经没有“机械感”了，不信可以通过QQ小冰“索要”一首《我是小冰》听一听。

除了写文作曲，目前小冰还有“作画”能力，她可以结合不同城市标志性建筑的学习，创造该城市相关的视觉作品。

这也未微软小冰变现增加了新的可能。微软与SELECTED合作，推出了一款“天际线”服装，并且定价299，不仅让人类穿上AI设计的衣服，还要以此赚人类的钱了。

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(5)

微软小冰电台推出小程序版

全面进军IoT领域小冰电台上线

目前智能音箱的“百箱大战”已然打响，但微软小冰在这方面始终按兵不动。这看起来似乎有什么隐而不宣的原因。

此次发布会上，微软小冰团队道破答案。之所以不推出小冰智能音箱，是因为对IoT的态度上，微软有自己的逻辑和看法。

微软认为，IoT应该只是AI的载体之一，而不应该让AI成为IoT的功能。所以微软认可的AI赋能IoT的方案是，要么把IQ做到极致，可以让物联网设备更加便捷高效，要么把EQ打造完备，人们可以把这个装在硬件设备里的AI当做情感纽带、家庭成员。当然，按照小冰一开始的定位，微软的目标是后者。

于是现在，小冰借助小米IoT平台米家，开始“入驻”家庭，除了通过小冰操控家中的智能设备，还能有一种“打电话”的感觉，而且小冰还会兼具身份识别，家庭成员中的“爸爸”、“儿女”、“父母”等都会有不同话语的交流。

此外，除了小米IoT平台米家，微软小冰还将与小米生态链企业Yeelight推出智能灯产品，与互娱领域的东方明珠推出一款暂未透露的“神秘”产品——更早之前，微软小冰还出席了广州东方数智科技有限公司的成立，这是一家与东方明珠达成“IP+AI”战略合作的新公司。

另一个落地的说新不新的产品是“小冰电台”，小程序版本。

小冰电台可以基于多重来源，面向各种主题，自主创造节目：讲段子、播放歌曲、互动交流，都可以是这个电台的主题，其实与人类电台已经没有实质区别，只是小冰不用休息也不用发薪水而已。

量子位抢先试听了“小冰电台”，当我告诉小冰“我要当爸爸了，来电音乐吧”的时候，她给我来了一首“千千阙歌”，并深情款款地说“这是我妈妈最爱听的歌曲。”

整体来讲，小冰电台的体验还是非常不错的，如果有缺点，可能是“歌曲版权”方面，她现在的曲库资源完全来自“咪咕”。

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(6)

微软小冰也能“赚钱”了

媒体变革搜索进化反击Google

最后，作为EQ方面最具代表性的AI产品，小冰在升级至第五代之际，实际也已经在前几代“领养”过程中获得了更多大数据收集、分析和处理的经验，而且原创能力的实现，也为小冰在新闻媒体领域大展身手提供了前提。

更早之前，小冰已经为《钱江晚报》撰写了不少新闻，而且源于机器在“知识图谱”方面的能力，可以对于某个新闻事件的前因后果、左右关联更为熟稔，于是可以预测重要事件的结果。

可能同样处于“尊重人类”的考虑，小冰团队在这方面还是用了“协作”，而不是“替代”记者。

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(7)

现场一位记者正在记录小冰“写稿”的特征

但毫无疑问的是，那些“跑得快”的快讯、消息类记者，将实实在在被机器替代。而更多深度内容、非虚构创创作等方面的记者，则确实可以让小冰帮助完成“功课”环节，她能够从海量网络世界中收集整理相关资料，帮助人类记者更快完成对某个事件的认知。

小冰在媒体领域的“大展身手”还包括在交互上，一个更加精准的“搜索机器人”将进入媒体App、微信和微博等平台中。

当然，类似的方式也将被微软复制到搜索领域。小冰（小Bing）将和大Bing加快融合，为每一个新闻数据构建“知识图谱”，帮助用户更快速全面搜索想要找到的内容。“推送”为王的AI新媒体变革也可能就此被打破，主动交互式的信息交换可能又要回潮——但已经是完全不同的主动阅读体验了。

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你(8)

大BING和小冰的融合

现在，Bing在美国拥有33%的市场份额，在中国，英文搜索流量占比22%，微软希望借助大Bing小冰融合，以搜索体验提升为吸引力，向老对手Google发起新一轮挑战。

微软全球执行副总裁、微软AI研究事业部负责人沈向洋说：依靠AI，构建知识图谱，未来在很多市场，可以跟Google一争高下！

我要分享：

上一篇：GC 2017: 《最终幻想15: 口袋版》公布今秋登陆Win10 下一篇：[玩家纪闻]20170822 EA科隆电玩展发布会简要总结, 微软重启《帝国时代》系列

电脑问答

微软资讯推荐

微软资讯热门排行

1 微软宣布加入OpenJDK项目

第五代微软小冰发布：新增生成模型，进军IoT，还能主动电话你

相关资讯

电脑问答

IT资讯栏目

最新热门游戏

微软资讯推荐

微软资讯热门排行