[导读]微软亚洲研究院的技术依然是这次技术节的重要组成部分,约有36个项目被选定在这次技术节上展示,所涉领域涵盖自然用户界面、语音识别、自然语言处理与机器翻译、交互设计等领域。
2010年微软技术节(TechFest2010)公开日于3月2日在美国总部正式举行,微软技术节是微软研究院年度内最大的技术展示活动,今年共有来自全球6大微软研究院的150多个项目齐聚一堂,接受微软内部产品部门的检阅。与往年一样,微软亚洲研究院的技术依然是这次技术节的重要组成部分,约有36个项目被选定在这次技术节上展示,所涉领域涵盖自然用户界面、语音识别、自然语言处理与机器翻译、交互设计等领域。下面让我们一起来看看微软亚洲研究院在本次技术节上的精彩亮相吧!
一、移动3维交互场(MobileSurface)
智能触控技术为移动计算提供了一个新的人机交互界面。移动3维交互场(MobileSurface)通过使用摄像投影传感系统能够将任意的,比如办公桌面、餐台、茶几等表面或一张普通的纸变成可触控的平台,从而让用户能够在移动设备,如手机上,体会到和微软Surface类似的智能触控体验,而且这项技术在平面多点智能触控的基础上,还能够为移动设备提供3D空间的自然交互。比如用户将手机的内容投影到任意桌面,可以触控或3D的手势实现交互操作。而且这个系统还能实时捕获放入投影区域物体表面的数据模型,从而为增强现实应用提供了支持平台。移动自然交互面能够为手机/移动设备提供一个自然的交互平台,可以使你随时随地的与你身边的数字信息进行自然交互。
这是在技术节现场搭建的表面触控平台,从画面上可以看到有两只鼓投影在了桌面上。用户可以拿着鼓棒直接在空中或者表面敲打,后面的小屏幕会马上重现你的整个演奏的乐点。
一个摄像头、一个投影仪就可以在桌面上打起虚拟的鼓来。如果你觉得拿着鼓棒敲击麻烦,你也可以直接用手去敲打。
二、置身云端——全新云计算交互体验(Insidecloud:newinteractionfor cloud computing)
云计算开启了新型交互时代,云计算的强大能力让用户可以随时随地的访问他们的个人数据,可以尽情享用丰富多彩的新型网络服务,也给了用户更大的空间和能力在信息时代更自由的遨游。置身云端研究项目在探讨新型云计算交互体验,包括新型交互设备——云鼠标,信息组织形式——云界面。
每个人都会有一片属于自己的云,有一个自己的云鼠标,它是通向个人云端的钥匙,同时它又是一个拥有6个自由度、触控反馈体验的自然交互设备。云界面在现有的二维界面的基础上增加时间、空间维度,将用户纷繁复杂的信息有机的整理在一起,并以更自然的方式呈现。云鼠标结合新的自然的云界面,用户如身处云端,沉浸在个性化、智能化、有组织的个人信息数据和浩瀚的网络数据与应用之中。所有的对象漂浮在空中,用户可以使用云鼠标在其中轻松的漫游,自然的交互。
三、同声传译电话(T3:TheTranslating!Telephone)
这是一个能同声传译电话的系统。道格拉斯·亚当斯的巴别鱼激发了构建无拘无束的通用通讯的梦想。虽然我们还远未实现这一目标,但是目前有限的精确度仍能在许多场景创造价值。我们在电话通话场景中的目标就是在没有其他通信手段存在的条件下,提供一个跨语言沟通的辅助工具。该系统充分使用了说话人自适应技术,以达到合理的实时语音到文字转录的准确性。然后,又通过机器翻译来提供语音到文本的翻译,并进一步利用文语转换系统来最终实现语音到语音的翻译。识别文字和翻译文本都会显示给用户,使他们能够验证他们的意图。我们将用一个德语和英语的现场会话来演示这个系统。
四、肌肉运动指挥计算机(InputwithMuscle-ComputerInterfaces)
微软公司一直致力于研究利用传感器等元件来实现新颖的并具有较强交互感的物理设备。微软亚洲研究院的人机交互组负责人DesneyTan博士展示了一项最新技术——将手臂的运动直接作为鼠标来使用——依赖于肌肉的运动和变化来指挥计算机进行各式各样的交互体验。只要在手臂上戴上传感器,可以握着电脑中的吉他自如地弹奏起来。在空中轻轻挥动手指,计算机便可以跟踪运动手指的轨迹……等等。
五、基于人脸识别、事件匹配的社会化相册聚合服务OneAlbum
微软以色列研发中心创新实验室在TechFest2010上演示了OneAlbum–可自动根据人脸、事件等条件智能聚合来自社会化相册服务Flickr、Facebook的照片。
或许,OneAlbum所实现的功能才是WindowsLivePhotos相册服务该有的社会化气质:
照片的人脸识别[1],而且可从你好友的社会化相册服务中自动去识别和你相册中出现的人脸有关的照片;事件(活动、聚会)匹配,综合拍摄日期、照片内的人脸、照片颜色识别出同一事件的照片。
结合这两项功能,再加上些社会化和自我算法改进的功能就可开始将与你有关的照片整合于OneAlbum中,这些照片可以是来自Flickr、Facebook的。
更关键的是,OneAlbum无需人工干预,甚至你都不需要输入描述标签,它自动可以从照片本身的属性中挖掘与你的有关的照片。
我始终认为,微软有必要将OneAlbum概念整合入不温不火的WindowsLivePhotos服务底层。至少从4的整合社会化的趋势来看,OneAlbum概念绝对可行,而且不会添乱,甚至可以想象基于OneAlbum概念的Bing社会化图片搜索引擎。
我想说的就是上面这些了,下面附上图例一枚。
六、手机搜索本地缓存技术SONGO
SONGO全称为SearchOntheGo(译为移动搜索),是由微软研究院在TechFest2010上演示了手机搜索和广告缓存技术,支持用户即时搜索个人文件、Web搜索结果、本地搜索结果,而且是跨平台的,这意味着可通过手机、PC、云访问这些缓存的信息。
更酷的是,SONGO可不依靠互联网,本地执行用户的搜索。
目前已经有两款SONGO原型应用已经完成了,其一是Facebook实时搜索,另一款是QuickAds实时商家查询应用。下面附上微软研究院的SONGO原理框图和具体讲解:
首先,SONGO在手机端本地缓存根据其他用户搜索产生的流行搜索结果、商家和广告的记录数据,并保证每天更新。随着用户的使用,SONGO将分析用户点击,以完成以下两个任务:1)扩展缓存库数据量;2)调整缓存数据的重要排名,以提供个性化搜索体验。通过对1亿的移动搜索查询量的分析:平均66%的搜索可通过缓存了2,500链接的1MB缓存数据库来提供合适的结果。
WindowsPhone平台上的原型应用测试数据表明:SONGO比通过3G网络快16倍,并能省25倍的电量。
SONGO是基于Bing的,一旦时机和技术成熟,SONGO将毫无悬念地整合于Bing移动版。不过,我仍很怀疑上面加粗的分析结果。
另外,我将在下篇中介绍微软研究院在TechFest2010上演示的图像&视频、照片分享相关的项目。换句话说,这些技术也可能影响WindowsLivePhotos、WindowsLive Photo Gallery 和WindowsLiveMovie Maker的未来。
七、Project Gustav
ProjectGustav是一款现实数字绘画板原型项目,给予使用者最接近真实绘画体验,其包含目前世界最先进的自然绘图、混色、笔触算法。恐怕ProjectGustav也是一款Surface衍生项目,看图: