微软云存储服务OneDrive已具有自动生成相册和添加照片标签的功能,而现在研究人员能够借助机器人和人工智能为视频内容添加表情及标题。据外媒报道,日前台湾清华大学电子工程系教授林嘉文及孙敏宣布,他们与微软亚洲研究院的陶玫博士合作研发了这套系统。陶玫曾参与微软图像识别、分类、说明的数据集“语境下的普通物体(COCO)”的研发工作。
微软表示, 两名教授借助微软COCO数据集创建了一套系统, 利用机器人和人工智能来确定视频的主要内容,并未其添加标题。 微软在一篇博文中指出:“孙教授基于深度学习来自动找到视频中的特殊时刻或重要内容,并创建了一个视频标题生成新方法,基于视频中的这些重要内容产生准确及有趣的标题。与此同时,林教授则研发了一种能自动在视频中检测人脸的方法,并为分享这些视频的用户提供更丰富的总结及相关建议。 通过合作,他们的算法能检测并描述出重要内容,同时生成标签及标题。”
孙教授和他的学生还通过参加VideoToText challenge大赛(微软研究院资助)来进一步改善这一系统。 他们将在欧洲计算机视觉会议(ECCV)上展示这一研究成果。