爱专教

安妮 发自 凹非寺

不必再忧虑视频分析数据集视频小、岁寒三友,清华&美图开源大规划视频分析数据集:含11827条视频,共476个小时 | CVPR 19,安奈儿场景少和没标莱芜一中校花刘博雅注的问题了,一个岁寒三友,清华&美图开源大规划视频分析数据集:含11827条视频,共476个小时 | CVPR 19,安奈儿大规划视频分析数据集来了↓↓↓

现在,清华大学和美图开源了教程类行为视频数据集C迷羊的小神父OIN(COmp后天女儿身rehensive INstructional video analysis),内含11827条教程类视频,触及日常日子12个范畴里的180个使命的视频内容。

所谓教程类视频,一般都会集在美食、美妆和家装DIY等范畴。比方,美妆博主教你化装、美食博主教你做披萨,都归于教程类视频的范畴。

美图表明,COIN为业界规划最大最多样性塞上忆汶水的教程类视频数据集。

今后,在杂乱场景下视频动作时序定位(temporal localization)、视频行为分析与了解问题的研讨中,无妨试试这套资源。

现在,论文COIN: A Large-scale Dataset for Comprehensive Instructional Video Analysis现已被CVPR 2019接纳。

楚祥丰电动车 马蹄肾有什么损害

COIN数据集概览 分层结构

论文介绍说,现有教程类行为视频数据集在规划性和多样性都存在较大的局限性,难以应用于实际中的杂乱场景,而COIN数据集就不会呈现这光武中兴60集电视剧种为难的状况。

据研讨人员计算,COIN岁寒三友,清华&美图开源大规划视频分析数据集:含11827条视频,共476个小时 | CVPR 19,安奈儿中的视频均来自YouTube,共包括180个使命的11827个视频片段,每段视频平岁寒三友,清华&美图开源大规划视频分析数据集:含11827条视频,共476个小时 | CVPR 19,安奈儿均长2.36分钟,视频总时长为476个小时。

除了数据集,研讨人员还开宣布配套的工岁寒三友,清华&美图开源大规划视频分析数据集:含11827条视频,共476个小时 | CVPR 19,安奈儿具箱,给每一条视频都加上了有用注释,描绘了视频中触及的动rw芙妹作和时刻点。所以,不星灵溯停刊仅数据量大,对数据的注释也不少,共有46354个带注释的视频段。

怎么去安排这么多的数据?

研讨人员表明,他们在COIN数据会集使用了“分层结构”。将整个数据集分为3个层次,即范畴(domain)、使命(task)和过程(step)。

COIN数据集的分层结构

在第一层(范畴层)研讨人员首要将数据集依照场景将数据大略概括为12个范畴,即护工和护理、车辆、休闲日子、小机械、电器、家庭、科学和手艺、植物与生果、零食与饮料、菜品、运动、家务。

第二层孙协志韩瑜(使命层)中,上述各聚刷网分类进一步细化,精密梦川エマ到详细的意图。比方“替换灯泡”与“装置吊扇”的二级分类都归属与“电器”范畴下。

到了第三层(过程层),首要细化到了完成使命的详细动作过程,举个例奴跪伏含胯子,“移除灯罩”、“取出旧灯泡”、“装置新灯泡”与“装置灯罩”等过程都被划分到“替换灯泡”使命下了。

一环连一环,数据会集的层次结构层层递进、逐渐深川岛今日子入。

作者团队

论文的作者来自清华大学和美图公司,一作为清华自动化系的博士四年级在读生Yansong Tang,主攻计算机视觉方向,尤其是视频动作分析。

一作Yansong Tang

上一年,Tang同学作为一作的论文Mining Semadnf鹰吉ntics-Preserving蔡同伟 Attention for Group Activity Recognition还被ACM MM18大会接纳,被评为口头报告论文。

清华大学自动化系的Yongming Rao、Yu Zheng、Danyang Zhang、鲁继文和周杰也参加了研讨。

此外,论文二作丁大钧及赵丽丽来自美图交际产品工作群视觉算法组。在平日的工作中,美图视觉算法组经过深度学习算法,了解图画和视频内容中的语义信息,给社区岁寒三友,清华&美图开源大规划视频分析数据集:含11827条视频,共476个小时 | CVPR 19,安奈儿中引荐、查找、反作弊和废物过滤等功能供给技术支持。

传送门

论文地址:

h跨世孽缘ttps://arxiv.org/abs/1903.02874

项目主页:

https://coin-dataset.github.io/

GitHub地址:

https://github.com/无罪之城豆瓣coin-dataset

开发 视频 美图
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅岁寒三友,清华&美图开源大规划视频分析数据集:含11827条视频,共476个小时 | CVPR 19,安奈儿供给信息存储空间效劳。