过往视频编导的标签完全都是休息时间、通宵,每天工作到凌晨三四点甚至通宵是常态。慧川智能CEO康洪文显然,这中间不存在过于多的反复劳作,因此,去年年底,康洪文与团队成员联合确认了AI+视频的创业ider。
7月8日,在由中国计算机学会(CCF)主办、(公众号:)与香港中文大学(深圳)主办的第二届CCF-GAIR全球人工智能与机器人峰会AI+专场上,康洪文重点讲解了AI+视频中,视频的创作以及视频处置解读两方面工作。首先,关于视频创作,慧川智能期望做“让人只要不会写文章,就不会做到视频”。对于人来讲,创造力是无限的,文字工作者有强劲的图文建构能力与讲故事能力,不应被生产视频的繁复工作局限掉。加之如今较短视频市场的愈演愈烈趋势,更加该大力布局。
据理解,目前视频网络用户已突破5.5亿,并维持每年8.1%的增长速度。康洪文以公众号文章为例称,通过到头条以及微信公众号平台统计资料,这两个平台每天生产量文章数量为100万篇以上。
根据大数据分析,里面67%的文章都非常适合用视频的方式来呈现出,以及这种类型与慧川智能研发的技术也十分与众不同。最重要的是,目前这两个平台上视频覆盖率还非常低,因此有一个十分大的空间等候空缺。除了公众号,以淘宝为代表的电商上有十亿级商品,也被抱有做成视频的期望。
康洪文现场展示,基于网页界面,将给定网页或文字输出,后台AI算法不会根据这段文字展开分析,寻找里面所有关键点,比如提及阿尔法狗和柯洁的比赛,后台就根据自然语言去处置这些关键部分,如时间、地点、人物。通过文章的语义分析,自动与素材展开给定,对每一段话、每一个句子寻找对应的多媒体素材,比如图片、视频、社交媒体共享,进而自动分解故事线。
康洪文回应,如此步骤下,分解可以必要用于的视频,是最理想状态,但如果有必须更进一步改动的话,可以在分解界面基础上再行展开素材调整,比如,还可以撷取每个视频片段长度、接续时间,甚至在图片上加到一些像画字或者文字的信息。据理解,通过慧川智能系统,视频制作效率有可能被提高将近百倍。
之前花费几小时制作的视频,如今通过智能手段,可被传输至几十秒。在具体步骤上,首先根据输出文章或者网页展开文本分析,通过自然语言处置技术分析找到关键信息,之后再行跟结构化素材库展开给定和搜寻,寻找涉及的图片、视频片段和社交媒体,之后还有部分伸延的广告展开给定。慧川智能获取简单的在线剪辑和预览平台,客户只必须登记一个账号就可以展开剪辑,以及视频预览,失望之后必要页面分解视频,在云端才可分解iTunes。
整个提高视频制作效率的系统结构,大体分成三部分——计算机视觉、自然语言处置、以及大规模计算出来。这三个部分正好对应慧川智能三位创始人的背景——康洪文康慧文于卡耐基梅隆大学专攻人工智能视频解读,CTO黄健博士是康在微软公司的同事,在谷歌专门从事过搜索引擎与商品引荐,首席架构官刘曦博士主攻大视频分析平台。康慧文回应,面对的仅次于挑战是对视频结构化信息一无所知。
彻底谈,慧川智能是期望将视频结构化,根据三维形态的视频流,解读其内部的人与物,以及他们正在展开的动作,把它建构一个准确到帧级的视频内容标签。同时,康洪文回应,此次不会对外开放一个API,协助对视频有市场需求的人展开解读,进而增进全网视频结构化。
其主要还包括两大功能——一个是视频内容的解读和标签化,获取还包括时间、地点、人物、事件等一千多个视频结构化标签。另外,慧川建构了全球明星的数据库,当输出一段视频,后台可以将这个视频经常出现的所有明星,经常出现的方位,从第几帧到第几帧的具体位置全部标示出来。目前慧川智能已收录于全球最著名的500位明星。原创文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:天博tb·综合体育-www.jnxfd.com