博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
微软影片索引器更新!找影片更简单
阅读量:5949 次
发布时间:2019-06-19

本文共 1246 字,大约阅读时间需要 4 分钟。

微软影片索引器更新!找影片更简单

微软的影片索引器服务(Video Indexer)以多模态主题推理(Multi-modal Topic Inferencing),为使用者提供更直觉的影片分类方法,还能优化其内容探索功能。微软提到,由于影片索引器可以理解媒体中的内部关系,因此比手动标记影片内容更加高效且低成本。大型媒体服务常会面临媒体内容管理的问题,而且要对媒体进行内容探索,也会因规模的关系变得更加困难,虽然将影片按主题分类是一个好方法,但是内容分类是需要演绎推理的,影片中不一定会明确的显示,微软举例,像是医疗保健相关的影片,内容并不一定会出现医疗保健这个词。有不少企业转而手动标记内容,但微软表示,手动不只成本高昂且耗时,容易发生错误并且无法有效扩展。为了解决这个问题,微软在其影片索引器加入了多模态主题推理,该功能使用跨频道模型,索引媒体内容以自动推理主题。该模型会将影片概念投影到3个本体(Ontology),并以3大讯号包含转译影片语音还有字幕OCR的文本,以及对影片进行名人人脸辨识结果,来推论影片主题。
微软影片索引器更新!找影片更简单
影片索引器用于推理影片主题的本体包括IPTC、百科和影片索引器分层主题。IPTC本体在媒体企业中很受欢迎,提供超过1,100个术语的媒体主题分类。而百科的170万个类别,也可用作主题卷标,优点是这些类别受到良好的维护,主题与文章采用的类图连结,使其成为一种高解析的本体。影片索引器分层主题本体则是一个最大深度为3层,拥有超过2万条目的专有的分层本体。影片索引器过去使用关键词萃取模型,强调经转译与字幕OCR的重要词汇,微软以Build 2018开发人员大会的开幕主题演讲为例,透过萃取关键词索引主题,会出现网页开发、单词嵌入、无服务器运算等关键词。微软提到,关键词萃取与主题推理模型最大的差异在于,关键词是影片中明确提到的术语,而主题是推论出来的,像是使用知识图透过(Knowledge Graph)汇整相似的概念,以推论出高阶内隐概念。

微软影片索引器更新!找影片更简单

影片索引器应用两个模型来萃取主题,第一个是深度神经网络,根据大型专有数据集,直接对原始文本进行评分和排名,该模型会将影片转译文本,映像至影片索引器本体与IPTC。第二个模型则是对影片中提到的命名实体,使用光谱图算法(Spectral Graph Algorithms),该算法利用经辨识名人的百科ID,以及OCR和翻译文本的讯号。

由于这两类讯号分属结构化和非结构化的数据,因此微软使用ELIS(Entity Linking Intelligent Service)会在自由格式文本中识别命名实体,将非结构化数据转成结构化,以便之后能完全利用结构化数据进行主题撷取。微软利用百科页面实体的相似度,以及从影片页面撷取到的不同概念,建置出图,并在最后阶段,根据后验机率(Posteriori Probability)排名百科类别,以找出适合的主题。更多相关IT信息:胜博发爱心公益

转载于:https://blog.51cto.com/13373212/2341735

你可能感兴趣的文章
每天一个linux命令(58):rcp命令
查看>>
再论三层架构
查看>>
nginx代理多次302(nginx Follow 302)
查看>>
Jquery教程 1.jquery的基础选择器
查看>>
我的友情链接
查看>>
Highcharts和Hinghstock图表构造参数常用属性
查看>>
模糊测试工具Simple Fuzzer
查看>>
RabbitMQ入门(六) —— 持久化
查看>>
iOS12系统应用发送邮件中的附件
查看>>
我的友情链接
查看>>
LFS学习中遇到的错误
查看>>
lnmp安装脚本
查看>>
Yarn流程、Yarn与MapReduce 1相比
查看>>
SANS:2016年网络威胁情报现状调研报告
查看>>
xlsx格式Excel的处理
查看>>
mysql create database 指定utf-8编码
查看>>
maven 生成可执行的jar的多种方式
查看>>
VS2005访问数据库超时
查看>>
iOS 开发百问(2)
查看>>
MySQL for Mac 安装和基本操作(包含后期的环境变量设置)
查看>>