什么是ACR技术?

自动内容识别技术(英文全称为Automatic Content Recognition)是一种利用计算机算法直接识别多媒体内容(音频、视频、图像)的技术,识别算法的输入可以是多媒体文件,也可以是通过麦克风、摄像头采集的原始数据,然后在海量多媒体数据库中进行特征比对、搜索,从而得到匹配结果。

ACR技术提供了一种新颖、便捷的搜索和获取信息的方式,用户无需任何手动输入,便可立即获得其感兴趣的多媒体内容的相关信息。目前已广泛应用于图像识别,音视频识别,电视节目多屏互动 ,电视、广播内容自动监测,多媒体版权检测,电视广告多屏同步等多个领域。

ACRCloud音频指纹技术能帮助我做什么?

精准触发第二屏应用针对电视内容的互动:触发节目,广告针对手机端内容的推送,同步以及电视同步广告推荐。应用可针对电视内容的进展设置互动栏目比如游戏,投票,抽奖等互动内容。

针对电视电台播放内容,音乐的播放统计和竞品广告播放分析:广告商,广告代理和内容版权拥有者可通过上传其版权作品或通过ACRCloud已拥有的音乐,广告库来监测各类电台,电视台播放其内容的频率和时间,精准定位广告价值和版权使用情况

针对音视频内容库的去重服务:帮助UGC视频和音乐歌曲运营商针对重复内容和版权内容的过滤和处理。可有效针对内容库进行去重和归类服务。

为什么要使用声音指纹技术进行跨屏互动?

目前电视节目与观众互动的手段已从热线,短信的传统方式向互联网过渡。目前触发电视节目互动的方式主要有以下几种及其问题:

扫二维码:需要用户将手机挪至靠近电视的地方才能扫描,同时部分电视屏闪问题,扫描成功率不高。

根据节目时间轴触发:只能特定与某一节目互动,无法定位用户是否在观看节目。同时如一节目有多点互动界面,则无法确认用户当前的精确收看进度,从而触发有效互动。

声音水印:每次都需要将节目预先加入声音水印,对电视台节目转播机房进行改造,工程周期长且无法大规模应用于各家电视台。同时通过高频声音触发互动的技术,针对部分听觉敏感的用户,会造成不适。

声音指纹:可解决上述技术的使用痛点,无需改变电视台现有转播设备,同时用户可在收看电视的同时,只需触发声音识别,即可准确识别出播出内容的频道,节目以及播放进度信息,从而精准定位互动内容。

为什么提供SaaS服务?

SaaS ( Software as a Service 软件即服务) 的优势在于用户只需接入互联网,就可以享受到ACRCloud的自动内容识别服务而无需购买软件搭建服务器。ACRCloud开发者平台提供一整套的平台开发工具供开发者使用。从内容的上传处理,内容管理和服务接口的调用,均可由开发者使用SDK和接口调用完成。

同时通过ACRCloud资源库服务,开发者即接入就可以使用平台提供的全球音乐识别库,全国主流电视台的识别以及全国电视台的广告内容库。服务按需收费,开发者省去了繁琐的收集素材和搭建信号采集设备所用的时间和投入,将拥有更多的精力集中在制作精彩的交互内容上。

录播内容互动和直播内容互动的区别是什么?

录播内容(Console中对应的音频/视频)互动是针对已录制好的内容在电视或其他终端设备中播放时触发互动而言。内容大多为广告片段,音乐和电影电视剧为主。通常为mp3,MP4,wmv,flv等音视频格式。

直播内容(Console中对应的直播频道)互动是针对无法提前获取到内容源内容的互动。通常此类内容为现场体育赛事,晚会,颁奖典礼直播等。使用此类互动,需要提供频道的音频/视频直播信源。信源形成的直播数字流不慢于受众观看节目的进度。ACRCloud平台通过实时解析直播频道的音频指纹与用户上传的声纹特征比对,从而识别频道。

录播内容和直播内容是否可以同时使用?

ACRCloud平台支持录播内容和直播内容的同时识别。如在识别频道的同时,播放的内容为已上传的录播内容,则可以同时识别出内容的频道和录播内容对应的信息。开发者可根据优先级触发对应的互动。例如:使用ACRCloud提供的全国主流频道库的同时上传某一汽车广告。则能够在识别播放频道的同时识别出汽车广告对应的关联信息。

使用安卓SDK识别会出现record error是什么原因?

当出现以下两种状况时,通常是由于安卓SDK没有获取到系统的录音权限。在设置中对APP打开相应录音权限后即可正常使用。

{“status”:{“code”:2000,”msg”:”record error”,”version”:”1.0″}}

or

A2B85945-E055-4A23-AC14-55E906D9AD85

 

安卓模拟器由于没有录音功能,所以无法使用,请使用安卓手机进行测试。

音频指纹的存储占用

音频指纹是将音、视频文件或流格式文件的音频特征提取出来的数据,其大小要远远小于文件本身,且不受到文件编码格式,码率大小,封装类型的影响。

通常来讲,一首4分钟的歌曲提取的指纹特征有100KB;一小时音视频内容的数据量大约在1.5MB左右。

所以当进行大量音视频指纹提取建库或文件去重的处理时,在文件本地通过指纹采集工具提取指纹将大大节省网络传输时间。

ACRCloud音乐识别服务与其他APP提供的听歌识曲服务有什么区别?

目前国内音乐流媒体应用中如QQ音乐,酷狗,网易云音乐,虾米等均具有“听歌识曲”功能。其听歌识曲的功能服务于其自己歌曲库的内容检索,通常能识别到的内容也仅限于其拥有的曲库。

ACRCloud提供的音乐识别服务与国外应用Shazam相似,内容为高度聚合的全球音乐内容,便于用户找到其想要的歌曲信息,不受限于某一流媒体服务的曲库内容。

ACRCloud控制台的操作文档