音频指纹技术在车载娱乐系统中的应用

音频指纹技术在车载娱乐系统中的应用

音频指纹检索是人工智能领域自动内容识别技术(Automatic content recognition)的核心算法,与语音识别(如科大讯飞,Nuance)将一段用户的语音转化为文字不同,音频指纹技术不区分语言,是一种声音对声音的精确检索。通过对声音产生的音频指纹匹配,将一段声音中的内容与内容库中的内容做比对,精确识别出库中对应的内容以及对应内容的所在位置。在现实应用中,音频指纹技术广泛应用于歌曲的识别如“听歌识曲”, 电台,电视台内容监测和手机第二屏互动领域。但音频指纹技术在车载领域的应用却很少被大家所熟知。其实如果留意车载娱乐系统,很多知名的汽车品牌如宝马,丰田,福特,特斯拉,都已将音乐识别技术内置于车载的媒体管理系统,用于提高车主在驾驶中的娱乐体验和信息检索的安全性。以下是现实中车载音乐识别的一些使用场景:

1. 车载听歌识曲

开车的途中,无论是传统、网络电台,手机蓝牙设备中播放的歌曲,用户只需通过触发,即可通过车载麦克风进行录音识别,通常仅需3-7秒钟,即可识别出歌曲的信息。在一些车连网手机应用中,识别到的歌曲还可被推送到用户手机,并提供流媒体音乐的链接,车主可一键收藏和播放识别到的音乐。

Pure一键识别歌曲

识别的歌曲通过蓝牙推送到手机APP

获得2015年红点设计奖的英国车载品牌Pure,将听歌识曲功能集成至设备中,用户可一键识别电台播放的音乐并将歌曲相关信息推送到Pure的手机APP中。同时在APP中Pure提供一键链接,用户可将喜欢的歌曲添加到流媒体服务如Spotify中。

荣威RX5 YunOS通过主动触发,识别环境中的音乐

2016年上汽荣威与阿里联合发布的首款互联网汽车RX5 YUN OS版中,当用户在电台收听到自己喜欢的音乐时,可以通过听歌识曲功能一键识别并保存当前播放的歌曲。

2. 实时电台播放歌曲展示

电台播放的音乐是车主获知最新,最热音乐的主要渠道。音频指纹技术应用于传统电台,卫星电台和网络电台中,可在电台播放中自动识别到播放的歌曲并将歌曲的信息呈现在屏幕上。此功能进一步降低驾驶者主动触发识别在开车中的干扰,并实时了解电台中的歌曲信息。

特斯拉电台歌曲自动展示功能

博泰电台歌曲自动显示

3. 歌曲文件ID3信息补全

通过蓝牙和USB连接至车机的音乐文件如果是CD转入或网络下载的,通常会缺失或误报歌曲的相关信息。通过音频文件中的指纹特征比对,音乐识别技术可将歌曲的ID3信息补全和更正。因而准确的歌曲和专辑信息可被呈现在车机屏幕上。

4. 音乐流派分类

一个用户下载,收藏的歌曲通常有几十首到上万手之间。如何在驾驶的同时查找收听某一类型的歌曲从来都不是一件容易的事。然后通过音频指纹技术可将识别出的歌曲根据metadata中的流派分类,用户只需根据歌曲类型如“摇滚”即可浏览当前所有的摇滚歌曲。

马自达3 2016款将用户USB中的歌曲按流派分类

5. 电台歌曲推送

通过音频指纹指纹技术对电台在服务器端的监控,电台中播放的节目,广告和音乐可以通过推送的方式呈现给用户。当用户刚刚切到一个喜欢的节目但节目马上就结束的时候,通过音频指纹的监控技术,可将完整节目的录音推送给用户以供回听。同时电台中播放的广告和音乐如果用户感兴趣,也可一键保存下来。电台过去播放的节目和内容也可通过音频指纹监控的播放数据统计出来。

一键触发电台识别

识别出的内容按节目,广告和音乐分类呈现在手机应用中

澳洲车载应用Airshr与本地电台合作,车主在行驶中听到自己感兴趣的内容,只需一键点击,即可识别出正在收听的内容。如是音乐,可识别出音乐相关信息;如是广告,则提供广告信息以及店铺位置,优惠券等促销信息。如是节目,则提供节目的完整录音,即使刚听,节目就结束了,也可在稍后收到手机推送的完整节目录音。用户识别和互动的数据还服务于电台的收听调研,便于广播公司针对收听群体的节目的改进和推广。

系统集成方案

音频指纹技术在车载领域的对音乐的识别与车载地图导航相似,即可提供离线,在线,和离现在线混合模式。离线解决方案可根据汽车销售的地区将当地最热门的歌曲音频指纹和歌曲信息储存在车机本地,无需网络,即可覆盖大多数的歌曲识别需求。缺点是需要车主对本地曲库升级才可获取到对新歌的支持。在线搜索则无需在车机本地建立内容库和升级,只需很少的网络流量即可完成歌曲搜索。但瓶颈是在网络受限的情况如地库,隧道中则无法使用此功能。除此之外,虽然音频指纹的检索每次耗费的流量很有限,但对于开启音乐自动检索的用户也会带来流量的顾虑。目前音乐识别最好的方法是离线和在线的混合模式,通过本地储存的高频歌曲指纹库来降低在线识别的请求次数,同时在线识别作为补充,可将最新的歌曲识别出来。

伴随车联网和信息检索领域的技术水平升级,在驾驶中如何更好的个性化向用户推荐感兴趣的内容和更便捷的信息检索将成为用户选择一款车的重要衡量标准之一。目前在音乐识别车载解决方案中,美国的Gracenote与整车品牌合作,率先将音频指纹技术应用在欧美日车系中。来自中国的ACRCloud已与众多上述车载设备和汽车tier1和tier2供应商整合,将更好支持中国用户的音乐识别服务方案带入自助品牌和合资品牌中。未来将会有更多的整车品牌和新能源汽车配置音频指纹识别技术。

附:

作为内置“听歌识曲”功能的首个互联网汽车荣威RX5 YUN OS版在发布后,“听歌识曲”功能得到了用户的一致好评:

汽车论坛中,RX5 车主的评价截图: