阿基米德FM 合作 关于 加入 下载

当广播音频流遇到音频指纹|阿基米德传媒六周年

六年的声音行走,阿基米德传媒不断摸索百种广播与传播的方向,从技术维度出发掌握传播效率与深度定制;从移动互联网与FM频点之间的差异化发现传播的破圈点;从用户思维方式的改变捕捉新的传播需求……近期,小编将请我们的小伙伴们从各自不同视角来诠释自己对于广播的、媒体的、传播的看法。

今天,小编给大家分享到的是阿基米德传媒高级软件开发专家胡蓓蓓的文章:《当广播音频流遇到音频指纹》

全国各地的广播电台每天不间断播放由主播编排过的歌曲,这些歌曲的播放影响着上亿人群对歌曲的关注和喜爱,由此不同地域对不同歌曲关注的分析极具价值。怎样了解全国广播歌曲的播放,阿基米德FM每天实时更新的全国广播电台热播歌曲榜是怎样来的?这里就和大家一起了解下榜单背后的一个技术——音频指纹(Audio Fingerprinting)。还有,除了歌曲榜单,音频指纹技术在阿基米德广播音频流检索中还有哪些应用呢?一起来看一看吧。

一、音频指纹技术介绍

音频指纹是指可以代表一段音频声学特征的数字签名,具备高度简洁和独一无二的特点。通过音频指纹的提取和比对,可以确定两段音频内容是否相同。在某些场景下,音频指纹也被称为音频的DNA。音频指纹系统通常包括两个部分:声纹提取算法和声纹检索算法。如下图所示。

常用的声纹提取算法有Philips,Chromaprint,Echoprint,Landmark等,借鉴图像检索方案,时频谱SIFT特征也用于提取音频声纹。音频指纹长什么样呢?下图展示了Shazam提出的一种指纹算法。在实际场景中,通常根据音频情况以及具体的检索要求,选择合适的声纹提取和检索方案。

(Wang, A. (2003, October). An Industrial Strength Audio Search Algorithm. In Ismir (Vol. 2003, pp. 7-13).)

二、应用实践

1、广播歌曲识别

首先要对全国范围的电台音频流进行分析,识别和统计广播音频流中播放的歌曲,就可以反映出全国广播歌曲的流行风向。不同于常见的“听歌识曲”功能,广播音频流的歌曲识别对声纹抗噪性要求不高,但对声纹的准确性、区分性和搜索速度有较高的要求。因此我们重点在声纹的特征分辨力和检索方案上做了改进,系统能够稳定识别同一歌曲的不同版本且具备较高的识别速度。目前阿基米德FM的广播歌曲识别,覆盖了平台几乎所有的音频流,在广播歌曲的识别和榜单统计上取得了不错的效果。

2. 广播广告监播

面向广告商和广播电台,广告监播功能用于监测指定的广告音频在广播音频流中的播放次数和播放时间。这一功能背后的核心技术也是音频指纹。 我们对监播的广播音频流建立了声纹库,对指定广告音频提取声纹,查询广播音频流声纹库,即可获得指定广告的播放时间。但是由于监播广告的时长最短只有4秒左右,且同一品牌的系列广告中存在不同版本,广告也存在时间伸缩可能,这些情况都给音频指纹系统带来很大挑战。这里我们采用了抗时间伸缩、且特征码密度更高的音频指纹,较好地解决了短时长、时间伸缩和近似版本广告的识别问题。 我们抽取了全国的若干广播音频流进行实验和评估,广告的查准率和查全率都达到了0.98以上。相比于传统的人工监播方式,引入自动广告监播可在数据准确性和工作效率上取得显著的提高。

3. 广播节目重播联播检测

在广播节目的排期中,广播电台的节目安排存在重播、转播、联播等情况。从广播音频流的节目单维护以及内容理解角度,一个自然的问题就出现了:哪些时段的广播音频内容是重播、转播和联播内容?基于音频指纹技术,我们设计了音频流的重复时段检测方法。通过对广播音频流提取音频指纹,以及不同时段间的高效检索和比对,可以准确地检测出广播中的重播、转播和联播时段,相关方法还申请了发明专利并获得授权。

在实际应用场景中,阿基米德FM的节目单系统维护了全国范围内最为完善的广播节目单,该方法可以有效提升节目单的维护效率。另一方面,从广播音频流内容理解角度,该方法可以准确标记重复音频时段,对于重复音频则不需要进行后续的内容理解和短音频拆出流程。

三、总结与展望

在这篇文章中,我们介绍了音频指纹技术的概念和常用系统结构,分享了阿基米德FM将音频指纹与广播音频流相结合产生的实践案例。随着音频的爆发式增长,音频指纹技术将在音频内容理解、播放监测、版权管理等多方面产生更多应用,新的算法也将伴随应用场景不断产生。

延 伸 阅 读

《阿基米德智能拆条获总局人工智能应用创新大赛二等奖》(2021-05-27 )

2021年5月27日,由国家广播电视总局举办的首届广播电视和网络视听人工智能应用创新大赛在北京颁奖,阿基米德自主研发的“广播节目自动拆条系统”荣获智能剪辑类二等奖。

这一比赛旨在从选题策划、生产制作、媒资管理、分发传输、运营服务、智能终端、运行维护、监测监管等多个领域,选择当前广播电视和网络视听人工智能应用热点场景作为比赛内容,面向全国征集评选优秀的人工智能应用项目,激发广电行业人工智能科技创新和应用创新,引领智慧广电创新性发展。大赛共吸引包括中央总台、百度、爱奇艺、省级台及有线网络公司等报送的多个项目参赛。

经过推优、初赛和决赛等三个阶段,广电总局共评选出智能内容审核、智能效果评估、智能推荐、智能剪辑、视频修复、智慧广电终端等6个大类获奖项目。阿基米德参评的智能剪辑类最终评出一等奖3个、二等奖6个、三等奖8个。

目前传统媒体转融媒体过程中,大部分情况下仍然以完整的节目回听形态进行传播,但完整的节目回听在传播效率和用户收听消费便利性方面,远低于加工后的短音频。

阿基米德智能音频拆条系统是基于阿基米德自主专利技术为核心的一个智能音频拆条和编排应用系统。通过音视频技术和AI算法的结合,阿基米德将广播节目数字化后进行内容理解,并根据内容传播需求,把一档完整的节目自动拆成一条条成适合互联网传播、具备标题、标签、摘要的短音频。同时,构建了一个完整的应用系统,可以对拆条短音频进行审核、再加工,也可以通过一定编排规则的设定自动对相同主题的拆条内容进行不同形式的聚合,形成连续播放的24小时主题电台或者专辑。


以上内容如需转载请注明来源并全文转载

< 返回