阿基米德FM 合作 关于 加入 下载

《中国广播》|阿基米德:技术赋能,构建以音频为原点的传播生态圈

摘 要 .

中国广播的融媒转型,需要时间来洞悉包括内容、主播在内的整个行业价值,把全国三千个频率、两万档节目、数万名主播视为优质的功能模块,探索不同模块的角色定位和相互关系,以互联网技术为引领,按照数据+算法+算力的理念,把信源获取、信息处理、信息传播、信息存储、信息变现等多个环节与广播现有能力对应,让“FM+App+物联网”成为有机共生体,共同参与,重构广播的未来。

01

洞悉广播的价值是这场融媒转型实践的关键

成为手段先进、具有竞争力的新型主流媒体,拥有强大实力和传播力、公信力、影响力,形成立体多样、融合发展的现代传播体系,需要破除地域化限制和人为媒体业态划分的限制,做从本土出发、实现服务全国的新媒体实验。

在这个过程中,以探索中国广播行业价值标准为出发点,洞悉行业形态成为关键点。阿基米德FM持续五年对全国广播节目和主播进行深度观察,涉及维度几乎涵盖了广播节目的所有类别,包括音乐、新闻、出行、维权、健康、情感、体育、科技、儿童、故事等节目,还有一些是非传统维度的节目类型,比如流量、深夜、地方特色、传统文化、指南、女性、双扶类等节目。

从观察节目/主播优质总量分布省份来看,江浙沪地区保持相对优势地位,特别是江苏和浙江,除了省台的贡献外,江浙各城市台也涌现了一定数量的优秀节目/主播。而广东、辽宁、湖北等地区则呈现了数量下滑的情况,广东省优质节目/主播主要来自省台和深圳市台,深圳市台的数量甚至更高些,而湖北均来自省台。山东、贵州、广西、福建地区节目品质持续提升,这几个省份的城市台也都有一定数量的贡献,城市台与省台共同进步,为当地广播媒体环境提供了持续发展的动力和活力。

省级电台凭借强大的资源和人才优势,加快了媒体融合和内容创新的步伐,利用各媒体账号矩阵的布局,保持了头部内容的IP热度;城市电台依靠忠实的本地用户,紧紧抓住本地影响力优势,增强对当地用户的服务性,通过各类具有亲和力的活动和互动,不断创新内容;中央广播电视总台则保持着高水准的内容优势,并持续生产出大批经典节目。

02

广播数字化至关重要

虽然互联网因其高效生产音频产品的能力,在很大程度上替代了传统媒体在信息传播中的位置,但是,通过持续观察不难得出结论,广播电台仍然是全国最大、最优质的音频内容生产集群,全国广播电台年均生产800万小时原创音频内容,持续不断的生产能力使得这个庞大的音频内容库持续迭代更新。问题是,广播线性播出的特质使得这些音频内容“播出即入库”,历史存量多数处在沉默状态。这场需要技术依赖的融媒转型实验,首先要把模拟信号转为数字信号:把广播从频点模拟信号转成数字化,即可成为用于互联网传播的音频流。现在,阿基米德FM客户端上能够收听到全国所有省市台的广播节目,在实现直播收听与回听基本需求的同时,另有诸如“播菜直播”这样能和所喜爱的主播近距离互动的在线音频直播模式。

这也是几乎所有传统媒体的新媒体产品会做的事情,把传统渠道的内容搬上互联网,有效解决互联网化的第一步。做客户端不是一场无用功,它就像在互联网上建立了一座自主可控的数字发射塔,将传统的模拟信号转化成为可标签、可分类、可搜索、可推送的数字内容,可以有效增加媒体精准控制、规模化对接移动互联网的能力。

03

向技术寻求广播融媒转型的源动力

(一)业务推动模拟信号输出端技术改造的不断迭代

面对一个线性直播媒体的技术诉求,我们知道,广播内容的互联网化大部分场景都需要实时处理,需要同步转化多路广播信号,同时还有在线编辑、实时切换、通道监听、事件调度的需求。

以阿基米德FM给某电台交付的广播节目实时数字化方案为例,采用4核1.5G高速DSP处理芯片,12G FLOPS 10500M MIPS驱动,同样国产自研的微龙TDOS实时操作系统确保了底层硬件计算和基础软件,可以支持上层音频处理以及事件调度和用户交互的实时性。同时,特定DSP音频处理和音频处理操作系统可用同样的功耗支持更多通道的反馈消除、矩阵混音、通道均衡/压缩/扩展、自动增益以及输出监听耳机或者扬声器管理,加上直观简易的用户操作面板,可以轻松管理广播节目数字化端到端的全过程。多达1000组预设规则能够使值班编辑的日常操作和运营运维极大自动化,最大程度降低人为操作的错误率。

这类解决方案的背后就是大规模音频处理算法沉淀到DSP专用芯片,从而完成音频处理的极限加速,提供给用户更大规模、更加细腻的音频内容处理。超大规模集成电路前置保证了处理和管理的实时性,更高性能音频编码技术允许内存可以容纳更多通道数据、更长时间窗口数据、超高速传输网卡实现零拷贝音频数据,最高可能减少网络抖动和拥塞影响音质和实时性管理,纯软件操作界面允许后期编辑和管理功能不断优化和升级。所以,多功能、多用途、综合复杂的软硬件一体化的媒体系统是广电媒体互联网化的基础和保证。

(二)内容的互联网化需求推动技术解决广播内容高效解析

动辄1小时的节目音频流,虽然解决了可以在互联网上随时随地收听这一需求,但是还要面临互联网内容传播需要的可检索、标签化、碎片化、个性化。对音频来说,每年800万小时的原创内容显然是不能依赖人工来做内容的检索、标签和碎片化,对于这点,不少自建版权资源中心的广电同行深有感触。

1.音频指纹技术

我们对智能音频的投入从了解音频开始,第一个涉足的就是音频指纹技术,音频指纹是指可以代表一段音频声学特征的数字签名,具备高度简洁和独一无二的特点。通过音频指纹的提取和比对,可以确定两段音频内容是否相同。在某些场景下,音频指纹也被称为音频的DNA。音频指纹系统通常包括两个部分:声纹提取算法和声纹检索算法。如下图所示。

通过音频指纹技术,阿基米德FM可以对广播音频流进行分析,做到可以识别和统计广播音频流中的歌曲、广告、重播节目等。这可以帮助我们了解全国广播歌曲的流行风向、广播广告播出情况和品牌投放情况、各台的节目生产和制作情况等。

图1:音频指纹系统

由于广播业务的独特性,这项技术并不能从技术供应商那里直接获得,比如与常见的“听歌识曲”功能不同,广播音频流的歌曲识别对声纹抗噪性要求不高,但对声纹的准确性、区分性和搜索速度有较高的要求。因此,我们要重点在声纹的特征分辨力和检索方案上做改进,让系统能够稳定识别同一歌曲的不同版本,且具备较高的识别速度。又比如,监播广告的时长最短只有4秒左右,且同一品牌的系列广告中存在不同版本,广告也存在时间伸缩可能,这些情况也给音频指纹系统带来很大挑战,我们通过采用抗时间伸缩且特征码密度更高的音频指纹,可以较好解决短时长、时间伸缩和近似版本广告的识别问题……随着音频的爆发式增长,音频指纹技术将在音频内容理解、播放监测、版权管理等多方面产生更多应用,新的算法也将伴随应用场景的不断产生而迭代,这是音频新媒体公司核心竞争力的一个重要组成部分。

2.音频拆条技术

音频指纹技术帮助我们初步认识了广播音频,随后,阿基米德FM在语音识别(转文字)、NLP(自然语音处理)算法、智能语音拆条等一系列智能音频技术上潜心钻研,阿基米德FM的音频解析能力可以通过内容的音频特征和文字特征对内容进行解析、分类、识别,找出其中的新闻、音乐、访谈、故事、相声、广告、片头片花等信息。有了这些信息,上千万小时的音频内容就有了被挖掘和使用的可能。通过音视频技术和AI(人工智能)算法的结合,阿基米德FM将广播节目数字化后进行内容理解,并根据内容传播需求,把一档完整的节目自动拆成一条条适合互联网传播且具备标题、标签、摘要的短音频。同时,构建了一个完整的应用系统,对拆条短音频进行审核、再加工,也可以通过一定编排规则的设定自动对相同主题的拆条内容进行不同形式的聚合,形成连续播放的24小时主题电台或者专辑,实现广播内容真正的互联网化。

当语音分析拆条更加实时精准时,热点新闻和热点话题就更加显而易见,全国广播都说到同一个话题的时候,第一时间会自动聚合出相关热点的电台,让内容自动“爆炸”。甚至还可以开放给个人主播用户,根据特定的关键词,去海量的内容库中查找相关的内容,组成个性定制化的不间断个人电台。阿基米德FM由此研发了一个个包罗万象、功能强大的内容库。

3.虚拟主播技术

以语音合成技术和文字处理算法为核心的技术,可以形成虚拟主持人,自动进行语音播报,以远高于真人的生产效率24小时不间断地制作内容。不过,在播音稿的制作方面,虽然可以自动处理基础稿件,但是仍然需要人工参与。

在虚拟主持人的打造方面,仍然需要以真人主持人作为学习目标。但随着AI技术的逐步发展,特别是自然语言领域的进一步发展,未来AI主持人将能够更理解播音内容,以更高的效率生产更多的优质内容。

阿基米德FM的虚拟主持人就是专门针对广播播音播报场景而打造的一款AI产品。得益于多年积攒的大量文本和语音素材及行业经验,阿基米德FM以业界领先的语音合成方案为基础,结合自然语言处理、语音识别等技术,在资讯播报、亲子、故事等垂域从合成效果、合成效率等方面进行优化。其中新闻资讯播报场景以广播节目实际制作方式为蓝本,独创性设计“AI对播”功能,以多主持人对播的形态自动合成完整的新闻播报节目,在合成效果上和真人主持人难分高下,而在稳定和效率方面,虚拟主持人则远远高于真人主持人,其内容生产效率甚至能达到真人主持人的20~30倍。

4.其他互联网媒体技术

媒体应更多了解来自计算机领域对于数据处理的核心技术,主动针对业务需求的应用开发,避免沦为互联网技术的边缘产业,比如搜索技术、推荐技术、合成技术正在重构媒体的生产过程。美国某公司的sportcode系统能够在很短的时间之内解析体育比赛的视频,自动根据体育比赛类型拆解比赛过程的画面、搜索比赛动作、运动员、裁判员、得分,提供数据统计,推荐核心画面回放。同时,针对某些球类运动,内置轨迹分析功能,最后合成最佳动作视频,帮助解说员、观众更方便、快捷地理解比赛的过程。

这样,体育赛事的直播、转播都会大大提升比赛的观赏性,吸引更多的观众。同时,这类直播、转播再叠加上互联网直播平台的观众交互技术,观众的体验感将会得到大大提升。这背后涉及繁复的数据流处理技术、视频音频结构化技术,以及数据标注、数据分类、数据聚合、数据蒸馏、数据知识提取、数据合成技术。不难得出结论,互联网技术确实重新定义了媒体。

04

构建以音频为原点的传播生态圈

媒体脱离自主可控的核心技术是无法应对此轮变革的,领先的音频解析合成能力、广播数据的抓取整合能力、内容画像及用户关系的洞悉能力,以及使用开放API架构实现对接等全链技术能力建设迫在眉睫。中国广播的涅槃,必然是以音频为出发点、技术加持的传播生态圈。

(一)互联网传播是内容+技术+产品+运营的系统工程

数年来,我们对传播的认识不断变化,要实现对海量用户个性化高效对接这个目标,需要通过内容、技术、产品、品牌的多重依赖和赋能。

对内容来说,一定是回归媒体本质,对优质原创内容的重要性要有清醒认知。这场以技术为主导的融媒实践,脱离不了人与人之间的强链接,但是,核心还是优质内容的传播。要意识到内容推动流量的关键并不在长短,而在于内容与用户之间的交互可能性,三个关键词:参与、分享、安全。

在产品上,脱离以客户端为中心的产品策略,打造互联网和物联网多端产品体系,目标是把广播音频送到所有需要他们的用户身边。与传统媒体产品不同,互联网产品需要根据用户、市场、需求的变化不断地进行迭代。因此,如何设计一个好用的互联网产品,对很多由传统媒体转型而来的新媒体来说,是一个需要考虑的问题。我们还需关注产品功能闭环,一个是功能对于用户产生价值的闭环,一个是用户使用场景的闭环。要想完成逻辑上的闭环,主要的流程包括:打造业务闭环、重视初次体验、赋能产品运营、服务忠实用户。这样就可以尽量避免一个产品上线后用户不知道如何使用或者不喜欢使用。

最后是品牌,这包括媒体自身品牌的影响力打造,以及因高效传播能力汇聚成的商业品牌池而形成的新商业模式。我们对传播的认识在不断变化,一次次的尝试帮助我们修订了基本的传播认知:“新广播、新传播”的互联网实践能强化媒体品牌的影响力,也可以强化广播的互联网思维。

(二)流量不是平台专属,内容是流量的策源地

中国互联网用户已经超过10亿,大平台应用之间的层层阻隔已成为主管部门要解决的重点,传播分层成为信息顽疾,一条信息怎样才能触达每一个人成为非常棘手的难题。所以,换个视角,将流量定义超越平台聚合,变成跨平台调动用户注意力的优质信息,在这个基础上讨论什么可以成为传统媒体的转型方向。

用户数量的多少,确实可以成为平台价值的一部分,但是太多的案例告诉我们,流量可以摆脱平台束缚,随着注意力的流动而变化。这个认知提醒我们:流量重回内容本质,只要能拿出优质内容,通过掌握不同平台规则和用户特性,就有机会高效调动用户注意力,可以随时站在同一起跑线上抢夺传播制高点。

那么接下来的2.0实验关键词应该是内容+连接,要思考的是,在人与人、物与物、人与物的智联互通进程中,音频扮演怎样的角色?比如,在品牌的传播进程中,要找到可以加速的方法,找到可以立体提升品牌价值的渠道。在信息到商品的传播转化演变进程中,媒体注定不是电商,但可以是电商生态中的一个环节……我们需要更为坚定的信念,坚定围绕技术、数据、优质内容做广播的迭代,坚定以主播IP为核心、以“FM+App”为入口,坚定将优质内容作为互联网时代传播的黄金节点,打造差异化的数字传播生态圈。

05

结语

经过这些年的探索,切身的体会是,要在中国广播这张大网里找到数字生态协同网的节点,把全国三千个频率、两万档节目、数万名主播视为优质的功能模块,探索这个复杂体系中不同模块的角色定位和相互关系,按照数据+算法+算力的数字理念把信源获取、信息处理、信息传播、信息存储、信息变现等多个环节与广播现有能力对应,让“FM+App”成为有机共生体和命运共同体,只有整个中国广播共同参与,共同把蛋糕做大,才有机会实现盈利模式的重构,实现传统广播的涅槃重生。

毫无疑问,实现这样的目标,不仅仅需要我们融媒转型的技术思维,需要纵横捭阖的视野,更需要一支支政治坚定、业务精湛、作风优良的学习型团队,有远见有使命感、有目标有执行力,通过与广播相伴相生的独立架构搭建,进行新的游戏规则和生态体系的尝试,构筑起产品持续迭代的能力,设计好以裂变传播为核心的流程,完成新传播的目标。(作者单位:上海广播电视台阿基米德传媒)


以上内容如需转载请注明来源并全文转载

< 返回