内容为核+全场景生态，AI技术推动音频行业全力“冲刺”

研究观点易观 2023-09-01 1.3W

伴随着AIGC的深化，音频平台也在不断探索全场景下音频形式内容的整合及创新，进一步优化用户的个性需求，提升用户粘性及用户体验。数据显示，中国在线音频市场收入在2016年至2020年保持着69.4%的年复合增长率，从16亿元增长至131亿元。

在政策与AI技术的双重推动下，音频行业进入了蓬勃发展期。

数据显示，中国在线音频市场收入在2016年至2020年保持着69.4%的年复合增长率，从16亿元增长至131亿元。

易观千帆数据显示，2021年中国在线音频娱乐市场规模已达到220亿元，预计2025年将达到1038亿元。自2021年3月以来，国内在线音频市场月活跃人数稳定在3亿人次，整体处于稳步上涨的趋势，在整个“耳朵经济”市场体量庞大、渗透率高的驱动下有较大增长空间。

截止2023年7月，全网在线音频娱乐用户规模达86225.94万，日均活跃人数为18602.18万，全网渗透率达82.16%，对比2022年8月，这个数字上涨了超3000万人。

此外，从使用时长来看，易观千帆数据显示，截止2023年7月，音频娱乐行业使用时长超过3小时，月人均启动次数达到33次以上，也就是说，每月有超过80%的互联网用户平均每天会至少打开一次音频娱乐软件。

由此可以看出，在当下的中国互联网用户群体中，大部分用户对音频这一娱乐形式已经形成一定的消费习惯，音频正逐步成为用户在多元时间和场景下的重要信息和娱乐选择

抓住内容优势，提升用户粘性

对于音频娱乐行业而言，内容是吸引用户和留住用户的关键要素。

一方面，AI 技术的进步正在加速音频内容的创作效率及内容分发效率，为用户在不同场景下提供更加多元的内容，满足用户的不用需求，2023年，ChatGPT技术横空出世，有了AIGC技术的赋能，在线音频平台在内容生产、用户交互、虚拟主播打造等方面也迎来更广阔的创新发展空间；

另一方面，年轻人已经成为在线音频用户的主力，2022年我国在线音频用户画像呈现出明显的年轻化特点，35岁以下用户占比超过80%。

易观千帆数据显示，我国在线音频用户的基本画像呈现出年轻、具备高消费能力、居住于大城市的男性的特征。具体而言，在性别方面，男性用户是主力军，占比达到63.24%；在年龄层次方面，以90后为主，24-30岁的用户占比达到64.99%；在城市级别方面，超一线和一线城市用户组成核心部分，比例将近60%；在消费能力方面，中高以上消费人群是当下的主流用户，占比高达70%。

整体来看，在线用户对音频内容的使用频率处于高等水平。超过八成的用户有每周听音频的习惯，一周听3-6次的用户是最为庞大的群体，其次是每天都听音频的用户，占比达到20%以上。

大部分在线用户不局限于使用一款音频软件，在不同软件之间切换是常态。超过七成的用户在电子设备中下载的音频软件数量在3个以上，拥有3-5个软件的用户群体占比最高，达到46%。

在此背景下，在线音频平台纷纷通过加大对新技术的研发投入，满足用户多元化、个性化的需求，为客户提供更为优质的服务，不断提升用户体验；同时借助AI技术聚焦平台自身运营管理效率的提高，助力音频内容生产的提质增速，激活体验场景。

2022年，云听获得总台音频版权，凭借总台的优势资源，同时加大AI技术的投入，在主流音频平台中起到引领作用。具体来看，云听聚合中央广播电视总台精品新闻节目，通过“AI主播+AI编辑”赋能，“AIGC”化生产有声快讯已达到“日产千条”，为用户提供“听云听，知天下”的全天候信息服务，成为用户耳边的资讯头条；自主研发了AI智能诵读评测技术，推出“云听朗读评测”系统，成为首个专为3～15岁中国儿童打造中文在线诵读评测产品的中央主流媒体，以AI技术实现高精度诊断、智能化纠错、多模式混合测评等智能服务；同时上线菁彩声播放器，成为国内首个覆盖主流手机终端操作系统播放国产三维声音频流的移动应用。通过总台秋晚、春晚、卡塔尔世界杯等多场重大活动，实现了云听菁彩声与公共大屏超高清视频同步直播

除云听外，其他音频平台也各显身手。

例如，荔枝在2022年推出自研技术综合平台“声音云”，加强对业务的中后台支持，包括推出自动化测试平台、商业智能分析平台、智能投放平台等。

喜马拉雅平台借助AI生产内容，基于自研的TTS框架制作了不同的TTS音色，满足用户多元化需求

基于AIGC打通全场景生态

众所周知，优质的内容需要精细化运营来实现，而对用户的精准需求把握需要建立在场景生态中，也就是说，内容生态需要建立在场景生态之上。因此，对于音频平台而言，对于场景生态的探索则更为迫切。伴随着AIGC的深化，音频平台也在不断探索全场景下音频形式内容的整合及创新，进一步优化用户的个性需求，提升用户粘性及用户体验。

云听、喜马拉雅、荔枝等互联网音频平台则选择与头部企业合作，实现品牌联动。

据公开报道，喜马拉雅与阿里、小米、百度、华为、美的等头部企业达成合作，93%以上的智能音箱都接入了喜马拉雅的内容。蜻蜓FM整个生态系统头部合作伙伴已达500余家，达成9000多万智能家居、可穿戴设备和车载智能终端内置量，在智能音箱等终端中内容调起率稳居高位。

随着智能网联汽车的发展，“未来车”是充分智能化生活空间的重要部分，特别是车内的智能屏，已经成为继电脑、手机之后的第三大智能终端。在车载场景方面，实现手机与汽车收听场景的无缝对接，为车主提供音频娱乐新体验；在智能多终端场景方面，通过技术赋能拓展业务边界，提升用户全场景使用体验。

例如，云听车机版承接了移动端的众多功能，采用大数据分析和AI内容推荐技术，基于驾驶场景和用户偏好，及时准确地为车主推送新闻、天气、路况、音乐等适合车载场景的电台流内容，并且通过车机推送准确及时的应急信息，将车机融入国家应急广播体系。

此外，云听实现中央广播电视总台三维菁彩声车载端到端创新示范应用，通过参数测试和数据分析，精准混音制作适用于车内各个坐席模式的标准化多声道节目声音，并通过车载端应用的多声道播放控制系统，精准实现面向车内不同坐席位置的三维空间音频的全新听觉体验，推动我国多声道音频技术在新媒体领域的产业化发展。

可以看到，在音频赛道，AI技术已广泛应用于各个场景，平台内容生产效率和用户服务水平都得到了质的提高，为在线音频平台商业化应用奠定坚实的基础。智能手机、AI音箱、车联网全面普及，多个场景下用户对音频内容的需求逐渐增加，也拓宽了在线音频平台商业化空间。

总之，AI技术的发展为在线音频行业的发展提供了良好的机会，“内容生态+场景生态”的结合是用户需求、市场发展、流量引导共同驱动的结果，但AI技术的发展也为音频平台的发展带来了诸多挑战

不久前，易观在《AIGC产业研究报告 2023——音频生成篇》中提到，随着人工智能技术的突破和不断迭代，音频平台还需要应对来自数据、性能、需求方面的三个挑战。

数据合规性方面，相比静态的文本或图像数据，由于声音信号本身具有自由度高、动态化的特点，对长时序列进行建模和预测的难度较高，生成连贯、高质量的音频需要依靠大量的文本-语音、语音-语音数据对进行训练，而目前语音训练数据主要来自开源数据集、企业自有数据等，但方言、小语种等低资源语音数据，用于语音翻译全流程对齐的标注数据仍然较少，另外还涉及到使用权限、用户隐私等数据安全问题，导致应用受限。

性能方面，音频生成本身与场景信息强相关，容易受到环境因素的干扰，因此在复杂环境下合成高质量语音对算法和算力的要求也随之提高，实际应用中还需要结合语音识别、声纹识别、自然语言理解、视觉内容理解等能力，将感知、认知与合成技术融合应用，提升产品的可控性和泛化能力，在影视、短视频创作等领域将产生更强的商业价值。

个性化需求方面，一方面需要模型支持不同类型的声学条件，支持通过小数据量训练、模型微调合成个性化语音，结合不同领域的专业知识提升交互能力，另外定制语音的组件化、可控性、部署交付等工程化能力也是实现大规模落地的关键因素。

但综合来看，通过多样化的“内容+场景”创新，音频行业正在以全新的姿态迎接未来市场格局的变化，为用户带来更优质的使用体验，未来已来。

未经易观分析授权，严禁转载、引用或以任何方式使用易观分析发布的任何内容。经授权后的任何媒体、网站或者个人使用时应原文引用并注明来源，且分析观点以易观分析官方发布的内容为准，不得进行任何形式的删减、增添、拼接、演绎、歪曲等。因不当使用而引发的争议，易观分析不承担因此产生的任何责任，并保留向相关责任主体进行责任追究的权利。

了解易观分析

内容为核+全场景生态，AI技术推动音频行业全力“冲刺”

热门推荐

联系我们