京东 JoyAI 语音大模型 LiveTTS 支撑 618 多场景语音交互_新消息

发布时间：2026-05-29 18:10:11 文章来源：中金在线

作为京东自研的语音合成能力，京东JoyAI语音大模型LiveTTS覆盖“捏声音

【资料图】

作为京东自研的语音合成能力，京东JoyAI语音大模型LiveTTS覆盖“捏声音”、方言切换、情绪控制和小语种合成等方向，并已应用于JoyInside智能终端、JoyAIApp万能博士、京东数字人JoyStreamer、AI播客等场景，为618期间多场景语音交互提供技术支撑。　　近日，京东JoyAI语音大模型LiveTTS已全面接入京东JoyClaw。　　六大核心能力覆盖语音生成关键环节　　JoyAI语音大模型LiveTTS围绕语音生成、表达控制和音色定制，形成六项核心能力。　　在语言覆盖方面，LiveTTS支持中英、粤语、德语、法语、西班牙语、日语、韩语、荷兰语、阿拉伯语等多语种合成，适配不同语言环境下的内容表达需求。　　在方言表达方面，LiveTTS可实现方言解耦，覆盖东北话、河南话、闽南话、天津话、四川话、陕西话、粤语、上海话等全国多地方言。　　在表达控制方面，LiveTTS具备情绪解耦与语速解耦能力，可实现不同情感控制和语速控制，使合成语音在情绪、节奏上更贴合文本内容与使用场景。　　在音色定制方面，LiveTTS可通过融合多个音色的声纹，实现新的声音捏制；同时支持基于3—10秒音频完成一句话音色克隆。　　这些能力使LiveTTS不仅能够完成文字到语音的转换，也可围绕语言、方言、情绪、语速和音色等维度进行控制，适配不同业务场景下的语音交互需求。　　多场景应用提升语音交互体验　　目前，LiveTTS已在京东多个业务场景中应用。　　在JoyInside智能终端场景中，JoyInside生态涵盖玩具、机器狗、学习机、台灯等多元终端。LiveTTS通过方言解耦能力，可一句话实现方言与哼唱合成，提升不同地域、不同年龄用户的语音交互体验。　　在JoyAIApp万能博士场景中，JoyAIApp作为“能聊能办”的万能数字助手，兼具工具与陪伴属性，并深度融入京东供应链。用户打开JoyAIApp，即可体验万能博士对话效果。目前，每天有数万人与万能博士进行聊天对话。　　在京东数字人JoyStreamer场景中，京东数字人JoyStreamer目前累计服务超7万商家。借助LiveTTS，数字人主播可呈现更具情绪张力的表达效果，支持直播间商品讲解与互动等场景。　　在AI播客场景中，LiveTTS可将图文内容转化为拟真人声表达，用户打开JoyAIApp即可体验相关能力。　　大模型技术支撑618高并发场景　　声音是情感、情绪表达的重要载体。近年来，大语言模型的发展正在重塑语音合成技术范式，即将语音转化为Token序列进行深度建模。JoyAI语音大模型LiveTTS依托LLM底层能力，引入自然语言指令控制，可通过Prompt实现同一音色在多语种、多方言之间切换，并对复杂情绪进行控制。　　据介绍，该能力打破了传统主流TTS中音色与方言绑定、情绪不饱满、语速难以调控等问题。伴随音色与语种、方言、情感等能力的解耦，语音交互正在从单向信息传递向更具情感表达的方向发展。　　618作为超大规模工业场景，对语音交互技术提出了高并发、低延迟、高稳定性等要求。除上述场景外，LiveTTS相关能力还支持了智能客服、营销等数十个场景应用，为京东618期间每日千万级、全场景、高并发的实时交互提供超低延迟、高稳定性输出支撑。

标签：京东

精彩文档:

vivo S60：4K原生实况重新发明Live|每日短讯

今头条！首批国家医保项目目录制定工作方案公开征求意见

观焦点：德昌电机控股(00179.HK)发布年度业绩股东应占溢利2.02亿美元同比下跌23%

企业名称申报服务性指引出台

2017年1月人工智能让34名人类员工下岗