首页 > 科技 > 百度大脑公布语音日调用量超百亿!揭秘AI虚拟主持技术内核

百度大脑公布语音日调用量超百亿!揭秘AI虚拟主持技术内核


11月28日,百度大脑语音能力引擎论坛在京召开,百度大脑公布语音能力日均调用量已超100亿次。百度语音首席架构师贾磊全面介绍了百度语音核心技术能力,其中,AI虚拟主持人一开口就赢得不少参会者的惊叹。



温柔甜美的语音、精细自然的唇动,加上播报过程中不时点头、眨眼等细微表情,虚拟主持人灵动的神态堪比真人主播的新闻播报。“真是太自然了!很好奇这是怎么做到的。”在场嘉宾表示。

除了此次论坛上的惊艳亮相外,百度大脑AI虚拟主持人们也屡登大舞台,展现出“职业级”素质。在今年的五四晚会上,百度大脑AI虚拟主持人小灵元气登场,成为王俊凯口中本场最年轻的一位主持人。3D虚拟主持人小灵全程妙语连珠、还用人脸识别技术帮嘉宾测试“你是什么花?”、借由AR能力穿越到观众手机中实时互动,圈粉无数。除了小灵外,小菲也表现出色,现在她已经在百度与澎湃联合打造的,全球首档真人形象虚拟主播早晚新闻栏目中上线120天了!每天准点为大家带来专业的早晚新闻播报。



无论是3D人物小灵或是2D真人形象的小菲,她们背后都糅合了百度大脑领先的语音合成、唇动合成、肢体合成、视频合成等一系列多模态AI技术,呈现出灵动逼真的虚拟主播形象。

而作为主持人最为重要的基本功,其优秀的“口条”主要是语音技术与唇动合成技术在支撑。现场,贾磊介绍了百度语音合成与唇动合成联合技术的内核。据悉,百度研发了一套语音到唇形的回归技术,探索了唇形轮廓的匹配策略,最终用计算机图形学进行了高精度的纹理和合成匹配,唇动准确率可以达到98.12%。用户只需输入音频即可直接生成唇形动画,最快可以实现1倍实时以内的视频生成。这意味着10分钟的新闻视频仅需要10分钟即可完成生成!并支持7x24小时的在线服务。



除了舞台上靓丽的虚拟主持人外,虚拟形象技术还在众多行业中带来新惊喜。今年的百度AI开发者大会上,由百度与浦发银行共同打造的金融“数字人”正式亮相。这位“超级员工”基于百度大脑的AI技术实力,几乎复刻了一个真实的人,不仅说话风格自然流畅,还具备专业、高效的金融职业技能,拥有听声识人、察言观色的情商。作为浦发银行的首位数字员工,小浦正在努力学习成为优秀的理财经理,服务千万人。

文娱、金融、教育、医疗、政务、物流……可以预见,未来在诸多产业领域,训练有素、聪明体贴的智能助手将在各个场景为人们提供个性化的贴心服务。从虚拟主持人、虚拟客服到虚拟管家,智能技术将带来众多革新。



目前,百度大脑通过AI开放平台已开放228项技术能力,接入开发者超过150万,此次大会中,百度大脑公布语音能力日均调用量超100亿次,应用规模业界第一。一个“能听会说”的智能语音交互时代正在徐徐展开。

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/203803.html