云蝠智能VoiceAgent2.0 发布会内容分享
云蝠动态 SEO 人工智能 语音智能 云蝠智能 数字员工 企业级AI 语音识别 对话理解 自动化构建 全渠道部署
2025-11-20 13:26:00
本次活动是云蝠智能在成立七周年后举办的重要里程碑事件,标志着其新总部正式启用,并发布语音智能体2.0版本。活动汇聚政府领导、投资机构、行业伙伴及媒体代表,共同探讨人工智能特别是语音智能的未来发展路径。
PART 01
主要主题概述
本次演讲围绕“从软件到智能:语音智能的跃迁与组织化未来”展开,重点阐述了:
- 人工智能如何从辅助工具进化为具备独立决策能力的“数字员工”;
- 语音智能在降本增效之外,正在创造过去无法实现的新业务场景;
- 企业级AI应走向“组织化智能”,即多个AI协同完成复杂任务;
- 云蝠智能7年创业历程中的战略选择、技术沉淀与生态构建;
- 对未来5年语音智能将如何重塑人机交互方式的深度展望。
PART 02
关键要点详述
一、政策支持与产业生态建设
南京经济开发区管委会副主任汤伟指出,经开区已将人工智能作为产业升级的核心抓手,打造“中国南京智谷”产业地标。园区现有400余家AI企业,核心产值达100亿元。为支持大模型企业发展,园区推出多项举措:

- 建设大模型集聚区公共服务平台;
- 出台接力孵化计划,在算力补贴、人才支撑等10个方面提供支持;
- 新组建近百亿规模的人工智能专项母基金;
- 提供14万平方米AI Tower作为物理承载空间。
- “园区对于好企业的支持和服务也将以上不封顶、精益求精的理念更进一步。”
- 二、云蝠智能的成长之路与战略转型
- 创始人回顾了公司从2019年起步至今的发展历程:
- 初期团队仅几人,聚焦声音互动能力;
- 2025年前AI收入占比不高,通过深耕特定行业(如地产)实现生存;
- 获得奇迹创谈、中原资本等机构多轮投资;
- 当前已发展为百余人团队,成为国内大模型语音智能领域的新兴力量。
- 核心战略转变:“与其选择戊戌变法,不如选择自我革命”,从“辅助人工”走向“替代人工”。
- 三、语音智能2.0的技术突破
- 云蝠智能2.0版本在以下维度实现全面升级:
- 1. 语音识别与合成
- 支持四川话、粤语等多种方言;
- 声音延时接近一档标准,情感表达涵盖高兴、悲伤、害怕等多情绪;
- 实现边输入边思考的并行计算模式。
- 2. 对话理解与记忆系统
- 构建基于上下文和用户记忆的复杂业务处理能力;
- AI具备“职业记忆”、“关系记忆”,形成个性化知识库;
- 可处理医疗、客服、催收等高复杂度场景。
- 3. 自动化构建与测评体系
- 用户只需上传PPT或资料,即可自动生成AI客服;
- 系统自动抽取业务实体、构建知识库、生成提示词逻辑;
- 引入多AI平行测试机制(通义千问、豆包、DeepSeek等),对对话体验进行客观打分与优化。
- 4. 全渠道部署能力
- 不仅限于电话端,还可集成至网页、企业微信、钉钉、飞书等平台;
- 支持C端个人手机部署,实现全天候电话接听与信息处理。
- 四、真实应用场景验证
- 演讲中展示了多个实际案例,证明AI已在部分业务上超越人类:
- 医疗系统外呼案例
- 初始人工通话量:146通/月;
- 两个月后AI接管:提升至162通;
- 最新数据:达到360+通/月,效率翻倍。
- 原因分析:人类接线员存在抗拒心理,易挂断;而AI始终保持耐心,“您慢慢想,您慢点说”,显著提升留存率。
- 智能催收解决方案
- 传统人工培训周期长,成本高;
- AI助理可快速上岗,结合债务人画像制定个性化谈判策略;
- 在某资产管理公司试点中,回款率从人工的36%-48%提升至AI的72%;
- 成功应对“逃避型债务人”,利用情感分析与长期策略达成协商。
- “AI不是冷冰冰的机器,它能感知负面情绪,也能用‘影响孩子读书’这样的切入点打动对方。”
- 五、AI组织化的未来构想
- 发言人提出,下一代AI不应只是“数字员工”,而应是“数字化组织”:
- 多个AI分工协作,模拟前台销售、中台运营、后台审批流程;
- AI具备成长性,可通过自我迭代不断优化性能;
- 支持插件化扩展、极速声音克隆、客户旅程全链路管理;
- 目标是让AI“从可以听见到可以看见”,推动VoiceAgent 3.0的研发。
PART 03
重要引用
“计算为了无法计算的情感,声音终将无处不在。”—— 云蝠智能创始人
“我们愿意在这个周期里去直接从辅助人工走向替代人工。”—— 云蝠智能创始人
“AI已经做到了每年好……它的反应速度、情感表达和生成质量都具备全面超越。”—— 产品演示环节总结
“让语音智能不仅听懂指令,更能读懂人性。”—— 活动总结发言
PART 04
听众可执行要点
- 评估AI替代可能性:审视现有业务中是否存在“低利润、高频次、7×24小时需求”的服务场景(如政务热线、客服咨询、催收提醒),这些是最适合AI落地的突破口。
- 尝试自动化构建工具:访问云蝠智能官网,使用其AI生成平台上传业务文档,快速搭建专属语音助手原型。
- 关注情感化交互设计:在部署AI时,不仅要考虑准确性,更要注重语气、节奏与共情能力,提升用户体验。
- 探索AI组织化应用:思考如何将单一AI角色升级为“AI团队”,实现跨部门流程自动化。
- 参与生态合作:联系云蝠智能获取2.0产品体验包,加入其合作伙伴网络,共享技术红利。
PART 05
结语
本次活动不仅是云蝠智能的一次品牌升级,更是对中国语音智能产业发展方向的一次深刻诠释。在一个“知识获取成本趋近于零”的时代,真正的价值正转向“能动性成本的降低”。云蝠智能正致力于让AI从“会说话的工具”进化为“有思想的生命体”,开启一个属于声音的全新纪元。
PART 06
VoiceAgent2.0 新版本更新了什么?
11月14日,在南京 VoiceAgent 实时语音大会现场,云蝠智能VoiceAgent 2.0版本重磅发布!
本次版本更新,主要在技术底层(延迟、拟人、识别)、智能体(幻觉控制、注意力、工具调用)、操作性(CUI 界面、AI FDE、Voice IDE)和渠道(C 端个人助手及网页客服)进行了全栈升级。
此次更新的亮点主要包括:
模型能力全面升级:
- 对话、构建、质检:全面适配国内最主流模型,GLM4.6、Qwen3MAX、Deepdeek3.2、豆包 1.6Pro 等主力模型。
- TTS:全面升级 TTS 技术,延迟减少 100ms,支持小样本快速克隆,支持复杂情况下的数值处理,50 国语种合成,南京话、天津话、河南话等十余种方言合成。
- 多模型并行调用:
- 支持同一指令在多个模型中同步运行,充分整合不同模型的优势,实现 “智慧最大化”。
- 从 ASR、LLM、TTS 的并行调用,到语气模型、对话模型、插件模型的协作调用。
- 幻觉控制:
- RAG2.0,支持对数据进行二次加工清洗,让数据形成 QA 结构,提高 LLM 本身对知识的理解能力。
- 引入时空注意力机制,让对话可以有效控制注意力,强化对手客户情况及业务风险。
- 对话评分和自主迭代:
- 基于对话的核心北极星指标,模型会对每一通电话的内容进行字段级别的抽取、分析和打分,形成数据资产,并反向对智能体进行持续迭代。
- 插件及函数2.0:
- 支持自主创建客户端插件,通过模型自主构建局部闭环插件,进行对话服务。同时引入函数概念,支持对用户信息进行组合查询。
- AI FDE:
- 基于对提示词工程和 FDE(前线部署工程师)工作的理解,我们构建了一套可以操作云蝠智能系统的智能体,可以通过对需求的理解、联网查询、文件理解和系统生成的提示词模型框架,组合构建贴合甲方需求的VoiceAgent,并自动完成热词、ASR、TTS、注意力等所有页面操作,实现 3 分钟,交付一个对 500 强客户及格的语音智能体。
- VoiceIDE:
- 基于对 IDE 产品的理解,我们将语音提示词工程进行优化,提供了提示词区块、函数、动态规则等诸多操作,让简单的一张输入页面,具备复杂语音对话构建的可能性。
- RealTime 网页客服:
- 基于 webRTC 的能力,我们将实时对话能力引入网页,支持在网页端的实时语音对话,并提供多种基础样式体验。
- C 端个人助手:
- 通过对通信能力的持续理解,引入个人电话助理产品,未来将发布 IOS 及安卓版本产品。
- 云蝠智能 VoiceAgent2.0凭借以上核心升级
- 成为实时语音互动的优选平台更多升级详情,详见https://voicegpt.feishu.cn/wiki/HRmhwhHBHiyi33kCDoJc9jcAnSz
- 您也可以直接访问【官网】云蝠智能VoiceAgent 大模型呼叫 AI 语音智能体 智能体呼叫 AI 呼叫 AI 外呼
- 注册体验云蝠智能 VoiceAgent2.0 最新特性!
Loading...