合作咨询
信号处理
信号处理
基于阵列与深度学习技术,提供多场景高性能的人机语音交互与通话降噪功能。包括1mic、2mic、4mic、6mic、8mic及多种丰富阵型的远近场阵列处理方案,实现混响抑制、波束形成、回声抵消、声源定位、噪声消除等。在Interspeech2021噪声消除(DNS)与回声消除(AEC Challenge)评测中均获第二
了解详情面部识别
面部识别
拥有全面自研的人脸信息分析能力,包括人脸检测与矫正,属性识别,人脸比对和搜索,多模态活体检测等;针对性优化复杂光照和遮挡场景,支持戴口罩人脸识别通行;在 MegaFace 等多个国际公开竞赛中跻身第一梯队水准
了解详情OCR
OCR
多种通用场景的高精度全图文字检测和识别,包括各类印刷文档、表格、票据、卡证等;总体识别准确率达到 99%,具备离线和在线批量识别能力,可用于纸质文档电子化、办公文档/报表/票证识别等场景
了解详情发音评估
发音评估
基于语音识别和评价技术对发音做客观打分,反馈发音正误和定位问题。依托先进的神经网络算法,云知声口语评测的评测打分结果与人工专家打分拟合度在 95% 以上,拥有细分年龄段引擎,可多维度输出结果
了解详情语音合成
语音合成
基于深度学习和端到端的语音合成技术,可将文本实时、准确地转换为清晰、自然、流畅的语音,MOS 分可达 4.2,Blizzard Challenge 2020 多项关键指标第一名。提供离线和在线合成,多音色可选,20-300 句音库即可定制个性化音色
了解详情语义理解
语义理解
基于BERT的语义理解算法模型,少量训练语料即可达到92%的准确率,CPU解码耗时低于20ms;提供成熟的训练工具和闭环日志优化方案,具备高效的工业级NLU落地应用能力。公有语义云平台拥有95个通用技能,平均语义理解准确率94%
了解详情推理和决策
推理和决策
基于知识图谱的对话管理方案,具备灵活准确的流程驱动、省略指代消解和技能间跳转切换能力,对话管理准确率为98%;提供成熟的流程可视化拖拽编辑工具,具备高效的工业级对话流程设计与应用能力
了解详情知识图谱
知识图谱
大规模多源异构知识图谱构建与应用方案,具备低资源低成本知识抽取技术优势和敏捷构建的标准流程,并提供知识图谱全生命周期的管理平台和应用开发组件。基于知识图谱核心技术,《大规模知识图谱构建关键技术与应用》项目获得2019年北京市科技进步一等奖;获CCKS2020 医疗实体识别评测第一名、CHIP2019手术实体链接第一名
了解详情机器学习算法
机器学习算法
共享的前沿机器学习框架和算法,包括各种结构的有监督、轻监督和无监督学习方法,以及小样本、迁移学习、增强学习、因果模型、可解释性研究等,让底层机器学习技术突破,能尽快在感知、生成和认知技术方向上实现升级
了解详情智算集群(算力)
智算平台(算力)
高性能计算平台。面向人工智能计算场景,支持主流 AI 计算框架,高效弹性异构计算与 PB 量级高性能海量存储,峰值计算能力达到八亿亿次每秒,提供私有化部署,助力用户提升 AI 计算效率
了解详情1、中科院自动化所、CMU、西工大、上师大等产学研合作、联合实验室及人才培养基地
2、中医科学院等产业应用联合实验室