标签:智能语音

  • 百度VR业务已在全国范围内推广

    百度虚拟现实产品部门总经理丁志刚在2020国际消费电子大会期间接受媒体专访时透露,百度今年VR(虚拟现实)业务收入有望以倍数递增,VR教育、VR营销、VR看车等方案已经开始“变现”。同时,电池续航能力、处理器、内容参差不齐等仍是限制VR设备普及的重要因素。

    5天前 331 0
  • 5G网络的两大支柱应用:AR/VR和4K/8K超高清视频

    今年以来,我国AR市场热度不断升高,IDC数据显示,2020年中国AR/VR市场规模总额占全球份额的38.3%,排名第一。近日,多家手机厂商的AR眼镜相关专利和新闻被曝光,各AR初创企业的AR眼镜产品提高了各行业的生产效率,在全球新冠肺炎疫情中助力抗疫。AR眼镜为何这么火?

    2020年9月20日 745 0
  • 工业听诊器:为机器“预测性维护”

    1984年12月,印度博帕尔农药厂异氰酸甲酯泄漏事故导致数十万人死伤,成为世界工业史上的巨大惨案。

    2020年9月8日 919 0
  • 应用深度学习变革传统语音信号处理,让机器拥有类似人耳一样的听觉感知能力

    智能语音是人工智能技术的重要组成部分,包括声音前端信号处理、语音识别、语义理解、自然语言处理、语音合成等细分领域。在技术的具体落地中,消费级智能硬件是最早显示出市场潜力的赛道,从蓝牙耳机到可穿戴设备再到智能家居,各种产品都离不开相关的智能语音技术,而语音交互的第一步就是听见,声音前端信号处理的效果一定程度上制约了语音识别的效果,当前也有一些公司正在解决这一让各类产品“听得更清晰”的问题。

    36氪日前接触到的「大象声科」,是一家专注于机器听觉的人工智能公司。该公司于2017年在深圳成立,致力于应用深度学习变革传统语音信号处理,让机器拥有类似人耳一样的听觉感知能力。据了解,「大象声科」技术的理论基础为CASA(计算机听觉场景分析)+DNN(深度神经网络技术)。CASA 解决的问题是基于人的听觉原理来实现声源分离,该理论的奠基人汪德亮教授也是「大象声科」的首席科学家和联合创始人。公司通过将CASA和深度学习相结合,在业内首家成功实现大规模商用级的噪音和人声的分离,后续有望进一步解决鸡尾酒会问题。(注:鸡尾酒会问题是语音识别领域的痛点和难点,人们在鸡尾酒会中交谈,语音信号会重叠在一起,机器需要将它们分离成独立的信号)

    公司创始人兼CEO苗健彰向记者对比了传统信号处理和基于深度学习的信号处理方式的差别——传统的数字信号处理方式主要依据固定噪音特性和方向,通过滤波器对信号进行相应的过滤和增强。但因为生活中的噪音不一定存在固定特性,并可能来自于各种方向反射,所以传统方式或许无法彻底解决复杂噪声环境中的问题。而CASA+DNN的方案是让机器通过训练获得与人类听觉感知相似的机制,从而去认知周边的声场环境,在复杂场景中提取、识别人声。

    在技术产业化这一块,「大象声科」首先从“降噪”切入,一方面解决通讯过程中的噪音干扰问题,让人们在复杂的现实噪声场景中拥有更加清晰、更加私密的通话体验;另一方面解决语音识别中噪声干扰问题,让机器在“听清”之后听得“更懂”。为此,公司推出了Vocplus智能语音增强和Vocplus Smart智能语音交互方案,目前已经在手机、耳机、PC、对讲机、VoIP、IoT等行业成功落地。

    在研发过程中,苗健彰认为,把技术从理论进行工程落地转化是最大的难点,其中将神经网络小型化和模型的泛化是决定深度学习能否应用于实际产品中的重要环节。“大象声科在这方面有一套独特的技术,能够在不损失精度的情况下,使得算法参数尽量少,计算速度尽量快,这也是为什么目前我们的深度学习降噪算法快速落地到像耳机这类可穿戴产品。另外,市面上已经有上千万台设备搭载了公司的算法,帮助公司沉淀了大量数据。大象声科将人耳的听觉机理与深度学习相结合,也大幅提升了算法的泛化性能,形成了较高的技术壁垒。”他介绍。

    相较而言,公司目前在手机、耳机等消费电子行业有比较多的应用案例,这和行业本身的需求和规模相关。“现在中国绝大部分的手机品牌,比如小米、OPPO、vivo都已经有使用「大象声科」的通话降噪技术(Vocplus Telecom)以及游戏抗啸叫技术(DHS)的量产案例。”苗健彰说。在前不久发布的华为FreeLace Pro耳机上,也搭载了公司的Vocplus AI三麦通话降噪方案。

    此外,自去年以来的TWS耳机增长浪潮,也让越来越多的耳机厂商逐渐采纳以AI技术为主导的通话降噪方案。「大象声科」是率先在蓝牙耳机上落地AI语音降噪的公司,首个成功量产案例是OPPO Enco Q1 。并且,2020年「大象声科」与漫步者合作,成功落地了第一个AI算法结合骨传导sensor的通话降噪方案,可以让TWS耳机在通话时完全屏蔽周围噪音(包含人声噪音在内),实现私密性更强的通话体验。

    谈及客户方的具体考量维度,苗健彰介绍客户主要会围绕通话清晰度进行评价,在这方面,业内有一套衡量通话降噪效果的客观标准3QUEST,测试指标包括:S-MOS(人声保留程度),N-MOS(噪音消除程度),G-MOS(综合通话降噪性能),而公司由于采用较独特的AI技术,在测评中得以展现优势。

    在产业合作上,「大象声科」目前已与Qualcomm,CEVA,Cirrus Logic,Infineon,Rockchip和BES等国内外知名芯片厂商建立合作关系。其中值得一提的是,公司在2018年拿到了小米和高通的融资,并在之后和高通一起进行联合技术推广,这也为公司在市场拓展和品牌建设方面提供了一定帮助。在收费模式上,大象有按照license授权和按项目收费两种方式,当前license总装机量在数千万级别,今年的营收在数千万元量级。

    在未来的行业延展中,「大象声科」计划进一步完善整个语音技术链条,把应用场景从近场拓展到远场,为更多行业如助听器、智能家居、会议系统、智能车载等带来更精准更智能的语音解决方案。

    团队方面,公司创始人兼CEO苗健彰UBC软件工程学硕士毕业,曾就职于IBM、RBC等500强企业,并在加拿大成功创办过一家软件公司 。联合创始人兼首席科学家汪德亮教授是计算机听觉场景分析奠基人之一,也是全球首位将深度学习应用于语音增强的科学家。联合创始人兼CTO张学良多年从事语音分离、增强算法研发工作,是内蒙古大学计算机学院教授。

    深度学习 2020年9月2日 947 0
  • 分析AI云服务市场格局:智能语音、图像视频和机器学习

    国际数据公司(IDC)新发布的《中国人工智能云服务市场研究报告(2019)》显示,中国AI云服务市场2019年市场规模达1.66亿美元,2018至2024年CAGR将达到93.6%,AI能力已成为用户进行云服务选型时的重要考量因素。

    2020年8月13日 990 0
  • AI芯片与工业物联网有何优势和差异化?

    刚刚落幕不久的全国两会,再一次将AI、5G和物联网的行业话题推向新高潮。

    2020年8月9日 1.01K 0
  • 虚拟现实技术需解决四大技术“奇点”

    谋求重生的 Google Glass 和微软的 Hololens 近两年搅动了整个科技圈,引爆了人们对于虚拟现实(Virtual Reality)技术的无限期望。钱学森先生将虚拟现实技术翻译为“灵境技术”,很形象的反应了虚拟现实技术的应用场景,那就是重建一个真实的世界,并且还要让人能够走进去。

    2020年8月8日 944 0
  • 5G等技术将促进智能产品互通互联,加速物联网技术落地

    “智能助理”“APP操控”“家电互联”……如今,很多家居产品都主打智能化。近年来,智能音箱、扫地机器人、智能门锁等智能家居产品逐渐走入千家万户,为人们的居家生活增添了便利和乐趣。另一方面,如何建立标准规范,提升用户体验,防范安全风险,也成为智能家居产业融合发展所面临的挑战。

    2020年8月3日 596 0
  • Ar眼镜可以取代手机吗

    脸书过去几年一直在华盛顿州Redmond市的Facebook Reality Labs开发增强现实智能眼镜,但是随着项目在技术研发上遇到困难,因此脸书正构思寻求其他业者的帮助。根据消息传出,现在脸书与雷朋(Ray-Ban)母公司Luxottica的合作,尝试在2023年至2025年之间针对消费性市场开发出真正结合流行时尚与科技的智能眼镜。

    2020年8月2日 676 0
  • 观众可通过官网“云智能体验”板块了解新技术新应用

    第四届世界智能大会即将拉开帷幕。本届大会采用“云上”办会的全新模式,届时全球观众可跨越地域阻碍,共同聚焦智能科技产业。此外,与大会同期举行的世界智能驾驶挑战赛、智能安全大赛、智能体育大会等赛事也将全部在“云上”举办。

    2020年7月21日 939 0
  • 国家发改委正式宣布“5G+智慧教育”示范应用城市

    第四届世界智能大会开幕式暨主题峰会上,科大讯飞董事长刘庆峰做了以“人工智能产业发展新趋势”为主题的主旨演讲,与大家共同探讨人工智能产业发展和技术进步的一些思考和看法。

    2020年7月20日 634 0
  • 大数据和人工智能“上阵”抗疫

    “人工智能一定要解决刚需,而不是做一些可有可无的噱头性的东西。”6月20日,在《中国企业家》杂志社主办的2020(第二十届)中国企业未来之星年会暨中国企业家生态大会上,科大讯飞董事长刘庆峰这样说。

    2020年7月16日 419 0
  • 为什么TCL电子的优势在于其通信硬件优势以及智慧显示技术硬件优势

    主要负责全球彩电品牌业务的TCL电子宣布拟以15亿元收购TCL通讯,TCL通讯主要负责全球手机品牌业务。

    2020年7月16日 900 0
  • 物联网成为推动 Wi-Fi 芯片行业发展新引擎

    1、Wi-Fi 是局域物联网的核心连接方式 1.1 Wi-Fi:应用最广的联网方式 Wi-Fi 是全球应用最广的局域网连接通信协议,在手机、电脑、平板电脑等主流消 费电子终端已经成为标准配置。随着芯片成本的快速下降,Wi-Fi 物联网应用领域 得到广泛的应用,包括智能扫地机器人、空调、智能摄像头、智慧插座等。根据 IDC 数据,全球 WiFi 芯片出货量在 2022 年将达到 49 亿颗,占据各大主流互联方案出 货量的 40%以上,是物联网最主要的连接方式之一。

    2020年7月14日 444 0
  • TWS蓝牙耳机+智能音箱,有望成为智能家居入口

    一年一度的IoT-Smart Future深圳国际物联网与智慧未来展将于2020年9月9日-11日深圳市国际会展中心全面升级,融合5G、IoT、嵌入式、车联网等行业应用及创新关键力量;加速粤港澳大湾区电子信息产业的创新突破与转型升级。

    2020年7月13日 750 0

联系我们

在线咨询:点击这里给我发消息

邮件:78799268@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code