标签:AI算法

  • AI+XR技术是虚拟现实产业的新风口

      随着5G网络的逐渐商用铺开,如何将高带宽低时延的网络性能利用到更多用户的日常生活中也重新进入了更多人的视野,几年前曾引发业界热议的增强现实(AR)、虚拟现实(VR)等技术也希望能结合5G的各项优势,焕发出新的生命力。而在这些新概念中,我们越来越多地听到不少行业人士与上游厂商开始强调,5G与AI对于XR产业新一轮发展所起到的关键作用。

    AR/VR 1天前 946 0
  • 瓴盛重磅打造核心平台+产业生态,加速AIoT万千应用场景落地

    物联网已经成为继智能手机风口之后最大的半导体芯片应用增长点,据IDC市场分析报告显示,中国物联网市场规模增长潜力广阔,2022年将超越美国成为全球最大的物联网市场,占世界物联网总规模的四分之一以上,以此计算2025年中国物联网市场规模至少为3918亿美元。物联网的核心应用是网络、设备与人类的交互,而其中基于视觉的物联网应用无疑是其中的重中之重。前不久推出首颗AIoT SoC芯片JA310的瓴盛科技就锁定智慧物联网视觉应用,作为该公司打造全新移动计算平台,以及以移动通信和智慧物联网芯片双产品线并进战略的关键目标市场,并通过结合5G+AI将在包括智慧交通、校园安全、远程医疗、AR直播等更多行业应用领域提供更为丰富和细分化的应用落地。

    4天前 493 0
  • 自连科技发布智慧大健康和工业互联网等新基建领域内物联网解决方案

    自连科技携手伙伴打造端到端智能与物联解决方案平台,为智能医疗及工业物联网赋能

    5天前 836 0
  • 放射学中使用人工智能来协助图像解释任务的方法正在发展

      根据星期日的报道,正在放射学中使用人工智能(AI)来协助图像解释任务的方法正在发展,但是计算机辅助检测(CAD)时代的许多旧因素和概念仍然存在。在医学影像机器智能会议(C-MIMI)上的演讲。

    深度学习 2020年9月16日 321 0
  • 人工智能很可能会引发行业的重大变革

      机器视觉,自然语言处理,数据分析和其他深度学习应用程序将通过从汽车和医疗保健到金融服务和零售的越来越多的行业细分,推动未来五年全球AI软件收入。

    深度学习 2020年9月10日 379 0
  • 应用深度学习变革传统语音信号处理,让机器拥有类似人耳一样的听觉感知能力

    智能语音是人工智能技术的重要组成部分,包括声音前端信号处理、语音识别、语义理解、自然语言处理、语音合成等细分领域。在技术的具体落地中,消费级智能硬件是最早显示出市场潜力的赛道,从蓝牙耳机到可穿戴设备再到智能家居,各种产品都离不开相关的智能语音技术,而语音交互的第一步就是听见,声音前端信号处理的效果一定程度上制约了语音识别的效果,当前也有一些公司正在解决这一让各类产品“听得更清晰”的问题。

    36氪日前接触到的「大象声科」,是一家专注于机器听觉的人工智能公司。该公司于2017年在深圳成立,致力于应用深度学习变革传统语音信号处理,让机器拥有类似人耳一样的听觉感知能力。据了解,「大象声科」技术的理论基础为CASA(计算机听觉场景分析)+DNN(深度神经网络技术)。CASA 解决的问题是基于人的听觉原理来实现声源分离,该理论的奠基人汪德亮教授也是「大象声科」的首席科学家和联合创始人。公司通过将CASA和深度学习相结合,在业内首家成功实现大规模商用级的噪音和人声的分离,后续有望进一步解决鸡尾酒会问题。(注:鸡尾酒会问题是语音识别领域的痛点和难点,人们在鸡尾酒会中交谈,语音信号会重叠在一起,机器需要将它们分离成独立的信号)

    公司创始人兼CEO苗健彰向记者对比了传统信号处理和基于深度学习的信号处理方式的差别——传统的数字信号处理方式主要依据固定噪音特性和方向,通过滤波器对信号进行相应的过滤和增强。但因为生活中的噪音不一定存在固定特性,并可能来自于各种方向反射,所以传统方式或许无法彻底解决复杂噪声环境中的问题。而CASA+DNN的方案是让机器通过训练获得与人类听觉感知相似的机制,从而去认知周边的声场环境,在复杂场景中提取、识别人声。

    在技术产业化这一块,「大象声科」首先从“降噪”切入,一方面解决通讯过程中的噪音干扰问题,让人们在复杂的现实噪声场景中拥有更加清晰、更加私密的通话体验;另一方面解决语音识别中噪声干扰问题,让机器在“听清”之后听得“更懂”。为此,公司推出了Vocplus智能语音增强和Vocplus Smart智能语音交互方案,目前已经在手机、耳机、PC、对讲机、VoIP、IoT等行业成功落地。

    在研发过程中,苗健彰认为,把技术从理论进行工程落地转化是最大的难点,其中将神经网络小型化和模型的泛化是决定深度学习能否应用于实际产品中的重要环节。“大象声科在这方面有一套独特的技术,能够在不损失精度的情况下,使得算法参数尽量少,计算速度尽量快,这也是为什么目前我们的深度学习降噪算法快速落地到像耳机这类可穿戴产品。另外,市面上已经有上千万台设备搭载了公司的算法,帮助公司沉淀了大量数据。大象声科将人耳的听觉机理与深度学习相结合,也大幅提升了算法的泛化性能,形成了较高的技术壁垒。”他介绍。

    相较而言,公司目前在手机、耳机等消费电子行业有比较多的应用案例,这和行业本身的需求和规模相关。“现在中国绝大部分的手机品牌,比如小米、OPPO、vivo都已经有使用「大象声科」的通话降噪技术(Vocplus Telecom)以及游戏抗啸叫技术(DHS)的量产案例。”苗健彰说。在前不久发布的华为FreeLace Pro耳机上,也搭载了公司的Vocplus AI三麦通话降噪方案。

    此外,自去年以来的TWS耳机增长浪潮,也让越来越多的耳机厂商逐渐采纳以AI技术为主导的通话降噪方案。「大象声科」是率先在蓝牙耳机上落地AI语音降噪的公司,首个成功量产案例是OPPO Enco Q1 。并且,2020年「大象声科」与漫步者合作,成功落地了第一个AI算法结合骨传导sensor的通话降噪方案,可以让TWS耳机在通话时完全屏蔽周围噪音(包含人声噪音在内),实现私密性更强的通话体验。

    谈及客户方的具体考量维度,苗健彰介绍客户主要会围绕通话清晰度进行评价,在这方面,业内有一套衡量通话降噪效果的客观标准3QUEST,测试指标包括:S-MOS(人声保留程度),N-MOS(噪音消除程度),G-MOS(综合通话降噪性能),而公司由于采用较独特的AI技术,在测评中得以展现优势。

    在产业合作上,「大象声科」目前已与Qualcomm,CEVA,Cirrus Logic,Infineon,Rockchip和BES等国内外知名芯片厂商建立合作关系。其中值得一提的是,公司在2018年拿到了小米和高通的融资,并在之后和高通一起进行联合技术推广,这也为公司在市场拓展和品牌建设方面提供了一定帮助。在收费模式上,大象有按照license授权和按项目收费两种方式,当前license总装机量在数千万级别,今年的营收在数千万元量级。

    在未来的行业延展中,「大象声科」计划进一步完善整个语音技术链条,把应用场景从近场拓展到远场,为更多行业如助听器、智能家居、会议系统、智能车载等带来更精准更智能的语音解决方案。

    团队方面,公司创始人兼CEO苗健彰UBC软件工程学硕士毕业,曾就职于IBM、RBC等500强企业,并在加拿大成功创办过一家软件公司 。联合创始人兼首席科学家汪德亮教授是计算机听觉场景分析奠基人之一,也是全球首位将深度学习应用于语音增强的科学家。联合创始人兼CTO张学良多年从事语音分离、增强算法研发工作,是内蒙古大学计算机学院教授。

    深度学习 2020年9月2日 947 0
  • 西北地区开放第一辆市政道路5G自动驾驶公交车

    开通西北地区第一辆市政开放道路5G自动驾驶公交车,让市民可以现场感受现代黑科技的魅力;打造全区第一个5G智慧社区,让更多智慧应用服务百姓生活……提起内蒙古鄂尔多斯,人们脑海中往往浮现出“羊煤土气”四个字,如今,移动5G正助力鄂尔多斯摆脱资源型城市的刻板形象,走在智慧城市建设的前列,扬眉吐气!

    2020年8月28日 850 0
  • 将AI嵌入物联网融合后会发生什么?

    你是否想过我们周围的一切变得智能化? 小工具如何拥有做出类似人的决定的能力?

    2020年8月21日 339 0
  • 剖析AI芯片市场:为什么要加强深度学习

    目前,整个AI芯片市场都围绕着深度学习而展开。深度学习(DL),则正是让AI应用程序在现实世界中真正发挥作用的最成功的机器学习技术范例。

    2020年8月15日 821 0
  • 从云到边缘的转变,标志着物联网连接真正的自主革命

    从云到边缘的转变可能标志着物联网连接真正的自主革命。之前,我们见证了云计算如何实现集中化和协作-边缘设备都是关于能够自动脱机工作,无需将数据发送到云进行处理和存储的功能。这是物联网设备的未来及其对连接的意义。

    2020年8月10日 692 0
  • 结合眼球追踪和AI,裸眼3D虚拟屏Roomality来袭

    在今年CES上,索尼展示了一个可以用于电影拍摄的3D容积摄影虚拟场景技术,其结合3D动捕对虚拟场景进行捕捉和建模,并将捕捉到的视频内容以动态的形式播放,当屏幕前的摄像头移动时,所显示的画面也会跟着动态改变,看起来就像是具有3D深度的拍摄场地一样。

    2020年8月7日 735 0
  • VR可以挽救房地产市场吗

    这场疫情,改变了你的哪些消费习惯? 据国泰君安证券研究所消费大组九大行业近期共同推出的《疫情重塑消费习惯》报告指出:第一,是人们“健康”的价值回归;第二,是“无人化”的餐厅革命;第三,是“云生活”的持续普及。在线教育、在线办公、在线医疗、在线娱乐甚至在线卖房、卖车等,过去几年资本和企业投资无数也未能教育成熟的一些市场,反而被一朝催熟。

    2020年8月5日 835 0
  • FSI可以利用大量数据来自动化流程,减少欺诈

    在几乎所有城市转身,您很可能会看到拐角处的银行,贷方或经纪人。实际上,在我家的小镇上,我们在两条车道的街道两边都有两个同名的金融机构。那很方便。而且,尽管我喜欢拜访我的家乡银行家所获得的个人经验,但我也很高兴能够在银行家回家吃晚饭后开展业务,并且知道我的欺诈保护从未消失。

    2020年7月25日 721 0
  • 统一智能化管理运维平台,真正实现电力物联网

    摘要:联想企业科技集团选择开放技术体系,与变电站共同搭建基于互联网架构的开放式统一智能化管理运维平台,连接应用和数据,实现真正的一站式,即插即用。建成后的电力物联网系统可实现设备信息自动采集、远程自动巡视、海量数据高效处理、异常信息智能推送,结合机器学习形成经验沉淀,推进变电站运维管理智能化。

    2020年7月23日 457 0
  • AIoT是实现万物智联的“钥匙”

    如果说IoT打开了万物互联的大门,那么AIoT(人工智能物联网)则是实现万物智联的“钥匙”。

    2020年7月17日 402 0

联系我们

在线咨询:点击这里给我发消息

邮件:78799268@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code