杉果游戏官网

您现在的位置是:首页 > 新闻动态 > 杉果游戏官网_“AI+语音/图像”智能技术线上论坛圆满成功

杉果游戏官网_“AI+语音/图像”智能技术线上论坛圆满成功

文章来源:杉果游戏官网  作者:杉果游戏官网  发布日期:2021-08-09  浏览次数:914  【打印】  【关闭】   【返回

7月15日,由全球知名电子科技媒体主办的“AI+语音/图象”智能手艺线上论坛美满进行,本次论坛约请到来自知存科技、莱迪思、声扬科技、清微智能、希尔贝壳等企业的专家和带领进行出色的手艺分享。在电子行业内卷严重的时辰,人工智能是为数不多还在快速增加的行业之一。电子发热友总司理张迎辉暗示,之前人们对人工智能的手艺界说,长短常高峻上,很是前沿的,颠末三年的AI手艺落地,很多伴侣将人工智能手艺的界说,改成了削减人力工作的智能手艺。知存科技:存算一体芯片的成长、挑战和将来本次论坛,知存科技CEO王绍迪带来的主题是《存算一体芯片的成长、挑战和将来》,知存科技成立在2017年,而且公司团队早在2012年就最先存算一体手艺研发,2018年完成国内首个存算一体芯片流片,2020年发布首个存算一体芯片产物WTM1001,2021年WTM1001量产,并发布第二代产物WTM2101。据王绍迪介绍,近十年来摩尔定律最先放缓,而存储器在更早的时辰摩尔定律就接近终结,好比DRAM工艺此刻进行到10-20nm之间,一般在15-17nm工艺,Flash通常为20-40nm之间的工艺流程,存储器的工艺现实上比逻辑芯片更老,这致使存储器的速度在曩昔10-20年里都很难晋升。这就造成了存储墙瓶颈,一是数据搬运慢,存储容量愈来愈年夜,存储器带宽速度没有增添,CPU速度愈来愈快,核数从双核、四核、八核,到几千核、上万核,这致使每一个核能利用的存储器资本愈来愈少,数据量年夜,做运算的时辰,年夜部门时候都耗损在数据搬运上,运算速度遭到存储带宽的影响,没法进一步晋升。

二是搬运能耗年夜,据王绍迪介绍,在28nm工艺下,32bit数加法功耗根基是0.1/0.9pJ,乘法是3.1/3.7pJ,当把64bit数从8KB SRAM中掏出,耗损功耗10pJ,从1MB SRAM中拿出,耗损功耗100pJ,申明存储器越年夜,从中掏出一个数需要的功耗也越年夜,假如从芯片外部DRAM中掏出来,需要耗损2000pJ,搬运功耗是运算功耗的几百倍。此刻年夜部门芯片都采取冯诺依曼架构,上述存储墙瓶瓶颈与此有关,为领会决这些问题,呈现了3D Xpoint、3D封装等方案,用在削减搬运耗时和功耗年夜的问题,不外这些还都是采取冯诺依曼架构,存算一体与这些方式有所分歧,存算一体可以理解成用存储器去做运算,存算一体芯片也像是计较芯片。存储一体的利用场景普遍,包罗可穿着、智能IPC、移动终端、AR/VR、智能驾驶、数据中间等,分歧利用场景,对存算一体芯片的算法和算力的要求也纷歧样。

知存科技第二代产物WTM2101,是一款基在RISC-V的存算一体芯片,该芯片包罗存算一体MPU,用在实现深度进修算法,RISC-VCore,加快单位,RAM,和Audio codec,可以处置外面麦克风度集来的数据,这颗存算一体芯片可以用来做一些算法级的利用,好比语音辨认、语音加强、血压/血糖、心电算法等。莱迪思:CrossLink-NX FPGA助力收集边沿AI莱迪思亚太区资深市场开辟司理林国松分享了《利用超低功耗FPGA在收集边沿实现毫瓦级人工智能》的主题演讲。2020年莱迪思营收到达4.08亿美元,曩昔四年的出货量跨越10亿片。首要聚焦在通讯计较(39%)、工业和汽车(37%)、消费电子和其他(24%)。莱迪思FPGA的产物定位在小尺寸、低功耗、平安、靠得住设计和易在利用。ABI Research数据显示,截至2024年,装备端AI推理功能估计将笼盖60%的装备。收集边沿利用的机能要求,包罗1-500GOPS,功耗要求低在50mW,0.5-5TOPS算力的,功耗要求低在5W,年夜在10TOPS的,功耗要求低在50W。莱迪思sensAI推出一系列FPGA产物,例如比力新的CrossLink-NX,还IP CORE,开辟软件等。

下图右边是莱迪思的FPGA,左边显示有练习模子,经由过程莱迪思开辟的神经收集编译器转化成量化的权重和指令。另外,经由过程FPGA设计利用人工智能练习后的量化权重和指令,到达AI功能的实现。

比来,莱迪思推出全新的sensAI Studio。便利客户更快的设置装备摆设练习情况,令客户专注在开辟AI功能。sensAI Studio可以或许快速搭建练习的收集,优化开辟流程。莱迪思经由过程软件优化的设计方式,今朝可撑持到Tensorflow Lite,在尺度情况练习完成后经由过程编译器进行转换,再植入到FPGA器件上。CrossLink-NXCrossLink-NX 系列 FPGA 的设计采取了全新的Lattice Nexus手艺平台,连系了28 nm FD-SOI 制造工艺与 Lattice的全新 FPGA 架构,针对小尺寸、低功耗利用进行了优化。例如,在针对图象的AI处置参考设计中,传感器的图象数据传给FPGA器件,进行神经收集加快,输出成果给MCU。从机能上看,NX-40K供给60fps每秒速度,是上一代产物的12倍,功耗方面,与上一代比拟功耗减半。这两项指标在与MCU比拟也有显著的优势。CrossLink-NX供给17-40K逻辑单位,年夜量嵌入式存储和DSP模块,具有刹时启动,撑持硬核PCIe等。在器件内部,因为加强了嵌入式存储器,将所有AI的计较进程在FPGA片上实现。省去外部RAM,有助在下降功耗,晋升帧率和机能。

它重点利用在超低功耗人员侦测,超低功耗要害词和手热检测,多个方针的检测和计数,和片上注册和辨认物体。

莱迪思供给快速原型设计的模块化平台,包罗UPduino Shield开辟板,和嵌入式视觉开辟套件。前者重点是超低功耗,后者是对机能要更高求的利用。另外,软件东西方面供给神经收集编译器。还供给CNN Plus加快器IP,可简化神经收集在CrossLink-NX的实现。收集边沿AI的算法延续推陈出新,FPGA具有可拓展的机能应对各类利用案例,可以矫捷应对,且具有矫捷的计较资本、超低功耗和可编纂硬件等特征。莱迪思CrossLink-NX FPGA以高机能数据处置、低功耗运行且尺寸较小的特征,为客户供给收集边沿 AI/ML 推理解决方案。声扬科技谢基有:语音交互智能阐发在财产数字化的利用声扬科技是业界领先的语音交互智能阐发平台与新型常识办事供给商,为金融、公安、当局、IoT和互联网行业供给了“以用户为中间”的语音智能化解决方案。声扬科技产物VP谢基有在本次线上论坛介绍了“语音交互智能阐发在财产数字化的利用”。

语音交互全流程 / 声扬科技

AI语音阐发已在诸多汽车场景中的获得了利用,好比车内降噪和身份核验等。但是复杂的车内声音空间,对前端语音处置来讲是一项庞大的挑战。车内存在多声道、音量年夜和非线性掉真年夜的问题,噪声的存在一样不成轻忽,好比风噪、地面胎噪、空调出风口噪声、引擎噪声和振动噪声等。

车内声音处置 / 声扬科技

声扬科技的车载前端双音区拾音车规芯片解决了这些挑战,为车内语音交互系统供给了双音区拾音、人声分手和超强降噪功能。声扬科技还为客户供给智能车载操作系统,经由过程声纹辨认来确认车主身份,从硬件与系统上年夜幅晋升人车语音交互体验。在数字金融的应用上,智能语音可以助力财产数字化转型进级,用在金融风控反讹诈、APP声纹登录、声纹开卡等操作和治理。声扬科技也是中国工商银行总行声纹辨认项目标独一供给商,FinVoice智能语音认证系统已在多场景上线,用户量达4.16亿。声扬科技具有全栈语音手艺贮备,基在深度神经收集、机械进修、深度进修等人工智能媒介理论打造了多项自立可控的原创计较机听觉手艺,笼盖了前端声学旌旗灯号收集、语音旌旗灯号处置、后端特点提取辨认等全流程,构建了以声纹辨认为特点的1+N智能语音算法系统。在智能语音手艺上,声扬科技具有主动防灌音进犯、超短语音验证、跨信道等优势,并且系统资本占用低,撑持高并发和海量万万级数据库检索。北京清微智能在义:可重构计较芯片高效解决两年夜AI场景中的痛点问题7月15日,在电子发热友主办的AI线上手艺峰会上,来自北京清微智能科技有限公司的首席架构师在义带来了出色演讲。“AIoT财产是多种手艺融会,赋能各行业的财产,整体市场潜伏空间跨越十万亿,智能时期的支持就是计较力,计较力的不竭晋升催生新的需乞降产物。”在义暗示,“智能化首要表现在感知智能化、阐发智能化和节制智能化,具体表示在聪明城市、智能制造、智能家居、智能驾驶、智能零售等场景需要壮大计较力。”AIoT财产对芯片的要求表现在四点:高算力、高能效、矫捷性、平安性。好比视频跟踪需要高算力,来撑持智能辨认的利用;高能效意味着芯片在有限的能量下完成更多的智能使命,矫捷性首要聚焦万物智能,芯片利用多种多样,具有矫捷性适配各类算法、各类利用;平安性,表示为数据平安,智能时期的平安性要求用户数据平安被拜候、被处置。

传统的计较架构没法知足AIoT计较需求,可重构智能芯片是基在可重构数据流/节制流计较架构的AI芯片类型,具有按需即时重构、高能效、低功耗、通用性特点,被《国际半导体手艺线路图》评为最具前景的将来计较架构,美国电子中兴打算(ERI)将可重构计较手艺列为将来美国在电子行业一向连结带领地位的焦点要害手艺,是后摩尔时期的倾覆性手艺之一,也是列国争相抢占的科技制高点。清微智能成立在2018年7月,公司焦点创业团队来自清华年夜学微电子所,可重构计较手艺已在清华年夜学履历了10年的摸索,公司在2016年到2018年持续推出了Think Series系列芯片,机能和程度处在业界领先。清微智能是可重构计较芯片带领企业,焦点手艺指标领跑全球,在产物利用上,也是第一个将可重构芯片真正商用落地的企业。在义暗示,清微智能的焦点可重构手艺包罗:四元编程重构计较模式、低功耗设计、融会存内计较的可重构架构、异步电路驱动可重构手艺。在义介绍说,2018年10月,清微智能进行了Pre-A轮融资,2019年6月量产了超低功耗的智能语音Soc芯片TX210。2020年10月,清微智能量产了全球首款多模态智能计较芯片TX510芯片,这款芯片在智能安防、金融付出、航空航天等范畴交付客户。2021年4月,清微智能量产了全球首款集成自力NPU的蓝牙Soc芯片TX231,已利用在多款TWS耳机、平板、手环;2021年11月,清微智能行将量产图象芯片TX511,采取散布式可重构处置焦点,芯片机能将稀有十倍晋升,12月份还会推出更高真个810系列。公司与TSMC、平头哥有深度合作。希尔贝壳:算法+数据的开源若何实践与语音模子评测方案北京希尔贝壳科技有限公司 CEO卜辉带来《算法+数据的开源若何实践与语音模子评测方案》主题演讲。跟着AI手艺的成熟与利用迭代,中国智能语音市场将连结约25%的增加速度,估计到2023年,智能语音财产范围将超600亿。语音手艺年夜致分为语音辨认手艺(ASR)、语音合成手艺(TTS)、声纹辨认手艺(VPR)。跟着手艺的不竭迭代,语音手艺已利用到移动装备、汽车、家居、金融等各个场景中,卜辉强调,语音辨认手艺的利用焦点是算力、算法的撑持。

跟着开源气力的突起,市场的需求也愈来愈多。语音手艺的开源首要是集中在海外的初期开源软件系统和算法,但国内的AI开辟情况优在国外,例如今朝全球最年夜的语音手艺开辟社区Kaldi在国内具有良多开辟者。希尔贝壳自成立之初聚焦在场景数据办事,成立了开源数据项目。在疫情的影响下,愈来愈多的企业采取会议办公模式。卜辉认为,在会议场景下,对措辞人的跟踪、特点对象的内容转写、噪声等等,还良多手艺的点需要研究。为此,希尔贝壳发布了多通道中文会议语音数据库AISHELL-4。卜辉介绍,AISHELL-4是一个经由过程麦克风阵列实录的八通道中文通俗话会议场景语音数据集,包括211场会议,每场会议4至8人,数据集共120小时摆布。同时供给了正确的音字转写文本和时候戳信息,便利研究者进行诸如前端处置、语音辨认、措辞人朋分等零丁使命,并可以进行结合优化。

语音辨认的正确率是经由过程数据集的评估可以表现具体的机能指标。卜辉图提到,面向场景语音辨认模子的评测数据集评估规范扶植可以鞭策智能语音手艺的规范化。希尔贝壳认为,跟着整体AI算法情况的晋升,语音辨认手艺不再是单项落地,听觉、视觉、天然说话处置连系将成为趋向,面向场景ASR模子的测试评估数据集也将主要的评估体例。将来,希尔贝壳将研发扶植不完美的说话数据,同时连系图象、感知等的数据来构成多模态智能语音数据。完全论坛视频回放,请点击:https://webinar.elecfans.com/replay/656.html

Copyright © 2020 Shanghai Lineprinting Materials Co., ltd. All rights reserved .
Tel: (+86)21-57760077 Address:No.945,Huifu road, Waigang Town, Jiading District, Shanghai