同城头条  >  新闻  >  「芯片+AI 算力+AI 开发平台」,合肥君正公布全栈式低功耗 AI 技术
「芯片+AI 算力+AI 开发平台」,合肥君正公布全栈式低功耗 AI 技术
2021年05月21日 07:41   浏览:0   来源:小报道

习惯在针尖上跳舞的合肥君正,在萌芽之时就认识到AI的重要性。

2014年前后,视频芯片市场已有众多厂商,且大多鏖战成像和传输。彼时的君正意识到,用模仿的方式硬生生地去打这个市场难以出头且毫无价值,而AI将成为下一战场的关键。从那时起,AI与算法部门成为君正最早的技术部门之一。

7年白驹过隙,那些或深或浅的脚印现已踏出一条康庄大道:最近,君正正式公开了自己的AI硬件加速引擎和AI开发平台Magik。

君正视频事业部副总经理刘远表示,这套技术从开始至今,经历了各方面的锤炼:

“从T01到T02再到T31/T40,从computer vision到deep learning再到混合量化,从安防摄像机到低功耗门铃再到立体机器视觉,从Tensorflow/Caffe到Magik,从第一家客户试探性接入到大量产品算法落地,这套技术已经从创新研发走到普惠应用。”刘远说道。

这历时多年的武器,将往视频行业投下一枚怎样的石头,又怎样协助下游客户落地更具竞争力的产品?

直奔落地的一整套「芯片+AI算力+AI开发平台」解决方案

如何为端侧AI应用提供一套成本亲和,性能出众,功耗低,又易于落地的基础技术组件?这正是合肥君正一直在思考的命题,也是君正AI技术研发的核心目标。

刘远指出,经过多年摸索,这样一套基础技术组件如今包含:

  • 一系列落地芯片:布局完备,覆盖高中低阶,除AI以外具备完整的各方面竞争力,成本亲和,性能均衡,效果出众,功耗领先,被市场认可并且持续大量出货。这就像AI和算法落地生根的土壤,越广阔越好。

  • 一套先进的AI加速硬件:优秀的PPA(Performance, Power, Area),兼具高性能和灵活性,并且通过有效创新,真正突破AI推理在端侧产品中的各种瓶颈,使得高发热,高带宽,成本冗余等在实际产品中不再是问题。

  • 一个完善的算法开发平台:敏捷的算法移植过程,除了提供一键式算法部署,还提供最先进的量化感知训练方法论,提供典型网络的全流程开源代码,让算法专家专注于挖掘痛点与数据的价值。

君正的整体AI技术架构如下图:

「芯片+AI 算力+AI 开发平台」,合肥君正公布全栈式低功耗 AI 技术

其中AI-Engine(AIE)是一整套AI加速硬件,包括CPU,NNA,SIMD,协处理器和RAM Pool等多重加速技术。

主要优势是“三高三低”:算力高,利用率高,灵活性高;功耗低,外围成本低,带宽需求低。

Magik是基于AIE的算法开发平台,除了基本的工具链还包含其他丰富的辅助开发资源。并且支持后量化和更先进的量化感知训练(QAT)。

“卷积神经网络的本质是计算,幸运的是,君正一直是国内为数不多的完整CPU计算技术的拥有者,这一点,奠定了我们的AI技术具有较高的发展起点。”

刘远说道,“而Magik融合了我们这几年在视觉产品落地上的各种经验,能够发挥AIE独特的领先性能。二者搭配,呈现在行业客户面前的就是一整套完整的‘芯片+AI算力+AI开发平台’的解决方案,使得应用者非常容易落地。”

利用这套平台,可以带来多方面长远的优势:

  • 产品化优势:这套技术可运行于君正当前和未来的各种芯片当中,下游产业链条成熟,碎片化风险低,生态一致性有保障;

  • 商业化优势:已有大量芯片持续出货,品牌背书充足,能加快算法赋能和变现的节奏;

  • 成本优势:包括eBOM成本,算法成本,研发成本等;

  • 性能优势:可获得更高的物理算力,更高的利用率;

  • 低功耗优势:体现在产品端就是发热明显低,续航更好,散热无忧;

 “AIE+Magik是君正原生创新的技术,完全自主。T40作为搭载这套技术的最新一代芯片,却并非第一代产品。”刘远强调,“在这之前,我们经过了T01/T02/T31等几代量产芯片的验证,积累了大量宝贵经验,到T40这里,AIE+Magik已经十分成熟”。

AIE—有效突破端侧AI的算力瓶颈

AI-Engine(AIE)是君正完全自主创新的一套AI加速硬件组合,广泛支持各类神经网络加速,如CNN/RNN/GCN等,也支持传统CV算法和平面运算的加速。得益于公司对CPU技术的掌握,AIE实现了其他一般芯片公司难以做到的CPU与NPU的同构设计。

「芯片+AI 算力+AI 开发平台」,合肥君正公布全栈式低功耗 AI 技术

在全球各种不同的AI加速技术路线中,DSA(Domain Specific Architecture)尤其适合端侧推理场景。AIE引用了多种DSA的设计理念,实现了一整套满足复合算法加速的硬件组成:

  • 支持SMT多核架构的XBurst2 CPU,凝聚了君正团队20多年的CPU技术精华;

  • 128bit/512bit/1024bit位宽的SIMD指令集,针对向量运算加速;

  • 算力高达2T - 32T的NN加速阵列,针对张量计算加速,支持混合位宽量化

  • 协处理单元,对其他运算加速;

  • 高效RAM pool,深度优化内存带宽吞吐

  • 实测运行功耗很低,8T算力场景下典型功耗小于500mW,能耗比最低达到了0.05W/T级别

“与云上的AI芯片加速不同,在端侧芯片上,4T算力曾经是天花板,这并不是因为硬件无法将算力继续提高,而是因为端侧产品在算力以外有太多的制约因素。”刘远解释道,“如果不优先把NPU内部的PPA、带宽、功耗等关键障碍解决,即使再提高计算矩阵的规模,实际芯片也大概率发挥不出来。”

归纳起来,端侧算力的瓶颈主要集中在:产品端的资源限制,算法多样性的挑战和算法开发环境。

「芯片+AI 算力+AI 开发平台」,合肥君正公布全栈式低功耗 AI 技术 

端级芯片在计算资源和成本都面临限制,无法像云端服务器那么丰富和冗余。

在终端售价,RAM内存容量,ROM模型存储,发热控制,DDR的带宽等方面都面临极大挑战。

所以端级产品需要与云端不同的AI加速技术。

君正AIE特别针对端级应用设计,采用专用硬件架构DSA(Domain Specific Architecture),与常见的NPU相比,有明显的规格优势:

  • MAC利用率提升1到2倍,推理速度提升2到4倍;

  • 算法运行的RAM/ROM消耗减少50%~70%;

  • 带宽降低35%~85%;

  • 发热减少40%~80%。

无论2C还是2B/G市场,不同应用对AI算法的要求差异很大,即使是相同功能的算法也难以做到单一模型覆盖所有场景。

其次人工智能学术领域仍然在发展,虽然变化的速度减缓,但未来仍然会不断出现新的网络,新的流程,新的算子,新的训练方法等等,这些决定了目前的AI加速硬件还没有到达统一收敛的阶段。

端级算法本身呈现多样性,碎片化的客观现状。

这就要求芯片中硬件的加速能力非常灵活,能够应对各种未知算子/算法/网络/流程的变化,这一点对AI引擎的设计提出巨大挑战。

君正AIE结合了多年积累的CPU技术,摸索了一套兼顾高性能和灵活性的创新技术:

  • 算力达2T ~ 32T的NN加速阵列,实现千倍加速比;

  • 非标计算协处理单元,实现百倍加速比;

  • 128bit到1024bit位宽的SMID指令集,实现几十倍加速比;

  • RAM Pool系统,显著降低带宽;

  • 高主频多核多线程XBurst®2 CPU。

“过去至今各种行业摄像机搭载的AI算法,大多存在‘性能冗余但利用率低’、‘成本偏高但有浪费’、‘功能可用但难以普及’等情况,随着搭载AIE+Magik的T40逐步到位,能做到8T算力,小于0.5W的加速功耗,并且内置了DDR,这些痛点会得到很大改善。”刘远表示。

Magik—全栈式深度神经网络开发平台

硬件是躯体,软件和算法是灵魂。如果是AIE是躯体,那么Magik就是灵魂。

Magik是一个面向端侧AI应用的全栈式开发平台。与一般的AI开发工具链相比,Magik包含了更丰富的内涵:

  • 全流程,一体化。集模型训练、优化转换、部署推理于一体,并提供模型检查器、调优器、性能分析器等工具;

  • 多框架。全面支持pytorch/tensorflow/mxnet/caffe/onnx等主流框架;

  • 量化感知训练(QAT)。支持2/4/8/16任意精度混合训练及转换优化,在保证精度的同时,能充分利用AIE的计算资源;

  • 灵活性。同时支持QAT和后量化方案,加速应用灵活部署;

  • 开放性。开放人脸/人形等常见算法的从训练到部署全流程代码,以及经典网络的backbones,增强易用性,加速落地。

“Magik不仅仅是一个AI转换工具链,还是一个丰富的开发平台,”刘远补充道,“有工具链,framework插件,Model Zoo,常用的backbones,还包括一般摄像机非算法的支撑功能,例如成像,编码,帧数据流,内存复用优化,存储降维,多目同步,甚至内存泄露防范等都有体现在内,真的值得用一用”。

Magik的一大特色是支持较为先进的QAT方法论。端级AI应用目前大多还停留在后量化方法阶段,相比QAT,后量化更像是端级AI的过渡阶段。后量化过程相对简单,但精细度不足,算力容易形成浪费,功耗成本带宽等难以解决。QAT方法能够更精细地根据加速硬件的特点调整训练细节,从而发掘端级AI算力的潜力,达到提升算力利用率,降低功耗,带宽和成本的效果。

使用Magik的开发过程很容易上手,流程示意图如下:

「芯片+AI 算力+AI 开发平台」,合肥君正公布全栈式低功耗 AI 技术

“Magik就像一把‘云梯’,帮助客户快速落地AI算法和视觉产品,它能给行业带来长期的助力”。

与AIE的发展相辅相成,Magik具有未来小型生态的潜力,其坚实基础是君正过去,目前和未来所有的算力芯片,只要君正芯片能够覆盖到的市场领域,都可以发挥作用。

春风化雨时,润物细无声

“早几年当AI的浪潮滚滚而来,喧嚣尘上之时,我们并没有太多发声,但并不代表我们没有行动。”刘远讲道,“当东西没有真正拿得出手时,我们自己心里这一关就过不去。而现在,AIE+Magik这一套技术,已经服务了很多客户,并让不少人尝到了甜头”。

据了解,AIE+Magik已经成功服务了超过几十家客户,包括一些行业知名品牌,传统算法公司,行业监控企业,大型互联网品牌,运营商以及初创极客。

这些服务,远超算法开发这个层面。要实现设备承载不同的算法运行,首先需要克服算法计算标准化的困难,但这只是端侧AI落地过程中挑战的冰山一角。

除此之外,设备的产品属性,可量产属性,消费者体验属性以及开发周期等方面都需要大量的投入。

君正完成了各种典型视觉产品的方案积累,例如安防监控,物联网视觉,低功耗成像,智慧办公,文字扫描,生物识别,立体视觉等领域都能提供完整的解决方案,让算法赋能只需要做简单加法就可以落地。

“这样做有没有社会价值,有多大的社会价值,是推动我们每一项产品和技术研发的精神内核。”

北京君正副总经理黄磊曾多次强调。在AIE+Magik的落地过程中,赋能下的各大下游企业的产品价值,都是对这一说法的精准注脚。

“有一家算法专业型的客户,本身有很强的算法开发能力,基于君正芯片和Magik平台,开发了全新的产品系列。新产品系列比之前的老产品,成本下降了一个数量级,实现小型化。客户还独立完成了人脸识别算法的移植,运行效果十分良好。”

刘远介绍说,“与此同时,另一家知名的销售专业型客户,本身算法能力不强,但是非常清楚消费者痛点。基于君正芯片和Magik平台,在君正的辅助下建立了算法团队,利用Magik平台的开源代码和网络,基于自己的数据资源训练了人形侦测算法,客户利用消费者优势,不断对算法进行迭代,最终以运营方式上线算法,消费者反馈良好,运营转化率高于预期。”

不知不觉间,优质的服务成为了君正在智能视觉市场的核心竞争力之一。

目前随着T40芯片到位,很快将有更多搭载AIE+Magik的产品陆续进入市场。基于T40打造的视觉产品,能做到4T/8T算力,能耗比最低达到0.05W/T级别,外围BOM很简单,芯片售价做到几个美金。配合Magik和各种成熟方案资源,T40有望成为AI视觉大市场的细雨春风。雷锋网(公众号:雷锋网)雷锋网雷锋网

雷锋网原创文章,未经授权禁止转载。详情见转载须知

0人收藏

分享:

相关文章

合肥君正

    文章点评:

    表情 

    余快

    编辑

    关注 AI 视觉


    发私信

    当月热门文章

    最新文章

    热门搜索

    融资支付宝无线充电Nest越狱移动医疗创业者Pebble技术无人车Mozilla

    百度飞桨三大全新发布与升级,推动AI工业大生产|WAVE SUMMIT 2021

    本文作者:贝爽2021-05-20 22:19

    导语:王海峰透露,飞桨已凝聚320万开发者,服务的企事业单位达到12万家。


    5月20日,由深度学习技术及应用国家工程实验室与百度联合主办的WAVE SUMMIT 2021深度学习开发者峰会在北京召开。

    百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰在峰会上致辞。王海峰透露,飞桨已凝聚320万开发者,相比1年前增长近70%;服务的企事业单位达到12万家。

    王海峰也分享了在现阶段关于人工智能技术和产业发展的两点思考:

    一是融合创新。从技术的角度,知识与深度学习相结合,突破了知识增强的深度语义理解;多技术融合创新,通过知识图谱关联跨模态信息,用自然语言语义表示融合语言、语音、视觉等不同模态的语义空间,突破跨模态语义理解。

    从平台的角度,深度学习平台与芯片软硬一体融合创新,满足不同算力、功耗、时延等的多样化需求,取得AI应用的最佳效果。飞桨针对多种芯片并存的环境,研制了异构参数服务器训练技术,突破了超大模型的高效训练难题。目前,飞桨已经和22家国内外硬件厂商开展适配和联合优化,硬件生态蓬勃发展。

    从产业的角度,人工智能技术越来越深入与产业融合,以产业需求为牵引,持续打磨AI技术及平台能力,与应用场景融合创新发展。

    二是降低门槛,随着人工智能技术在各行业的渗透,面向不同应用场景,高效满足不同的开发者需求,持续降低门槛非常关键。飞桨是源于产业实践的深度学习开源开放平台,一直致力于降低门槛,既有支持动静统一的核心框架,也有产业级模型库、开发套件和工具组件,以及提升企业生产效率的飞桨企业版等,满足不同行业、不同阶段、不同层次开发者的需要。

    基于飞桨平台,320万开发者不再需要从头编写人工智能的算法代码,即可高效进行技术创新和业务拓展。门槛的大幅降低,加快了人工智能应用的多样化和规模化,加快了产业智能化进程。

    百度飞桨三大全新发布与升级,推动AI工业大生产|WAVE SUMMIT 2021

    本届峰会上,百度解析了融合创新趋势下的AI工业大生产实现路径,企业在应用AI过程中,起步于AI先行者探路,在完成模型验证、产生效益后促使企业组建AI团队,进入AI工作坊应用阶段,当企业内大量研发AI应用,多人多任务协同展开AI生产时,即进入AI工业大生产。

    飞桨团队详细解读了飞桨深度学习平台的全新发布和重要升级,包括:飞桨最新开源框架,开发更加灵活便捷;大规模图检索引擎,支持万亿边的分布式图存储与检索;文心ERNIE预训练模型,进一步在知识增强的语义理解、跨模态语义理解等方面取得突破,为开发者赋能,以及推理部署导航图,助力开发者打通AI应用的“最后一公里”等等。

    同时,飞桨联合学术界和产业界,共同开启飞桨大航海计划,助力AI人才培养、产业智能化升级和前沿探索。此外,飞桨的合作伙伴分享了应用飞桨的产业创新实践、人才联合培养计划等。

    飞桨持续引领深度学习技术发展和科技融合创新,同时不断降低应用门槛,加速AI工业大生产,推动产业智能化进程。


    头条号
    小报道
    介绍
    报道大小信息,宣传正能量!
    推荐头条
    Keywords" 仪陇网、仪陇生活网、专注仪陇本地信息真实传递_仪陇网d-sj.cn/学法减分好助理答题神器一扫就出答案、学法减分好助理扫一扫知道答案app、学法减分好助理考试题库、学法减分好助理20道题模拟考试、学法减分好助理可以减多少分?、学法减分好助理拍照搜题 秒出答案免费、学法减分好助理拍照搜题、学法减分好助理拍照搜题 秒出答案、学法减分好助理可以申请几次?、学法减分好助理题库最新版、仪陇生活网、仪陇生活网招聘、仪陇招聘驾驶员、仪陇新政有哪些厂还在招工、仪陇人才网、仪陇在线、仪陇新政最新急招聘58同城、仪陇新政哪有做兼职的、仪陇县招聘信息最新招聘仪陇生活网招聘、仪陇招聘网最新招聘信息、仪陇生活网二手房、仪陇生活网最新消息、仪陇生活网门面转让、仪陇生活网住房出租最新消息、仪陇生活网发布了信息如何取消、四川仪陇生活网、仪陇人才招聘信息生活网、仪陇生活网、仪陇生活网招聘、仪陇招聘网最新招聘信息、仪陇生活网最新消息、仪陇生活网门面转让、仪陇生活网二手房、仪陇生活网住房出租最新消息、仪陇生活网最新招聘暑假工、四川仪陇生活网、仪陇手机生活网、仪陇招聘网最新招聘信息、仪陇招聘驾驶员、仪陇县租房信息、仪陇新政招聘网最新招聘、仪陇找工作、仪陇最新招聘、仪陇生活网招聘、仪陇人才网、仪陇招聘信息招聘仪陇招聘信息信息、仪陇招聘c1驾照、仪陇房价、四川仪陇县房价多少钱一平方米、仪陇县房价现在是多少、仪陇房产网、仪陇新政房价多少钱一平米、仪陇新政房价、仪陇房价为什么这么高、仪陇房价多少钱一平方、仪陇房价如何走、仪陇房价为什么这么高2019、仪陇新闻网、仪陇新闻网头条、仪陇新闻最新消息今天、仪陇新闻网今日新闻、仪陇新闻直播、仪陇新闻网丁强、仪陇新闻网直播视频、仪陇新闻视频、仪陇新闻综合频道直播、仪陇广告公司、仪陇广告语、仪陇金山广告、仪陇驾校、仪陇驾校报名费用、仪陇驾校C1多少费用、仪陇驾校88队哪个教练好、仪陇驾校在什么地方、仪陇驾校科目一考试、仪陇驾校学费、仪陇驾校科一早上笫一堂几点、仪陇驾校蒲、仪陇坤安驾校、仪陇工厂招聘、仪陇工厂有拿回家干的活吗?、仪陇新政工厂招聘、仪陇新政招聘信息工厂、仪陇家电维修、仪陇家电回收、仪陇家电清洗、仪陇电脑维修哪家好、仪陇电脑城在哪里、仪陇电脑销售在什么地方、仪陇电脑回收、仪陇电脑培训、仪陇电脑商家、壹家电脑维修、仪陇二手家具市场、仪陇家具城、仪陇家具厂、仪陇家具维修师傅、仪陇家具定制、仪陇家具厂网上程、仪陇家具市场、仪陇家具城在哪里、仪陇二手家具回收、南充仪陇二手家具市场、四川仪陇房产信息网、仪陇马鞍房价、广西桂林房价、仪陇一中录取分数线2021、仪陇翰林锦府、仪陇金城二手房的房价、仪陇房价为什么这么高、仪陇新政租房最新消息、仪陇县金城镇房价下跌、仪陇县招聘信息最新招聘、仪陇房产网、仪陇河西工业区招聘、仪陇门面出租、四川仪陇黑老大周超、仪陇县金城镇二手房最新消息、仪陇新政本地招聘启事、四川仪陇新镇最新招聘、仪陇县找工作生活网、如何自学电脑维修、娄星区关家垴附近电脑维修、恒达行家维修培训怎么样、珠海唐家电脑维修、台式机维修去哪家好、笔记本维修哪家好、仪陇电脑维修哪家好、电脑维修公司哪家好、秀洲区电脑维修哪家好、仪陇新政本地招聘启事、仪陇县金城镇二手房最新消息、仪陇招聘网最新招聘信息、仪陇新政有哪些厂还在招工、仪陇县河西工业区招工、南部人才网、四川仪陇黑老大周超、仪陇新政哪有做兼职的、四川仪陇新镇最新招聘、长津湖电影、长津湖电影时间多长、长津湖电影完整版免费观看、长津湖电影观后感、长津湖电影完整版免费观看HD、长津湖电影完整版免费观看2021、长津湖电影完整版免费观看网站、长津湖电影观后感500字、长津湖电影票多少钱一张、长津湖电影票购买、长津湖成影史历史片票房冠军、长津湖电影完整版免费观看、长津湖3个冰雕连仅2人生还、长津湖战役、长津湖2021免费完整版观看、长津湖票房破30亿、长津湖作文、长津湖观后感、长津湖手抄报、长津湖观后感10篇、刷手机下拉示选上海百首网络、刷手机下拉述约上海百首网络、刷手机下拉安选上海百首网络、刷手机下拉尚选上海百首网络、刷手机下拉安信上海百首网络、苹果手机下拉菜单、华为手机不能下拉、手机下拉功能在哪里设置、手机下拉设置在哪里设置、手机不能下拉通知栏、仪陇天气、仪陇房产网新楼盘、仪陇县楼盘房价最新消息、仪陇县、仪陇天气预报15天、仪陇县房价、仪陇招聘网最新招聘信息、仪陇属于四川哪个市、仪陇县金城镇、仪陇网、仪陇房产网新楼盘、仪陇县招聘网、仪陇网上在逃人员、仪陇网吧多久开业、仪陇网约车平台、仪陇网红地、仪陇网吧、仪陇网吧开门了吗、仪陇网络电视台、仪陇生活网、仪陇生活网招聘、仪陇生活网最新招聘信息、仪陇生活网最新消息、仪陇生活网门面转让、仪陇生活网二手房、仪陇生活网发布了信息如何取消、四川仪陇生活网、仪陇手机生活网、仪陇人才招聘信息生活网、仪陇丁家大院、仪陇森家环保、仪陇县房价、仪陇二手房、仪陇二手房出售信息、仪陇房产查询系统、仪陇房子出售、仪陇房子能不能买、仪陇房子贵、仪陇房子还会拆迁、仪陇房子出租、仪陇首座房子好不好、仪陇房产网新楼盘、仪陇房产网、仪陇房产备案查询、仪陇房产信息网、仪陇房产查询系统、仪陇房产管理局官网、仪陇房产交易网、仪陇房产价格、仪陇房产中介、仪陇房产局、仪陇河西工业区有些什么厂、仪陇县河西工业区招工、仪陇河西工业园2020招聘、仪陇河西电子厂招聘信息、仪陇河西招聘驾驶员、仪陇河西大华宝公学、仪陇河西工业区有哪些制衣厂、仪陇河西工业园、仪陇河西工业区电子厂、仪陇河西工业区灯泡厂、薇仪陇之家、薇仪陇生活网新政房价、仪陇新政房价、仪陇新政二手房出售、仪陇新政楼盘、仪陇在线、仪陇生活网、仪陇生活网是大家了解仪陇的资讯窗口,同时也是仪陇人的网上家园,为大家提供免费查询发布仪陇便民生活信息,是仪陇地区综合信息门户网站!

    Copyright ©2021 仪陇家园同城网--版权所有   蜀ICP备2022002889号-1