第四范式率先发布XGBoost++,轻松切换AI异构算力

2019-08-23 11:00:29 来源:中华网
        【每日科技网】

  近日,第四范式宣布将推出两项算力黑科技:XGBoost++和pyGDBT。XGBoost是AI开发者所熟知的工具,XGBoost++可以在前者的基础上,只修改一行代码,即可轻松切换到异构计算模式,享受软硬一体技术带来的算力升级。而将于10月初发布的pyGDBT则从另一个维度给用户带来算力体验,用户只需基于类似scikit-learn的语法编写python程序,即可通过智能调参框架,享受异构计算带来的性能。

  XGBoost++和pyGDBT的共同点在于,以往的AI开发中想要使用异构加速或实现高维离散场景的计算需要,必须具备深厚的AI技术基础,而这两款工具的易用程度让数据科学家、数据分析师、普通AI开发者即可轻松上手。这也让第四范式离“AI for Everyone”的愿景更进一步。

  第四范式 FlashGBM :让医学、金融等高维离散场景计算提速 10

  第四范式FlashGBM是XGBoost++和pyGDBT的底层异构加速引擎,使用基于FPGA开发的GBM专用加速芯片,定制了配合该加速器的高性能软件程序,尤其擅长处理复杂的高维离散特征。FlashGBM不仅实现了不同场景下平均10倍以上的加速,而且相比传统的CPU方案,内置自动参数优化功能,免去专家人工调参过程,自动调整至性能,降低使用门槛,缩短建模周期。

  FlashGBM有如下特性:

  1. 为高维离散稀疏场景提供高性能支持,覆盖传统GBM难以覆盖的场景。

  2. 引入自动调参技术。用户不需要手动调参来确定效率情况下的参数组合。

  3. 针对GBM训练算法和FPGA本身架构特点做了深入的流水线优化,避免cache bank conflict,提升访存效率。

  在测试实验中(见上表)可以看到,不同场景的加速比从4.0x到26x不等,而平均加速比达到了12.5x。其中,互联网广告点击率预测是一个典型的高维稀疏离散计算场景;该场景中存在大量离散特征,例如A用户是否购买X商品,B用户是否收藏Y商品;海量用户与海量行为的交叉形成了超高维,例如千万用户与上百种行为交叉产生数十亿维。在该场景下,FlashGBM的加速高达26倍。

  FlashGBM通过PCIe从宿主机拿到数据,传递给计算核心,计算核心通过和板载内存交互来计算GBM的统计直方图,并将结果送回宿主机内存。

  第四范式 XGBoost++ :从 XGBoost 一键切换至 FlashGBM 高性能模式

  XGBoost是Gradient Boosting的一种高效系统实现,作为开源系统, XGBoost的社区很活跃,被广泛使用。第四范式XGBoost++在FlashGBM底层框架上实现了与XGBoost兼容的接口。数据科学家可以零学习成本地切换到高性能FlashGBM模式,享受FPGA带来的异构加速优势。

  第四范式 pyGDBT :打造易用的高维分布式机器学习框架

  GDBT是第四范式自主研发的超大规模分布式机器学习框架,设计初衷是打造专门为分布式大规模机器学习设计的计算框架,兼顾开发效率和运行效率。相比主流开源架构,GBM在高维场景有百倍以上优势。即将发布的第四范式pyGDBT面向AI科学家的使用习惯,对GDBT进行了进一步整合和优化,在建模效率、模型维度与效果、性能、易用性等几个方面进行了升级:

  1) 高效率: 针对反复调参调研的高成本,通过智能调参加速机制降低特征、模型调研周期。

  2) 模型维度与效果: 通过集群计算框架和分布式训练算法支持海量数据与高维模型,提升模型表达能力与效果。

  3) 高性能:结合FlashGBM底层计算框架,提供了异构加速能力。

  4) 易用性:提供了近似scikit-learn的python使用接口,AI建模人员可以快速实现代码迁移和使用。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.

猜你喜欢

智启车展新篇,解构新时代驾乘体验 哈曼创新科技赋能车内体验升维

2025年4月23日,第二十一届上海国际汽车工业展览会盛大启幕,本次车展以“拥抱创新共赢未来”为主题,集齐了全球各大汽车行业巨头的前沿科技与创新成果,共同描绘未来智能出行与绿色生态的蓝图。作为汽车科技

2周前

移动云:以“AI+”力量重塑中小企业数字化未来

数字化转型,是中小企业在新时代背景下的“必答题”。连续两年的政府工作报告提出,加快传统产业和中小企业数字化转型,深入开展中小企业数字化赋能专项行动。《中小企业数字化赋能专项行动方案(2025—2027

2周前

奥维云网二手房数据,助力“以旧换新”政策下家电企业抢占先机

在“双碳”目标和消费升级的行业背景下,中国家电家居行业正迎来以“以旧换新”为核心的政策红利期。2024年国务院明确提出推动消费品以旧换新,家电、家居产品成为重点领域。而这一政策的落地,与存量房市场(二

奥维云网

2周前

华为世界地球日短片发布,快去开启“与地球和鸣”的空间音频之旅吧

清晨被闹钟叫醒,夜晚伴着车流入眠……声音,是我们对这个世界的“第一印象”。然而,在这些日常的喧嚣之外,远方的原野则在发出动人的“天籁”。4月22日世界地球日,华为发布「与地球和鸣」主题纪录片,可在华为

华为

3周前

AI算法+硬件堆料,终结拍鸟技术痛点的佳能专微系统

拍鸟正成为当下热门的摄影题材,我们手中相机也加入了各种便利的人工智能功能,让拍鸟变得更加方便。像是佳能EOSR5MarkII和EOSR1的鸟眼识别追踪、预连拍以及机内AI超分辨率与神经网络降噪都是生态

3周前

权威认可!小天鹅荣膺奥维云网三项行业大奖

作为家居产业第三方数据代表,奥维云网(AVC)一直以来是整个泛家居行业发展的见证者,在不断深耕独特业务场景和数据特征过程中,助力家居企业更快响应市场变化,推动行业创新发展。近日,小天鹅品牌接连斩获由奥

小天鹅

3周前