推荐产品
联系我们

地址:上海市长宁区仙霞路350号10幢3楼3034室

电话:021-62378659

传真:021-62378659

邮箱:0350zp@163.com

上海新闻

主动化呆板进修AutoML受到渊博闭切探智立方Darw

来源:博天堂ag,博天堂AG手机版,博天堂ag旗舰时间: 2020-05-23浏览次数:作者:澳门皇冠
博天堂ag AutoML)因可大幅降低机器学习的门槛和人力成本受到了学术界和工业界的广泛关注。其在超参数优化、模型选择、神经网络搜索和特征工程等方面显示出其强大的功能。近年来

  博天堂agAutoML)因可大幅降低机器学习的门槛和人力成本受到了学术界和工业界的广泛关注。其在超参数优化、模型选择、神经网络搜索和特征工程等方面显示出其强大的功能。近年来很热门的神经网络搜索算法(Neural architecture search,NAS),设计出的模型,可以比人类设计的网络具有更少的参数和更好的性能。

  传统上,术语AutoML用于描述模型选择和/或超参数优化的自动化方法。这些方法适用于许多类型的算法,例如随机森林、神经网络等。说白了,AutoML 更核心的内容其实就是用计算力和数学方法自动做数据特征提取以及模型建模。

  而在业界,大多数的数据科学家和算法科学家的工作内容就是模型调优和设计,但既有的模型无法满足业务需求,定制化的设计开发又很耗费时间,对于一些企业来说,甚至不能负担起招聘博士专家。

  由此,探智立方DarwinML 1.0应运而生,它不仅能够解决”效率“的问题,将模型优化的过程抽象成纯数学问题,利用机器学习的算力、以搜索拟合的方式在尽可能短的时间内寻找全局更佳解决方案,而且相较传统的机器学习模型,由专家驱动的机制转换成了由业务驱动,极大程度上释放了分析师、开发者的时间。

  时效方面,通常用户把比较好的论文的模型转换成自己可用的模型并且优化需要2个深度学习模型开发人员2个月左右的时间,而DarwinML只需要1周的时间。

  内容方面,直接使用开源模型或论文模型,会使得计算力有浪费的情况,而DarwinML平台从数据特点出发,效率和准确率都得到了保证。

  对于标准的数据科学处理流程来说,从预处理到建模,再到调参,中间涉及的处理过程非常繁杂。我们要小心翼翼地处理数据,从而构建干净的样本;我们需要仔细选择模型算法,从而获得不错的基本效果;同时,我们也要依据经验调调参,从而找到能接受的超参组合。所有这些,都要求数据科学家手动完成。

  但是全流程的AutoML 不一样,给定数据,我们坐等训练结果就行了。中间从数据清理到模型评估都可以自动完成,数据科学家可以着重在分析与决策,不用手动建立数十个实验来验证一个简单的假设。

  「全流程AutoML 本身不需要编程,全部通过可视化界面完成,DarwinML在底层会自动完成这一切。传统的方法论要经历3 个月的过程,而现在只要 3 天,数据科学家就可以交出以往花 3 个月才能取得的成果。」

  会完成一些数值填补、异常值查找或者数值的自动化统计处理。这些都是数据科学非常麻烦的地方,以往我们必须先理解数据然后才一点点提升数据状况。现在,交给自动数据预处理就好了,


关于我们 简介 企业文化
联系我们

地址:上海市长宁区仙霞路350号10幢3楼3034室

电话:021-62378659

传真:021-62378659

邮箱:0350zp@163.com

扫一扫
Copyright ©  2015-2025 博天堂AG手机版  版权所有
html地图|xml地图