九章云极DataCanvas DAT:端到端AutoML,把AI建模效率提升一百倍( 三 )


AutoML 自动生成的算法除了能够节省开发时间 , 实际工作的准确度如何?早在 DeepTables 工具刚刚构建完成时 , 九章云极 DataCanvas 的开发人员就参加了著名机器学习竞赛平台 Kaggle 的 Categorical Feature Encoding Challenge II 比赛 , 测试了自动机器学习算法的水平 , 并获得了成功 。
「我们希望用这个机会验证 DeepTables 的实际水平 , 」杨健说道 。 「整个比赛经历 3 个多月的时间 , 有来自全球的将近 1200 个团队 , 还有好几个 Kaggle 的 Grand Master level 的大神 , 像 Bojan Tunguz、Sergey Yurgenson 等 , 」
九章云极 DataCanvas 的方案比较简单 , 主要就是为了验证 DeepTables , 数据没有做太多处理 , 调用了 DT 内部网络架构的几个参数 , 作为 AutoML 工具 DT 内部预置了很多网络架构 , 可以任意地组装和排列 。
团队最终选出了 4 种不同的网络组合 , 再融合在一起 , 获得了很好的结果 。 需要注意的是 , 比赛存在 Public 和 Private 两个榜单 , 这意味着参赛模型需要有足够的泛化能力——经过太多调参的模型会趋向于过拟合 , 在 Kaggle 大部分竞赛中都会出现 Public 榜上排名前几十名的方案 , 在 Private 榜上集体排名下降的情况 。
DeepTables 在比赛中两个榜单都排到了第一名——这意味着使用 AutoML 自动生成的算法 , 性能超越了众多 Grand Master 手动调出的水平 。
九章云极DataCanvas DAT:端到端AutoML,把AI建模效率提升一百倍
文章图片

速度更快 , 性能更好 , 应用门槛还更低 , 这让人们没有理由不去尝试 AutoML 。
九章云极 DataCanvas 表示 , 未来还希望进一步降低门槛 , 提供更面向前端用户的建模工具以及支持更广泛的场景模型任务类型 , 并进行实时分析方向的一些开源探索 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。