文章图片
训练后量化工具也是一个很典型的软硬解耦工具 , 任何训练的符合规范要求的浮点模型 , 通过这个工具都可以部署在地平线芯片上 。 这个工具本身是一个软件 , 与芯片一起做了很多的联合优化 , 联合优化反过来可以提升量化精度 , 即经过量化工具的转换 , 不用做训练 , 它的精度的损失与英伟达量化后的精度对比如上图所示 , 可以看到量化的精度都是比英伟达量化后要好的 。 这是一个很典型的追求软硬解耦 , 同时通过软硬结合的方式 , 来打造一个对程序员和开发者更好用工具的过程 。
在训练工具上 , 我们也有类似的创新 , 比如训练的 Plugin , 在优化和编译器方面也有很多相关的工具 , 它们都是来自于客户的宝贵建议和开发者的实际诉求 。
在此基础上是一个非常丰富的软件栈 , 软件站里底层是OS , 再底层是一些开发板 , 往上是一些软件和开发的参考方案 。 当各位拿到我们的芯片或工具时 , 它里面包含了一整套的工具链和开发组件 , 这些开发组件可以降低开发中的复杂度 。 与此同时 , 上面还会有很多的应用参考解决方案 , 以白盒或开源的方式提供给开发者 。 我们相信通过这些也可以大大提升开发者的效率 , 让开发者可以做出更好的产品 , 同时得到好用的效果 。
总之 , 地平线在艾迪平台和天工开物上 , 包括了算法开发和应用、算法评测、端到端的数据闭环 , AI算法部署 , 应用开发 , 诊断、调试、性能调优 。 这个过程都是面向开发者的 , 完全为开发者服务 , 而且是为开发者的产品研发效率服务 。 所以在这个过程中 , 一定要秉承开放、灵活、兼容 , 并且要做到高性能的原则 。 在这些原则的指引下 , 参考比较多的历史经验和教训 , 以史为鉴去看接下来怎么做来实现更好用的 AI芯片开发工具 。
上面讲了一个好用的开发工具 , 但它需要在市场上做相关的验证和迭代 。 当去看整个市场上的车载芯片时 , 我们发现中国尤其是国产的自主品牌 , 已经成为全球顶级汽车智能芯片和算法、计算平台的“角斗场” 。 比如2021年 Mobileye的EyeQ5 , 高通的Snapdragon Ride , 英伟达的Xavier和Orin都是在国内自主品牌的自主车型上面首发 , 包括地平线征程3和征程5 。
最后 , 再回顾下今天的内容 , 结合地平线的实践 , 我们正在做一个更好用的、世界一流的人工智能计算平台 , 它的目标是让开发者更好在上面开发基于AI的产品 。 包括旭日和征程芯片 , 芯片架构、编译器、SoC、AI算法、深度学习框架的技术交融 , 软硬协同优化 , 通过BPU微架构、版图、时序、片上网络、指令架构、运行调度、通信、功耗等方面提升性能和可靠性 , 流片验证 , 把它用在机器上 , 让机器像人一样可以看懂、听懂周围的世界 。 这点是保证了好用芯片里面软硬结合和软硬结合的核心 。
除此之外 , 天工开物工具链沉淀了最领先的轻量化模型研发实践、模型压缩、量化训练、训练后量化、深度学习框架、运行时环境、AI应用方案到工具链中 , 通过自动化、工具化、样例化 , 服务万千开发者 , 普惠AI , 让赋能机器更高效 。
地平线的艾迪平台 , 通过端云协同、数据闭环、自动数据挖掘、自动化标注提升算法研发效率 , 通过评测集群和硬件在环测试提升边缘侧迭代效率 。 它背后还有一整套的硬件和评测集群 , 为了完成模型的训练 , 还要对GPU集群做管理 , 同时这些数据也要有存储管理 , 整个过程都要自动化高效调度 。 如果前面是为了提升算法的研发效率 , 后面就是为了提升硬件资源的利用率 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
