贝博中国
贝博中国
贝博中国

GTC23 阿里云机器学习平台 PAI 精选演讲推荐

时间: 2024-04-11 00:41:22 |   作者: 贝博中国

  的数据显示,预计到 2025 年,全球 AI 市场规模将达到 1.25 万亿美元。同时,中国已成为全世界最大的 AI 应用市场之一,据中国产业发展研究院发布的多个方面数据显示,截至 2022 年底,国内 AI 产业规模达到 1204 亿元人民币,同比增长 59.5%。

  并且随着近阶段 AIGC(AI generated content)概念的爆火,人工智能再次受到全球社会层面的广泛关注。AIGC 能带来更加创新的应用,包括坐席辅助、智能语音、无人驾驶、人脸识别、扩展现实、机器翻译以及金融欺诈检测等多个领域,潜力极大。

  而在 AIGC 浪潮不断带来新惊喜的同时,今天 AI 开发门槛高仍然是亟待解决的问题。因硬件、框架和开发环境三者之间的适配度低,们不得不关注底层基础设施的调优和适配工作,无形中降低了工作效率。

  阿里云机器学习 PAI 团队致力于为企业和开发者们提供云原生、高性能的 AI 平台服务。在计算性能方面,专注于 AI 训练、AI 推理等方面的软硬协同优化工作,开源了丰富的工具套件。在平台能力方面,PAI 团队推出覆盖 AI 开发全链路的平台产品,兼容各类底层计算硬件和 AI 框架,让算法工程师们能专注于 AI 开发的阶段,实现云、端侧、创新硬件等多种场景的创新。

  DeepRec 支持了淘宝搜索、猜你喜欢、定向、直通车等核心业务,支撑着千亿特征、万亿样本超大规模的搜索、推荐、广告场景的模型训练和推理。自 DeepRec 开源以来,已有数十家网络公司将 DeepRec 应用在他们的搜推广场景的业务中,取得了显著的业务效果提升和性能提升。DeepRec 中提供的功能和性能优化主要分三个方面:1. 模型效果方面;2. 训练和推理优化方面;3. 模型部署方面。

  近年来,访存密集型计算日益成为影响机器学习模型性能的主要的因素。由于机器学习模型计算图日趋复杂,传统的机器学习编译器面对复杂的数据依赖关系时很难执行高效的计算融合优化。同时,动态张量形状(dynamic tensor shape)的模型优化需求开始兴起,缺失的张量形状使得访存密集型计算子图的性能优化变得更困难。

  本次演讲将讲述阿里巴巴针对机器学习任务中访存密集型计算性能优化的关键技术:STITCH 融合技术。该技术上的支持将任意类型及任何数量的机器学习访存密集型算子进行融合,最终将大粒度的访存密集型计算子图转化为单个的 GPU 核函数,以减少片外访存、框架调度及 GPU 核函数调用开销。

  在 GTC 大会官网(搜索会议代码找到该演讲,点击“Add to Schedule”或右上角五角星,提前预约或收藏。

  如下图 [S51544] 演讲,点击“Add to Schedule”或右上角五角星,即可添加至您的日程。

  GTC 大会注册流程请参看 GTC23 注册教程,请在 3 月 26 日前完成在线注册,免费观看以及回看 GTC 2023 春季大会超过 650 场精彩内容!

  扫描下方海报二维码,锁定 NVIDIA 创始人兼首席执行官黄仁勋的 GTC 主题演讲!北京时间 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中国重播。深度解读 NVIDIA加速计算平台如何推动人工智能、元宇宙、云技术和可持续计算的下一波浪潮。加入 GTC23,切勿错过 AI 的决定性时刻!

  文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

  声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。举报投诉英伟达英伟达+关注

  文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

  以下文章来源于谷歌云服务,作者 Google Cloud 点击下方卡片,解锁课程详情   点击屏末     阅 读 原 文     即刻预约 Next 

  课,开启 AI 时代的创新之旅! /

  以下文章来源于谷歌云服务,作者 Google Cloud   点击屏末     阅 读 原 文     即刻报名活动 原文标题:即刻报名 Next ’

  课,踏上云端新旅程! 文章出处:【微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

  NB-IoT技术介绍 整体框架结构 • 硬件连接需要注意的几点 • DEMO运行效果 • 在

  有没有测试好的esp8266的固件? 还是说,这个固件要自己修改,自己写?

  rtt系统使用4.0.1系统。硬件网络选择enc28j60模块 协议栈使用iwip2.0.1

  SDK包使用3.0.1 当前通过ping命令测试数据是ping通的。 所以确认网络通信正常。 但是

  瑞萨如何利用Synopsys VSO.ai将SoC验证生产率提高30%

  【米尔-芯驰D9360商显板试用评测】成功解决QCamera的模块调用,并编写简单的查找摄像头程序

  【米尔-芯驰D9360商显板试用评测】QT5添加 multimedia multimediawidgets,提示找不到模块