英伟达发布最新版CUDA 13.1,官方直接定性:这是自2006年诞生以来最大的进步。 核心变化是推出全新的CUDA Tile编程模型,让开发者可以用Python写GPU内核,15行代码就能达到200行CUDA C++代码的性能。 Jim Keller参与设计过AMD Zen架构、苹果A系列芯片、特斯拉自动驾驶芯片 ...
雷锋网 AI 开发者按:近日,NVIDIA 开源了适用于 Python 的视频处理框架「VideoProcessingFramework(VPF)」。该框架为开发人员提供了一个简单但功能强大的 Python 工具,可用于硬件加速的视频编码、解码和处理类等任务。 同时,由于 Python 绑定下的 C ++代码,它使开发 ...
快科技2月11日消息,近日,摩尔线程正式开源TileLang-MUSA项目,实现对TileLang编程语言的完整支持。
2025 年 12 月,在 CUDA 发布近二十年后,NVIDIA 推出新的 GPU 编程入口「cuTile」,通过 Tile-based 编程模型重构 GPU 内核,使开发者无需深入 CUDA C++ 即可高效编写 Kernel,引发社区热议。尽管仍处早期,Tile 思维的抽象优势、社区探索迁移工具及实践尝试表明,cuTile 有 ...
NumPy作为Python数值计算领域的基础框架,凭借其强大的N维数组结构和丰富的函数生态系统,成为科学家、工程师和数据分析师的核心工具。然而,随着计算需求的快速增长,特别是在机器学习和大规模科学模拟领域,NumPy基于CPU的执行模式以及缺乏内置自动微分 ...
2017年9月,美国华盛顿特区。IEEE国际超声研讨会(IUS)的会议厅里,一篇仅有4页的会议论文首次向超声学界提出了一个在当时看来颇为激进的问题: “在一个基于GPU的超声研究扫描仪上直接集成深度学习算法,是否可行?” 这篇题为《The feasibility of deep learning algorithms integration on a GPU-based ultrasound re ...
导语:算力对数据科学家来说很重要 雷锋网 AI 科技评论按,数据科学家需要算力。无论您是用 pandas 处理一个大数据集,还是用 Numpy 在一个大矩阵上运行一些计算,您都需要一台强大的机器,以便在合理的时间内完成这项工作。 在过去的几年中,数据科学家 ...
近日,PyTorch 团队发布了 PyTorch 1.8 版本。该版本整合了自去年 10 月 1.7 版本发布以来的 3000 多次 commit,提供了编译、代码优化、科学计算前端 API 方面的主要更新和新特性。值得一提的是,该版本新增了对 AMD ROCm 的支持。 此外,PyTorch 1.8 版本还为大规模训练 ...
OpenAI, the nonprofit venture whose professed mission is the ethical advancement of AI, has released the first version of the Triton language, an open source project that allows researchers to write ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果