跳到主要内容

TileLang 在线体验指南

概述

TileLang 是一种专为高性能 GPU/CPU 内核开发设计的领域特定语言(DSL),由北京大学计算机学院团队主导开发,并于 2025 年 1 月正式开源。该项目因近期被 DeepSeek 深度集成并推荐用于实验性开发而备受业界关注。

核心特性:

  • Pythonic 语法:采用类 Python 语法,大幅降低了底层算子开发的门槛。
  • 高效生产力:开发者专注于逻辑实现,无需在底层优化上耗费过多精力,即可获得对标国际主流生态的性能。
  • 极致精简:以 FlashAttention 算子为例,TileLang 将代码量从传统的 500+ 行缩减至 80 行,且性能与官方版本持平,显著提升了代码的可维护性与迭代速度。

体验环境说明

为降低开发者的尝鲜门槛,本平台(模力方舟)提供了开箱即用的 TileLang 在线环境。该环境基于国产 沐曦 (MetaX) 曦云 C 系列 GPU 构建,预置了完整的编译工具链与运行依赖。

硬件支持

本体验环境底层算力由 沐曦 (MetaX) GPU 提供支持。通过深度适配的 mcTileLang 项目,您可以在国产异构算力上无缝体验 TileLang 的开发与优化流程。

快速启动

1. 创建实例

进入算力市场,选择 沐曦 (MetaX) 品牌的 GPU 资源,并在镜像列表中选中 TileLang 预置镜像。

选择镜像

2. 运行验证 Demo

实例启动后,通过 SSH 或 JupyterLab 的终端进入环境。我们已为您预置了官方示例代码,执行以下命令即可快速验证 TileLang 在沐曦 GPU 上的运行效果:

# 进入预置项目目录
cd /root/mcTileLang/

# 运行快速入门示例
python3 ./examples/quickstart.py

3. 查看执行结果

若环境运行正常,您将看到类似下图的性能输出报告,表明 TileLang 算子已成功编译并执行:

执行结果

参考资料