Unity Compute Shader入门指南

创作时间:

作者:

@小白创作中心

Unity Compute Shader入门指南

引用

CSDN

https://blog.csdn.net/yx314636922/article/details/136654305

Compute Shader是Unity中用于GPU通用计算的重要工具，它允许开发者直接利用GPU的并行计算能力来处理各种计算任务。本文将从GPU计算的基本原理出发，详细介绍Compute Shader的定义、优势和限制，并通过具体的代码示例展示如何在Unity中创建和使用Compute Shader。

一、原理概念

早期的GPU计算中，顶点着色和片元着色完全独立，顶点着色器不能读取纹理，开发者需要按照算力分配VS和FS的复杂度来保证效率，并且图形还需要经过一系列图形管线处理。如下图。

不过随着非图形计算的需求增大，出现了GPGPU（General Purpose GPU，GPU通用计算）业务场景，图形硬件开始引入一种统一的计算单元来处理vertex和pixel，不需要经过图形流水线而是直接用GPU并行计算。如下图，顶点着色和片元着色合并为“compute units”处理。【也有更复杂的内存系统】

GPU包含很多compute units，每个compute unit又包含了：
1. 若干SIMD units（(single instruction multiple data)），由它们来实际执行指令
2. 每个SIMD unit可以对多个elements进行同一个操作
3. 每个compute unit内部包含了一些local memory，可以用于不同shader stages之间的通信

实现这种计算的Shader，就是Compute Shader。

主要优势：
1. 利用GPU的compute units实现高效并行计算
2. 比vertex-frag的方式能更快交换数据，减少CPU bottleneck，避免使用昂贵的多Pass，灵活性更高
3. 语义可以在图形、空间外
限制性：
1. 不是所有效果都适合用compute shader，比如传统fs里做的很多简单后处理，用其反而降低效率
2. 有些GPU架构缺少特定硬件，导致需要针对性设计、兼容
3. 难开箱即用，需要不断测试优化
为了编写高效的compute shader，应该：
1. 把一个大问题分成尽可能多的若干独立的work items，分得越多越好
2. 尽量使用uniform变量，速度快，内存小
3. 如果代码需要频繁访问内存，应当尽可能减少状态保存
4. 一个线程组内避免使用分支
5. 将for循环指令拆开

二、Unity Compute Shader

2.1 Compute Shader格式、参数含义

在Unity的中右键-Create-Shader-Compute Shader创建，后缀为 .compute 。

//声明kernel的函数名，至少有一个，可以定义预处理宏 
#pragma kernel CSMain
#pragma kernel KernelOne SOME_DEFINE DEFINE_WITH_VALUE=1337
#pragma kernel KernelTwo OTHER_DEFINE
// 可读写（Read和Write）二维纹理，直接Result[uint2(0,0)]来访问，rgba对应数据类型为float4
//官方除此以外还有RWBuffer和RWStructuredBuffer，见https://learn.microsoft.com/en-us/windows/win32/direct3dhlsl/sm5-object-rwtexture2d
RWTexture2D<float4> Result;
//定义一个线程组（Thread Group）中可以被执行的线程（Thread）总数量，即为X*Y*Z
//其值与Dispatch中设置的核函数numthreads对应
[numthreads(8,8,1)]
//SV_GroupID：线程组id，int3；如果Dispatch（1024 / 8，1024 / 8，1），也就是定义了一个128 * 128个线程组，SV_GroupID的范围（0， 0， 0） - （128， 128， 0）
//SV_GroupThreadID：线程组里线程的id，int3
//SV_DispatchThreadID：全局id，图片每个像素的坐标，int3；例如一个线程组有(X,Y,Z)个线程，SV_GroupID=(a,b,c)的线程组里的SV_GroupThreadID=(i,j,k)的线程的SV_DispatchThreadID为：(a*X+i, b*Y+j, c*Z+k)
//SV_GroupIndex：int，线程组内的某个线程的下标，（8里边的第几个），假如有(X,Y,Z)个线程，第一个线程(0,0,0)=0，(1,0,0)=1，(1,0,0)=2，...,(0,1,0)=X，...，(0,0,1)=X*Y
void CSMain (uint3 groupId : SV_GroupID,
    uint3 groupThreadId : SV_GroupThreadID,
    uint3 id : SV_DispatchThreadID,
    uint groupIndex : SV_GroupIndex)
{
    Result[id.xy] = float4(id.x & id.y, (id.x & 15)/15.0, (id.y & 15)/15.0, 0.0);
}

2.2 调用

普通shader直接在材质上使用即可，compute shader还需要在C#文件中专门调用才能使用。

public class testCompute : MonoBehaviour
{
    private RenderTexture texture;
    public ComputeShader computeShader;
    public Material material;
    private int kernal;
    void Start()
    {
        texture = new RenderTexture(256, 256, 16);
        texture.enableRandomWrite = true;
        texture.Create();
        kernal = computeShader.FindKernel("CSMain");
    
        material.SetTexture("_BaseMap", texture);
    }
    void Update()
    {
        computeShader.SetTexture(kernal, "Result", texture);
        computeShader.Dispatch(kernal, 256 / 8, 256 / 8, 1);
    }
}

默认效果：

热门推荐

云梦县的文化瑰宝——睡虎地秦简