异步状态机原理

SunnyFan大约 11 分钟约 3238 字

异步状态机原理

简介

C# 的 async/await 语法糖背后，编译器生成复杂的状态机结构。理解异步状态机的工作原理，包括 Task 对象、Awaiter 模式、执行上下文流转和同步上下文，对于编写高效异步代码和排查异步问题至关重要。

特点

1.状态机结构 — 编译器生成的 MoveNext 方法
2.Awaiter 模式 — GetAwaiter/GetResult/IsCompleted
3.执行上下文 — ExecutionContext 流转机制
4.同步上下文 — SynchronizationContext 的作用
5.ValueTask 优化 — 减少异步分配

状态机生成原理

编译器生成的状态机

// 原始 C# 代码：
static async Task<string> FetchDataAsync(string url)
{
    Console.WriteLine("开始请求");
    var response = await httpClient.GetStringAsync(url);
    Console.WriteLine("请求完成");
    return response;
}

// 编译器生成的等价代码（简化）：
[CompilerGenerated]
private sealed class <FetchDataAsync>d__0 : IAsyncStateMachine
{
    public int <>1__state;                          // 当前状态
    public AsyncTaskMethodBuilder<string> <>t__builder; // Task builder
    public string url;                              // 参数
    private string <response>5__1;                  // 局部变量
    private TaskAwaiter<string> <>u__1;             // Awaiter

    void IAsyncStateMachine.MoveNext()
    {
        int num = <>1__state;
        try
        {
            TaskAwaiter<string> awaiter;
            if (num != 0) // 第一次进入（状态 -1）
            {
                Console.WriteLine("开始请求");
                awaiter = httpClient.GetStringAsync(url).GetAwaiter();
                if (!awaiter.IsCompleted)
                {
                    <>1__state = 0;   // 设置为等待状态
                    <>u__1 = awaiter;
                    // 注册回调，异步完成时重新调用 MoveNext
                    <>t__builder.AwaitUnsafeOnCompleted(ref awaiter, ref this);
                    return; // 第一次挂起点
                }
            }
            else // 从 await 恢复（状态 0）
            {
                awaiter = <>u__1;
                <>u__1 = default;
                <>1__state = -1;
            }
            <response>5__1 = awaiter.GetResult();
            Console.WriteLine("请求完成");
            <>t__builder.SetResult(<response>5__1);
        }
        catch (Exception ex)
        {
            <>1__state = -2;
            <>t__builder.SetException(ex);
        }
    }
}

多个 await 的状态转换

// 原始代码：
static async Task ProcessAsync()
{
    await Step1Async();  // 状态 0 → 1
    await Step2Async();  // 状态 1 → 2
    await Step3Async();  // 状态 2 → 完成
}

// 状态机状态图：
// state -1: 初始状态 → 调用 Step1Async
// state 0:  Step1 完成 → 调用 Step2Async
// state 1:  Step2 完成 → 调用 Step3Async
// state 2:  Step3 完成 → SetResult
// state -2: 异常状态

// 每个 await 都是一个可能的挂起点
// 状态编号：初始-1，第一个await为0，第二个为1，以此类推
// 如果 await 的任务已同步完成，状态机不会挂起

Awaiter 模式

自定义 Awaiter

// Awaiter 模式要求实现以下方法：
// 1. INotifyCompletion.OnCompleted(Action) — 注册回调
// 2. bool IsCompleted { get; } — 是否同步完成
// 3. T GetResult() — 获取结果

// 自定义可等待类型
public struct CustomAwaiter : INotifyCompletion
{
    private readonly Task<string> _task;

    public CustomAwaiter(Task<string> task) => _task = task;

    public bool IsCompleted => _task.IsCompleted;

    public void OnCompleted(Action continuation)
    {
        // 自定义回调调度逻辑
        _task.ContinueWith(_ => continuation());
    }

    public string GetResult() => _task.Result;
}

// 让类型支持 await
public class CustomAwaitable
{
    private readonly Task<string> _task;
    public CustomAwaitable(Task<string> task) => _task = task;

    public CustomAwaiter GetAwaiter() => new CustomAwaiter(_task);
}

// 使用
async Task UseCustomAwait()
{
    var result = await new CustomAwaitable(SomeTask());
}

配置 await 行为

// ConfigureAwait(continueOnCapturedContext)
// true  (默认): 回到捕获的同步上下文继续执行（UI 线程）
// false: 在任意线程继续执行（线程池线程）

// 库代码应始终使用 ConfigureAwait(false)
async Task<string> LibraryMethodAsync()
{
    // 不需要回到 UI 线程，避免死锁
    var data = await httpClient.GetStringAsync(url).ConfigureAwait(false);
    var result = await ProcessDataAsync(data).ConfigureAwait(false);
    return result;
}

// ASP.NET Core 没有 SynchronizationContext
// ConfigureAwait(false) 在 ASP.NET Core 中无实际效果
// 但在库代码中使用是良好实践（兼容 UI 应用）

// UI 应用中的典型死锁场景（不用 ConfigureAwait）
// UI 线程: await task → 等待 task 完成 → task 完成后需要回到 UI 线程
// 但 UI 线程在等待 → 死锁！

执行上下文与同步上下文

ExecutionContext 流转

// ExecutionContext 携带的信息：
// 1. LogicalCallContext（AsyncLocal<T>）
// 2. CultureInfo
// 3. Principal（安全上下文）
// 4. 其他上下文信息

// AsyncLocal<T> — 异步流程中传递数据
static readonly AsyncLocal<string> _correlationId = new();

async Task HandleRequestAsync()
{
    _correlationId.Value = Guid.NewGuid().ToString();
    await Step1Async(); // AsyncLocal 自动流转
    await Step2Async(); // 仍然可以读取
}

async Task Step1Async()
{
    // 在任何 await 之后仍然能读取
    Console.WriteLine($"CorrelationId: {_correlationId.Value}");
    await Task.Delay(100);
    Console.WriteLine($"CorrelationId: {_correlationId.Value}"); // 相同值
}

// ExecutionContext 的性能影响
// 每次 await 都会捕获和恢复 ExecutionContext
// 对于热路径，ExecutionContext 流转有开销
// 使用 Task.Run 的重载控制是否流动上下文
Task.Run(() => DoWork(), TaskCreationOptions.DenyChildAttach);

SynchronizationContext 深入

// 不同的 SynchronizationContext：
// 1. Windows Forms: WindowsFormsSynchronizationContext → Control.Invoke
// 2. WPF: DispatcherSynchronizationContext → Dispatcher.Invoke
// 3. ASP.NET Core: 无（null） → 线程池
// 4. xUnit: MaxConcurrencySyncContext

// 自定义 SynchronizationContext
public class SingleThreadSyncContext : SynchronizationContext
{
    private readonly BlockingCollection<(SendOrPostCallback, object?)> _queue = new();

    public override void Post(SendOrPostCallback d, object? state)
    {
        _queue.Add((d, state));
    }

    public void Run()
    {
        foreach (var (callback, state) in _queue.GetConsumingEnumerable())
        {
            callback(state);
        }
    }

    public override SynchronizationContext CreateCopy() => this;
}

// 使用自定义上下文
var ctx = new SingleThreadSyncContext();
SynchronizationContext.SetSynchronizationContext(ctx);
// 现在 await 会将回调 Post 到我们的队列

同步上下文与死锁分析

/// <summary>
/// 经典死锁场景分析
/// </summary>

// UI 应用的经典死锁
public class DeadlockExample
{
    // ❌ 死锁！
    public string GetDataBad()
    {
        // UI 线程调用 GetDataBad
        // 1. Task.Run 在线程池执行异步操作
        // 2. .Result 阻塞 UI 线程等待结果
        // 3. 异步操作完成后需要回到 UI 线程（SynchronizationContext）
        // 4. UI 线程被阻塞，无法回到 → 死锁
        return Task.Run(() => GetDataAsync()).Result;
    }

    // ✅ 使用 await
    public async Task<string> GetDataGoodAsync()
    {
        return await GetDataAsync();
    }

    // ✅ 使用 ConfigureAwait(false) 绕过同步上下文
    public string GetDataWithConfigureAwait()
    {
        return Task.Run(() => GetDataAsync().ConfigureAwait(false).GetAwaiter().GetResult());
    }

    // ✅ 使用 GetAwaiter().GetResult() 替代 .Result（更好的异常信息）
    public string GetDataWithGetResult()
    {
        return GetDataAsync().ConfigureAwait(false).GetAwaiter().GetResult();
    }

    private async Task<string> GetDataAsync()
    {
        await Task.Delay(100);
        return "data";
    }
}

// 为什么 ASP.NET Core 不会死锁？
// ASP.NET Core 没有 SynchronizationContext
// await 后的代码在线程池线程执行，不需要回到特定线程
// 但 .Result 仍然会阻塞线程池线程，浪费资源

ValueTask 深入

ValueTask 的内存优势

// Task<string> — 总是堆分配
// ValueTask<string> — 同步完成时无分配

// 适合 ValueTask 的场景：
// 1. 操作通常同步完成（如缓存命中）
// 2. 热路径频繁调用
// 3. 需要减少 GC 压力

public class AsyncCache
{
    private readonly ConcurrentDictionary<string, string> _cache = new();

    // 缓存命中时同步返回，不分配 Task 对象
    public ValueTask<string> GetOrAddAsync(string key, Func<string, Task<string>> factory)
    {
        if (_cache.TryGetValue(key, out var cached))
            return new ValueTask<string>(cached); // 同步完成，零分配

        return new ValueTask<string>(FactoryCore(key, factory)); // 异步，分配一次
    }

    private async Task<string> FactoryCore(string key, Func<string, Task<string>> factory)
    {
        var value = await factory(key);
        _cache[key] = value;
        return value;
    }
}

// ValueTask 使用注意事项：
// 1. 不能 await 两次
// 2. 不能在并发中使用
// 3. 不要存储为字段（除非用 ValueTaskCache）
// 4. 不要使用 .Result（用 await）

ValueTask 的常见陷阱

/// <summary>
/// ValueTask 的正确使用方式
/// </summary>

// 陷阱 1：多次 await
// ❌ ValueTask 只能 await 一次
ValueTask<int> vt = GetValueAsync();
int a = await vt;
// int b = await vt; // 可能抛异常或返回错误结果

// ✅ 先转为 Task 再多次 await
Task<int> task = vt.AsTask();
int a = await task;
int b = await task; // 安全

// 陷阱 2：并发使用
// ❌ ValueTask 不能被并发 await
ValueTask<string> shared = GetSharedAsync();
// Task.WhenAll(await shared, await shared); // 错误！

// 陷阱 3：存储为字段
// ❌ 不要将 ValueTask 存储为类的字段
class BadCache
{
    private ValueTask<string> _cachedResult; // 错误！
}

// ✅ 存储结果而非 ValueTask
class GoodCache
{
    private string? _cachedValue;
    private Task<string>? _cachedTask;
}

// 陷阱 4：不使用 await 而直接访问结果
// ❌ 不要使用 .Result
// int value = GetValueAsync().Result; // 可能死锁

// ✅ 始终使用 await
int value = await GetValueAsync();

async/await 的性能影响

状态机的分配开销

/// <summary>
/// async 方法的内存分配分析
/// </summary>

// 每个 async 方法编译器生成一个状态机类
// 首次调用时分配状态机对象 + Task/ValueTask

// 对于不需要异步的场景，使用同步方法
// ❌ 不必要的 async
async Task<int> GetLengthAsync(string s)
{
    return s.Length; // 没有任何 await，但仍然分配状态机
}

// ✅ 直接返回 Task.FromResult
Task<int> GetLength(string s)
{
    return Task.FromResult(s.Length); // 无状态机分配
}

// ✅ 或者使用 ValueTask
ValueTask<int> GetLengthValue(string s)
{
    return new ValueTask<int>(s.Length); // 零分配
}

// ✅ .NET 6+ 使用 Task.CompletedTask
Task DoNothing()
{
    // 如果没有返回值且不需要异步
    return Task.CompletedTask; // 无分配（缓存的 Task 实例）
}

异步编程最佳实践

/// <summary>
/// 异步编程中的常见性能和正确性问题
/// </summary>

// 1. 避免 async void — 只有事件处理器可以用 async void
// ❌ 异常无法捕获
async void FireAndForget()
{
    await Task.Delay(100);
    throw new Exception("boom"); // 导致进程崩溃！
}

// ✅ 使用 Task 返回值
async Task FireAndCatch()
{
    try { await Task.Delay(100); }
    catch (Exception ex) { Log(ex); }
}

// 2. 使用 CancellationToken
async Task LongRunningOperation(CancellationToken ct)
{
    for (int i = 0; i < 1000; i++)
    {
        ct.ThrowIfCancellationRequested(); // 检查取消
        await Task.Delay(100, ct);          // 支持取消的延迟
    }
}

// 3. 避免在循环中不加 await
// ❌ 所有的 Task 同时启动，没有等待
async Task ProcessItemsBad(List<int> items)
{
    var tasks = new List<Task>();
    foreach (var item in items)
        tasks.Add(ProcessAsync(item)); // 所有任务同时启动
    await Task.WhenAll(tasks); // 1000 个任务同时运行！
}

// ✅ 限制并发
async Task ProcessItemsGood(List<int> items)
{
    using var semaphore = new SemaphoreSlim(10); // 最多 10 个并发
    var tasks = items.Select(async item =>
    {
        await semaphore.WaitAsync();
        try { await ProcessAsync(item); }
        finally { semaphore.Release(); }
    });
    await Task.WhenAll(tasks);
}

// 4. ConfigureAwait(false) 在库代码中必须使用
// 避免捕获同步上下文，提升性能并避免死锁
async Task<string> LibraryMethodAsync()
{
    var data = await FetchAsync().ConfigureAwait(false);
    return Process(data);
}

优点

1.编译器自动化 — 开发者无需手动管理状态
2.零分配优化 — ValueTask 和缓存 Path 减少分配
3.灵活调度 — SynchronizationContext 支持不同 UI 框架
4.上下文流转 — AsyncLocal 自动传递请求级数据

缺点

1.状态机开销 — 每个 async 方法生成一个状态机类
2.死锁风险 — 同步上下文不当使用导致死锁
3.调试困难 — 异步堆栈跟踪不够直观
4.过度使用 — 简单同步逻辑不需要 async

async/await 编译器生成 IAsyncStateMachine 状态机，每个 await 是一个潜在挂起点。状态机通过 AwaitUnsafeOnCompleted 注册回调，异步操作完成后恢复执行。Awaiter 模式要求 IsCompleted、GetResult、OnCompleted 三者配合。ConfigureAwait(false) 在库代码中必须使用，防止 UI 应用死锁。ExecutionContext 自动流转 AsyncLocal<T> 值。SynchronizationContext 在 UI 框架中负责回到 UI 线程。ValueTask<T> 适合高频同步完成场景，减少 Task 对象分配。