5.1.2.1 独立解析器构建 5.1.2.1 独立解析器构建:当ANTLR生成的Lexer在Unicode边界上“失语”——一个被忽略的字符类陷阱与可复用的零宽度断言修复方案 你有没有试过,在DSL语法中写下一个看似无害的标识符规则: 然后满怀信心地把 、 、甚至 扔进解析器——结果,前两个能过,第三个直接报错:“mismatched input '✅' expecting ID”? 更诡异的是, 明明是单个Unicode码点(U+2705),长度为1,却在词法分析阶段就被Lexer无情截断、丢弃,甚至导致后续所有token错位。