WARDEN:仅用6小时数据实现濒危原住民语言Wardaman的语音转写与英译


WARDEN:面向濒危原住民语言的极低资源语音转译系统——一项认知-计算协同的语言存续工程深度解读 📋 论文基本信息 标题:WARDEN: Endangered Indigenous Language Transcription and Translation with 6 Hours of Training Data 作者:Ziheng Zhang, Yunzhong Hou, Naijing Liu, Liang Zheng ArXiv ID:2605.13846(注:该ID对应预设发布日期2026-05-13,属未来编号;实际应为2024或2025年提交,此处按论文内文逻辑视为近期前沿工作) 学科分类:cs.CL(Computation and Language)、cs.AI(Art...

WARDEN:面向濒危原住民语言的极低资源语音转译系统——一项认知-计算协同的语言存续工程深度解读 📋 论文基本信息 标题:WARDEN: Endangered Indigenous Language Transcription and Translation with 6 Hours of Training Data 作者:Ziheng Zhang, Yunzhong Hou, Naijing Liu, Liang Zheng ArXiv ID:2605.13846(注:该ID对应预设发布日期2026-05-13,属未来编号;实际应为2024或2025年提交,此处按论文内文逻辑视为近期前沿工作) 学科分类:cs.CL(Computation and Language)、cs.AI(Artificial Intelligence) 核心任务:Wardaman语(澳大利亚北领地濒危原住民语言)→ 英语的端到端语音转录(ASR)与翻译(ST)联合建模 数据规模:仅6小时高质量人工标注音频(含音素级对齐与双语语义标注) 方法范式:解耦式两阶段流水线(Phonemic ASR + Lexic...

发布者: 作者: 转发
评论区 (0)
U