改善医疗环境中语音转文本技术的发音
语音转文本程序在日常任务中越来越受欢迎,例如免提听写、帮助视障人士以及为听力障碍者转录语音。这些工具有很多用途,格但斯克理工大学的研究员 Bożena Kostek 正在探索如何更好地将 STT 应用于医疗领域。通过研究清晰的语音如何影响 STT 准确性,她希望提高其对医疗保健专业人员的实用性。
科斯特克说:“自动记录患者数据对于医生和放射科医生来说至关重要,因为它让医生有更多的时间与患者面对面交流,并能更好地收集数据。”
Kostek还解释了他们在这项工作中面临的挑战。
“STT 模型经常难以理解医学术语,尤其是波兰语,因为许多模型主要接受英语训练。此外,大多数资源都侧重于简单语言,而不是专业的医学词汇。嘈杂的医院环境使情况更加困难,因为医护人员可能由于压力或分心而无法清晰地说话。”
为了解决这些问题,研究人员创建了一个详细的音频数据集,其中包含心脏病学和肺病学等领域的医生和专家所说的波兰医学术语。研究人员使用自动语音识别模型(一种将语音转换为文本的技术)分析了该数据集,并将其转录。研究人员使用了多个指标(例如单词错误率和字符错误率)来评估语音识别的质量。该分析有助于了解语音清晰度和风格如何影响 STT 的准确性。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。