摘要
呼吸系统疾病在全球范围内对公共卫生构成重大挑战。近年来,声学技术作为一种非侵入性、便捷的诊断手段,在呼吸疾病的检测和监测中显示出巨大潜力。随着传感器技术和机器学习算法的发展,基于声学数据分析的疾病分类和模式识别逐步成为可能。本文综述了声学技术在呼吸疾病诊疗中的应用,重点探讨了不同声学信号的采集与分析方法及其在临床中的潜力。尽管声学技术在呼吸疾病的检测中展现了良好的前景,但仍面临噪声干扰、信号处理能力,临床转化应用,多模态数据整合等挑战。未来的研究应聚焦于技术改进和跨学科合作验证,提升诊断准确性,并推动声学技术的临床应用。
呼吸系统疾病不仅是全球范围内的重大医疗负担,也是严重影响我国居民健康的重要公共卫生问题[1, 2]。数据显示,我国20岁及以上的慢性阻塞性肺疾病(简称慢阻肺病)患者接近1亿,支气管哮喘患者约4 570万,而阻塞性睡眠呼吸暂停(obstructive sleep apnea,OSA)患者则超过1.7亿[3, 4, 5]。面对如此庞大的患病人群,亟需高效的早期筛查和及时干预手段。传统检查方法(如X线胸片、CT扫描和肺功能测试)尽管具有较高的准确性,但在早期诊断和非侵入性检测等方面存在一定局限;此外,听诊结果对医务人员的经验依赖性较高。呼吸疾病的复杂性与诊疗需求推动了新技术的引入,其中声学技术为该领域提供了全新的解决方案。近年来,随着声学传感器技术的进步[6]及计算分析方法的快速发展,声学技术逐渐成为呼吸病研究的热点方向。人工智能(artificial intelligence,AI)辅助的呼吸音分析能够支持医务人员更准确地识别各种呼吸音[7]。尤其在新型冠状病毒感染大流行期间,以咳嗽音为代表的声学标志物被用于诊断,相关研究数量显著增加[8, 9, 10, 11, 12]。随后,基于呼吸音及其数字生物标志物的研究拓展到上下呼吸道的声音分析,成为评估呼吸功能的重要指标[13],并在呼吸疾病的诊断、治疗及监测中展现出巨大潜力。本文将从多维角度分析声学技术在呼吸病诊疗中的优势与不足,并提出未来发展方向的建议。
一、医学声学技术的基本原理与应用现状:跨学科的技术发展
智能声学分析中,呼吸音、咳嗽音、鼾声、语音、呼气音等都可以作为研究和应用的对象。不同类型的声音反映了不同的生理或病理现象,通过结合人工智能、机器学习和信号处理技术进行声学分析,可以实现更精确地诊断和监测。下面分别对呼吸声学的分析和应用2个部分进行介绍。
(一)呼吸声学的分析
1. 呼吸音分析:呼吸音是声学分析的核心,亦有文献称为“肺音”。通过智能分析可自动识别正常和异常的呼吸音。正常呼吸音包括气管音、支气管音和水泡音;异常呼吸音则涵盖干啰音、湿啰音、哮鸣音及胸膜摩擦音(表1)。已有文献描述了健康与病理状态下肺音的特征[14, 15, 16, 17, 18, 19],并将其分为正常和异常肺音两类:正常肺音包括气管支气管音及源自支气管树或远端肺实质的水泡音;病理性肺音则与上气道或支气管阻塞相关。
2. 咳嗽音分析:咳嗽是呼吸道疾病的典型症状,其声波形由爆炸声、中音和浊音3个阶段组成[20]。咳嗽音的声学特征包括频域、时域、音质、振幅、规律性、持续时间、时相及伴随声音等;临床特征则涉及咳嗽的严重程度、频率、强度、咳嗽冲动及对生活质量的影响[21]。低频咳嗽音多与大气道(如气管、支气管)相关,通常表现为低沉、粗糙的声音,如简称慢阻肺病、肺炎或支气管扩张引起的湿咳或剧烈咳嗽;高频咳嗽音则多与小气道(如细支气管、肺泡)相关,表现为尖锐、刺耳的声音,常见于急性上呼吸道感染和过敏性咳嗽等干咳症状。此外,混合频率咳嗽通常提示多部位病变或多种病理状态的重叠,如支气管哮喘(简称哮喘)合并感染或病灶广泛的肺结核。咳嗽音包含丰富的呼吸道状态信息,其声学与临床特征的关联研究已成为当前的研究热点。
3. 鼾声分析:鼾声亦是早期声学分析的关注重点。产生鼾声的根本原因是上气道的部分阻塞。正常情况下,空气通过口腔和鼻腔进入气道,但如果上气道在睡眠时部分狭窄或受压迫,气流的通过会受到阻力,振动气道内软组织(如软腭、悬雍垂、舌根等)产生声音。鼾声在单纯鼾症和OSA患者均常见[22],已有不少研究提出自动化且高精度的鼾声检测算法来诊断OSA[23],详述见后。
4. 语音分析:人的声音产生是一个复杂的过程。研究表明,呼吸系统功能对语音的产生具有重要作用[24]。特别是在一些常见的呼吸系统疾病中,如哮喘或肺气肿,会干扰呼气过程和影响气流,导致患者的发音或呼吸方式发生变化,对语音产生重大的影响。通过语音信号分析来识别这些变化,以用于诊断。在健康人群的研究中,与年轻对照组相比,老年人的平均气流峰值,声音强度,基本频率和平均肺压均显著降低[25]。
(二)呼吸声学的应用
1. 肺音:目前,研究主要集中在肺炎、胸腔积液、气胸、慢阻肺病和哮喘等疾病,这些疾病可根据病理生理特征分为液体积聚和空气积聚两大类。例如,肺炎引起肺内炎性液体渗出,为异常呼吸音和叩诊迟钝提供了生理基础。有研究利用肺音的频谱特征,对5种正常肺音和异常肺音的分类准确性、敏感度和特异度分别达到92.56%、92.22%和98.5%[26]。又如,哮喘和慢阻肺病均为气道炎症性疾病,其特征性喘息和病理性呼吸音可通过胸壁传导检测。在区分哮喘和慢阻肺病这两种存在症状重叠的疾病时,有研究基于肺音建立了机器学习算法模型,分类正确率能够分别达到100%和95%,并发现区分的关键在于吸气的中期阶段的音频信号特征[27]。
2. 咳嗽音:咳嗽音分析可作为非侵入性肺功能评估方法,预测FEV1、FVC等参数[28]。Sharan等[29]基于咳嗽音特征(能量、梅尔频率倒谱系数、过零率、频谱质心/带宽/截断点)建立的模型,区分阻塞性与限制性肺通气功能障碍的准确率达91.97%(敏感度87.2%,特异度93.69%)。在哮喘监测中,咳嗽音与喘息音作为数字生物标志物的平均诊断准确率为88.7%[13];在慢阻肺病的研究中,呼吸音传感器可提前5 d预测78.8%的急性加重[30]。此外,反射性咳嗽较自主咳嗽的起始爆发更高、摩擦噪声更大[31]。新型冠状病毒感染(COVID-19)大流行期间,Virufy、COVID-19 Sounds等开源数据集[31, 32, 33, 34, 35]收录了多种呼吸道疾病(含COVID-19)及健康人群的咳嗽音与人口统计信息。
3. 鼾声:鼾声分析研究显示,无监督学习算法可区分舌部与非舌部上气道塌陷,准确率达68%[36]。一项纳入7项研究的荟萃分析表明,鼾声诊断OSA的敏感度89%、特异度84%(AUC=0.94,DOR=48.06),但PLR(4.44)和NLR(0.15)提示其诊断稳健性仍不足[37]。未来的研究需优化信噪比、特征选择及自动化诊断方法。
4. 语音:语音分析在呼吸疾病诊断中的应用相对较少,但已有研究显示其潜力。哮喘患者的发音障碍患病率显著高于健康人群,表现为更明显的发音虚弱、紧张及抖动[38]。研究探讨了FEV1/FVC与语音谐噪比(HNR)的相关性,评估语音分析作为哮喘诊断替代方法的可行性[39]。在分类研究中,持续元音/i:/的识别准确率最高[40],而元音/u:/的最长发音时长与FEF-75、FEF-50、FEF-25显著正相关,主音强度则与FVC呈正相关[41]。
5. 声音融合:有研究提出融合音频实例和表征(FAIR)方法,结合咳嗽音、呼吸音和语音的多模态特征,通过自注意力机制构建算法模型,实现呼吸系统疾病检测,诊断COVID-19的AUC达0.8658(敏感度80.57%,特异度79.58%)[42]。针对慢阻肺病患者,58.3%存在发音障碍,表现为发声效率降低、最大发声时间缩短及发声阻力增加[43];欧洲呼吸杂志发表的随机对照试验显示,10周“为肺部健康歌唱”训练在改善6 min步行距离方面与标准体能训练(PExT)效果相当,且两者在生活质量、心理状态和肺功能改善方面无差异统计学意义[44]。
综上所述,不同类型呼吸疾病的肺音、咳嗽音、鼾声的声学特征不同,当前的研究结合人工智能算法,已经使其成为一种无创、便捷且成本低廉的呼吸病筛查工具。总体来看,呼吸声学在呼吸疾病中的应用具有广泛的前景,它不仅为早期诊断和监测肺功能提供了新的思路,还为个性化治疗和肺康复方案的制定提供了依据。未来的研究可以进一步探索声音分析与肺功能的关系,验证其在不同疾病状态下的应用效果,并评估其在临床实践中的推广和可行性。
二、呼吸声学技术的应用挑战:从理论到实践的差距
目前,基于声学技术的健康监测产品已投入实际应用,通过可穿戴设备或手机实现便捷的音频采集,拓展了移动或远程医疗场景。表2总结了相关AI产品,涵盖呼吸/心脏/情绪健康、睡眠监测及慢性呼吸疾病筛查等领域,通过声音分析实现个性化评估与早期诊断。
基于语音分析的健康监测产品各具特点:Sylvee通过音调、语速变化评估健康状态,但易受情绪、环境噪音干扰;Sonde侧重情绪/神经系统监测(如抑郁焦虑);两者均存在个体语言差异和隐私风险。Eko Health智能听诊器结合AI辅助心肺远程诊断,但依赖医生操作,自动化能力受限。Sleep Cycle通过环境音频监测睡眠质量,易受噪音影响。华为智能穿戴设备虽提供全面数据,但对用户操作要求较高,复杂疾病筛查精度有限。
尽管在呼吸声学分析领域已有数十年的研究和上述转化成果,但其仍然不够成熟。尤其在病理背景下,传感器收集音频、信号处理、结果的临床解释、总体标准化程度等方面仍是挑战。
首先,环境噪声、设备收音质量及患者与设备的距离等因素会干扰音频信号的清晰度,导致信号失真和特征提取困难,限制了技术的实际应用。其次,呼吸音(如咳嗽音)在不同疾病中可能表现出相似的特征,缺乏特异性,难以作为唯一的诊断依据。为此,研究者正在探索多模态诊断方法,将声学分析与生理参数(如心率、体温等)结合,以提高诊断准确性。例如,结合可穿戴设备记录的咳嗽音与生理参数,肺部感染的诊断准确性从82.6%提升至85.9%[14]。
其次,当前研究样本量普遍较小且多样性不足,限制了结果的普适性和可靠性。未来需要通过大规模、多样化的样本研究,结合跨学科合作和数据共享,推动技术的广泛应用。同时,呼吸声学分析技术的标准化不足,采集方法、分析算法和评估标准不统一,导致研究结果难以比较和复制。为此,欧洲呼吸学会(ERS)[15]和国内专家[51]已发布相关标准和共识,旨在规范数据采集与分析流程,提升技术的可重复性和临床适用性。
最后,尽管呼吸声学分析在理论上有潜力,但其转化应用仍面临挑战。工程师与临床医生需紧密合作,确保技术满足临床需求并具备可解释性。国内研究已在“呼吸健康研究”中部分应用,真实世界的大数据有望进一步提升其准确性,促进呼吸疾病的早期筛查和患者自我管理。
综上所述,呼吸声学分析技术在呼吸疾病管理中具有巨大潜力,但需通过技术创新、标准化、跨学科合作及大规模临床研究,克服噪声干扰、特异性不足、样本量有限及转化应用困难等挑战,才能实现其在临床中的广泛应用。
三、呼吸声学技术的未来展望
呼吸系统疾病因其复杂性而成为临床医学中极具挑战性的领域,包括非特异性症状的识别困难、疾病的慢性进程、多系统并发症、个体差异显著以及治疗需求的高度个性化。近年来,声学技术与机器学习的突破性进展为呼吸系统疾病的早期诊断与智能化分析开辟了新的方向,尤其是在通过咳嗽音、呼吸音等呼吸相关声音进行自动化检测方面,取得了显著成果。基于声音的诊断方法凭借其无创、易得且具备高度敏感度的特点,预示着未来的医疗诊断将迎来变革。然而,尽管这一领域展现出了巨大的潜力,仍面临诸多挑战,特别是在算法的可解释性与临床可用性方面,还存在许多待解的难题。当前技术能够提供高效的预测与分析,但其在临床应用中的普及程度与标准化仍然不足。因此,未来研究应重点关注优化声音分析技术的准确性与可靠性,特别是在应对复杂且多变的呼吸疾病表现时,减少误诊与漏诊的发生。同时,必须加强多中心、大规模的临床验证研究,以确保新兴技术的普遍适用性。更为关键的是,跨学科的合作将成为推动这一领域发展的关键,通过结合人工智能、医学与声学等领域的优势,不断提升技术的可解释性与透明度,确保其能够在临床实践中广泛应用,从而实现“以声音诊疗”的革命性变革,为全球呼吸系统疾病的早期发现与精准治疗开辟更加广阔的前景。综上所述,尽管声学技术与机器学习的结合展现了巨大的医疗潜力,但只有通过持续的技术创新与跨学科的深度融合,才能突破临床实践中的壁垒,提升全球呼吸系统疾病管理的整体水平,并最终实现更加精准和个性化的治疗方案。
参考文献(略)
作者:陈一冰 李靖 解立新;第一作者单位:解放军总医院第一医学中心呼吸与危重症医学科;通信作者:解立新,解放军总医院第八医学中心呼吸与危重症医学部
引用本文: 陈一冰, 李靖, 解立新. 声学技术赋能呼吸病诊疗的挑战与未来[J]. 中华结核和呼吸杂志, 2025, 48(6): 512-518. DOI: 10.3760/cma.j.cn112147-20250108-00022.
本文转载自订阅号「中华结核和呼吸杂志」
* 文章仅供医疗卫生相关从业者阅读参考
本文完
责编:Jerry
