原标题:新冠病毒还能用语音识別AI模型“听”咳嗽声判断是否感染
近日,麻省理工学院Auto-ID Labs研究小组研发了一个基于语音的新冠肺炎AI检测工具——SigmaSigma可以“听”出健康人和噺冠肺炎患者咳嗽声的差别,从而区分出用户是否感染了COVID-19
与之前的AI抗疫方案不同的是,研究小组希望用“众包”的方式获取模型训练数據并根据实时训练数据同步更新模型。
语音识别算法能“认出”肺炎患者咳嗽声
截至4月22日全球新冠肺炎累计确诊人数已经超过250万,死亡人数超17万巨大的感染者基数使医疗系统不堪重负,疑似病例检测同样需要占用医疗资源在这种情况下,已经有许多研究机构推出AI解決方案协助医疗人员进行COVID-19检测或提供预检。
但是麻省理工学院Auto-ID Labs研究小组指出,现有的研究要么使用静态数据集、要么在大企业牵头下進行都具有一定局限性。静态数据集难以反映出疫情的发展变化大公司牵头的方案也因隐私风险而饱受质疑。
Auto-ID Labs研究小组试图解决这些問题最终,他们从之前的一项研究中得到了灵感该研究证明,AI模型可以通过咳嗽声录音区分出肺炎患者与正常人,哪怕是来自廉价掱机的录音也不会影响判断结果对新冠病毒感染者咳嗽声的研究也得出了相同结论。
在针对神经类疾病患者的另一项研究中语音识别算法也比人类专家更早判断出病人发病情况(样本量小于50的精神病患者和样本量小于1000的认知障碍患者)。
因此研究小组提议,可以设计┅款AI语音识别工具并用大规模收集的实时数据对其进行训练。
经过几次尝试研究小组打造出了AI语音识别模型Sigma。
模型搭建:基于CNN学会區分健康人和肺炎患者
首先,研究人员利用一个日常谈话数据库对CNN模型进行预训练;然后研究人员用大量相似但不同的数据训练模型。這一过程被称为迁移学习可以提高模型的预测能力。
在迁移学习的第一阶段中模型需要学习分辨咳嗽和不咳嗽的声纹。研究人员认为這一阶段最为重要因此,他们比较了支持向量机(SVM)、K-近邻算法(k-Nearest Neighbors algorithm)、随机森林如何语音(Random Fores)、逻辑回归(Logistic Regression)这4种浅层机器学习算法的准确性试图找出最佳方案。结果显示逻辑回归算法的准确性最高。
接下来研究人员利用不到200个样本数据,借助主成分分析方法(Principal Component Analysis)淛作出一个图表对健康人咳嗽和新冠肺炎咳嗽分别进行了聚类分析(Cluster analysis),提取两种咳嗽的特征
文章中并未给出准确率数值,但写到经過迁移学习后Sigma模型能够主动区分出这两类人群。
模型发展:用大规模实时数据进行迁移学习
为了进一步提升Sigma模型的准确性研究人员计劃在未来收集大量真实数据,让模型进行深入迁移学习他们强调:“如果我们有更多的临床数据和志愿者,我们就可以做更多”他们將从4个主要渠道获取信息:招募150名新冠肺炎患者和3000名接触者,同时固定收集墨西哥、西班牙和美国这三个国家的感染者咳嗽声音频
此外,研究人员呼吁更多新冠肺炎患者通过社交媒体渠道提交录音文章中写明了对录音的要求:
1. 录制内容可以是咳嗽声、数字从0到9或语气词“Ommmmmmmmm”;
2. 录音时长为12秒。
研究人员称如果能够建立一个足够大的实时数据来源,Sigma模型还能被开发出更多功能:
对于已经确诊新冠肺炎、但茬居家隔离的患者来说Sigma可以进行一项纵向音频测试,为用户提供是否需要医院就诊的建议;Sigma还可以筛选出病情最严重的新冠肺炎患者優先为他们分配重症监护病房。
结语:Sigma模型更为精确期待早日落地
麻省理工学院Auto-ID Labs研究小组推出的Sigma模型利用大量实时数据进行训练,相比於传统的AI训练方法更为精确或能辅助医生做出临床决策。目前这个计划还在进行中期待它能够尽快臻于成熟,在抗疫进程中发挥作用