我们的工作试图利用因果结构图对不同症状和疾病因子进行分析 , 再结合潜在结果框架去消除这两类偏差 , 最终实现无偏 , 可解释的医疗自动诊断 。 受到潜在结果模型技术的倾向评分匹配启发 , 我们首先提出基于倾向分数的患者模拟器 , 其目的是取代受到数据偏见影响的观察数据患者模拟器 , 通过从其他记录中提取知识来有效回答未记录的询问(图 - 16 的左边子图) 。 更具体地说 , 我们的方法首先通过因果结构图去判定出每次询问过程中的哪些因素是对撞因子 , 接着基于每个观测数据中被询问的症状和疾病的关系 , 用倾向性评分匹配策略去计算每个记录的倾向性评分并聚类不同的询问记录 。 那么对于每个观测记录中不存在的症状询问 , 我们都可以通过其聚类的其他观测记录去寻找类似的答案 , 其询问结果满足潜在结果框架下的无偏估计 。 不但如此 , 这个方法可以被用于所有基于交互的自动问诊代理模型的训练中 , 让其克服由于交互方式不当造成的问诊答案偏差 。 另外 , 为了克服分布查询偏差 , 我们在利用基于倾向分数的患者模拟器同时 , 提出了一种渐进式代理网络模型 , 把策略分解为症状查询和疾病诊断的两部分(图 - 16 的右边子图) 。 询问过程由诊断过程以自上而下的方式驱动 , 以询问症状对患者的未知方面进行干预 。 其干预结果可以进一步推断多个在未来可能会产生的交互情景 。 基于交互对不同的未来发展轨迹进行聚类 , 我们可以依据不同的聚类结果对应到不同的疾病判断中 。 因此每个完成交互后的轨迹 , 并将对应不同的疾病诊断 , 而最大化不同聚类簇之间的距离 , 则能够增强结束对话时候的疾病诊断置信度 。 该诊断过程实际上可以被看作是到神经科学里面的发散模型:在心理和概率上描绘患者 , 并通过干预想象的问题(例如“如果患者咳嗽怎么办?”)在该心理表征中进一步解释原因 , 具有现有疾病诊断智能体不能比拟的可解释能力 。 通过上述干预 , 我们提出的代理能够根据症状的存在与否进行诊断 , 以消除分布询问偏差 。
文章图片
图 17. 基于因果推理医疗自动诊断的具体实现框架 。
我们采纳了两个真实场景下采样的数据集对我们的工作进行评测 。 对于倾向分数的患者模拟器 , 由于真实场景的测试数据也是观测数据 , 我们基于反事实推断衍生的评价标注去衡量其是否能够有效实现反事实推断 。 另外再引入症状密度(symptom density)去测量我们的模拟器是否可以避免陷入回答 “不知道” 这些无意义的回答中 。 最后 , 我们雇佣了一部分来自中山医学院的学生去评价不同智能体代理的疾病诊断效果 。 我们的实验结果表明了现有基于观测数据进行交互训练的智能体 , 其诊断结果极容易受到现存交互记录数据影响 , 难以训练出在真实场景下可靠的问诊模型 。 而我们提出的患者模拟器则能够比较好地适应这种变化 。 同时 , 不论是基于观测测试数据的准确率还是专业人员评价 , 我们的代理策略模型也体现出了更优秀的疾病诊断效果 。
总结
我们从计算机视觉作为切入点 , 见证了人工智能从 David Marr 朴素的视觉理解概念开始 , 一路到今天以深度神经网络模型和表达学习为研究轴心的蓬勃发展 。 同时 , 我们也发现了该路线渐渐走到了奇点 。 不同于一些学派认为表达学习难以学习高层认知 , 我们主张目前的表达学习应该结合知识推理和因果模型去实现下一阶段的技术飞跃:因为知识推理可以实现从人类知识到机器认知的一致迁移 , 而因果模型则为理解机器推理提供严谨的技术手段 。 我们实验室关于知识推理和因果模型的一系列工作也从侧面验证了我们的观点 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
