主播
节目简介
来源:小宇宙
一项发表于《JAMA Network Open》的最新研究提出了一个值得关注的问题:作为精神疾病诊断核心工具的“诊断访谈”,其可靠性可能并不像许多人想象的那么高,而且不同疾病之间差异明显。
精神疾病是如何诊断出来的?
与高血压可以测血压、糖尿病可以测血糖不同,大多数精神疾病至今仍缺乏明确的实验室检测指标。
因此,临床医生主要依靠诊断访谈(Diagnostic Interview)进行评估。
所谓诊断访谈,是指医生或经过培训的访谈员按照一套标准化问题,与患者进行面对面交流,了解其症状、持续时间、严重程度以及对生活造成的影响,再依据现行诊断标准作出判断。
几十年来,这种方法一直被视为精神疾病诊断和研究的“黄金标准”。
但加拿大麦克马斯特大学精神病学教授劳拉·邓肯(Laura Duncan)指出,诊断访谈虽然是目前最好的工具,却未必是一个足够可靠的工具。
同一个人,两次访谈结果会一致吗?
研究团队关注的是一个重要指标——重测信度(test-retest reliability)。
简单来说,就是同一个人在不同时间接受同一套诊断访谈时,是否能够得到相同的诊断结果。
如果一种诊断工具足够可靠,那么两次评估的结果应该高度一致;如果一致性较低,则意味着诊断结果可能受到访谈过程、提问方式、患者状态变化等因素影响。
研究人员系统梳理了2024年2月至2025年9月期间发表的相关研究,并汇总分析了各种精神疾病诊断访谈的重测信度数据。
他们采用了一项常见统计指标——科恩卡帕系数(Cohen's Kappa)。
这一指标能够排除“碰巧一致”的情况,更准确地衡量两次评估结果的一致程度。卡帕值越高,说明诊断结果越稳定;越低,则说明结果波动越大。
物质滥用障碍的诊断最稳定
研究发现,不同精神疾病的诊断可靠性存在明显差异。
总体而言,物质使用障碍(Substance Use Disorder)的诊断可靠性最高,其中阿片类药物使用障碍表现尤其突出。
这类疾病往往依赖较为客观的行为指标。例如,一个人一周喝多少酒、是否频繁使用某种药物、是否出现戒断反应等,都相对容易记录和核实。
相比之下,抑郁、焦虑等疾病更多依赖患者对内心体验的描述。
例如,“最近两周有多少天感到情绪低落”“焦虑程度达到什么水平”等问题,本身就带有较强的主观性,不同时间、不同情境下的回答可能并不完全一致。
不同访谈方式,结果可能不同
不过,这项研究也引发了学界争议。
哥伦比亚大学精神病学教授、精神疾病诊断访谈工具SCID的主要编制者迈克尔·弗斯特(Michael First)认为,研究虽然指出了诊断可靠性的差异,但没有充分区分不同访谈工具之间的差别。
研究涉及的工具包括:
《精神疾病诊断与统计手册》第五版结构式临床访谈(SCID);
简易国际神经精神访谈量表(MINI);
创伤后应激障碍临床访谈量表(CAPS)等。
弗斯特认为,更重要的问题是:究竟哪些工具更可靠?
如果无法回答这个问题,那么研究对临床实践的指导意义会受到限制。
全结构化访谈与半结构化访谈
争议的核心之一,在于研究将两种不同访谈模式放在一起分析。
第一种是全结构化访谈(fully structured interview)。
这种访谈要求访谈员严格按照预设问题逐项提问,不允许临时调整内容,也不能根据回答追问。
即使受访者前后说法不一致,访谈员通常也不能主动质疑或澄清。
它的优点是标准化程度高,不同访谈员之间差异较小,因此更容易获得一致结果。这类工具常用于大规模流行病学调查。
第二种是半结构化访谈(semi-structured interview)。
这种方式主要供专业临床医生使用。医生除了按照标准问题提问外,还可以根据患者情况进一步追问、核实和澄清信息。
这种灵活性有助于提高诊断准确性,但也可能导致不同访谈之间出现更多差异,从而降低重测一致性。
换句话说,前一种工具可能看起来“更稳定”,却未必“更准确”;后一种工具可能结果波动更大,却能更深入地了解患者真实状况。
该研究未区分“全结构化”与“半结构化”访谈,存在不足。
精神疾病诊断还缺少“验血指标”
即便是SCID的设计者弗斯特本人,也并不认为结构式访谈是理想方案。
他表示,几十年来,精神医学界一直期待能够像其他医学专科一样,通过客观生物指标来辅助甚至完成诊断。
例如,通过血液检测、脑影像学检查或遗传学标志物,判断一个人是否患有某种精神疾病。
然而,这一期待至今仍未实现。
正如弗斯特所说:
“这个愿景,我们已经期盼了整整50年。”
或许该放弃“有病或没病”的二分法
除了寻找更客观的检测手段,本研究作者还提出了另一种思路。
她认为,未来精神健康评估或许不应局限于“患病”与“未患病”的二元分类。
现实中的心理问题往往并非泾渭分明。很多人的症状介于健康与疾病之间,严重程度也会随着时间不断变化。
因此,与其简单地给出一个“有”或“没有”的诊断标签,不如从症状的连续谱系出发,评估个体当前所处的位置以及受到影响的程度。
事实上,这种“谱系化”(spectrum)思维已经越来越多地出现在精神医学研究之中。
这项新研究并不意味着精神疾病诊断失去了价值。相反,它提醒我们:当前的诊断工具仍有局限,诊断结果并非绝对客观的“标准答案”。
对于患者而言,诊断应被看作理解自身问题和制定治疗方案的起点,而不是一个永远固定不变的标签。随着研究不断推进,未来的精神疾病评估方式,或许会比今天更加精准,也更加贴近人类心理活动本身的复杂性。
精神疾病是如何诊断出来的?
与高血压可以测血压、糖尿病可以测血糖不同,大多数精神疾病至今仍缺乏明确的实验室检测指标。
因此,临床医生主要依靠诊断访谈(Diagnostic Interview)进行评估。
所谓诊断访谈,是指医生或经过培训的访谈员按照一套标准化问题,与患者进行面对面交流,了解其症状、持续时间、严重程度以及对生活造成的影响,再依据现行诊断标准作出判断。
几十年来,这种方法一直被视为精神疾病诊断和研究的“黄金标准”。
但加拿大麦克马斯特大学精神病学教授劳拉·邓肯(Laura Duncan)指出,诊断访谈虽然是目前最好的工具,却未必是一个足够可靠的工具。
同一个人,两次访谈结果会一致吗?
研究团队关注的是一个重要指标——重测信度(test-retest reliability)。
简单来说,就是同一个人在不同时间接受同一套诊断访谈时,是否能够得到相同的诊断结果。
如果一种诊断工具足够可靠,那么两次评估的结果应该高度一致;如果一致性较低,则意味着诊断结果可能受到访谈过程、提问方式、患者状态变化等因素影响。
研究人员系统梳理了2024年2月至2025年9月期间发表的相关研究,并汇总分析了各种精神疾病诊断访谈的重测信度数据。
他们采用了一项常见统计指标——科恩卡帕系数(Cohen's Kappa)。
这一指标能够排除“碰巧一致”的情况,更准确地衡量两次评估结果的一致程度。卡帕值越高,说明诊断结果越稳定;越低,则说明结果波动越大。
物质滥用障碍的诊断最稳定
研究发现,不同精神疾病的诊断可靠性存在明显差异。
总体而言,物质使用障碍(Substance Use Disorder)的诊断可靠性最高,其中阿片类药物使用障碍表现尤其突出。
这类疾病往往依赖较为客观的行为指标。例如,一个人一周喝多少酒、是否频繁使用某种药物、是否出现戒断反应等,都相对容易记录和核实。
相比之下,抑郁、焦虑等疾病更多依赖患者对内心体验的描述。
例如,“最近两周有多少天感到情绪低落”“焦虑程度达到什么水平”等问题,本身就带有较强的主观性,不同时间、不同情境下的回答可能并不完全一致。
不同访谈方式,结果可能不同
不过,这项研究也引发了学界争议。
哥伦比亚大学精神病学教授、精神疾病诊断访谈工具SCID的主要编制者迈克尔·弗斯特(Michael First)认为,研究虽然指出了诊断可靠性的差异,但没有充分区分不同访谈工具之间的差别。
研究涉及的工具包括:
《精神疾病诊断与统计手册》第五版结构式临床访谈(SCID);
简易国际神经精神访谈量表(MINI);
创伤后应激障碍临床访谈量表(CAPS)等。
弗斯特认为,更重要的问题是:究竟哪些工具更可靠?
如果无法回答这个问题,那么研究对临床实践的指导意义会受到限制。
全结构化访谈与半结构化访谈
争议的核心之一,在于研究将两种不同访谈模式放在一起分析。
第一种是全结构化访谈(fully structured interview)。
这种访谈要求访谈员严格按照预设问题逐项提问,不允许临时调整内容,也不能根据回答追问。
即使受访者前后说法不一致,访谈员通常也不能主动质疑或澄清。
它的优点是标准化程度高,不同访谈员之间差异较小,因此更容易获得一致结果。这类工具常用于大规模流行病学调查。
第二种是半结构化访谈(semi-structured interview)。
这种方式主要供专业临床医生使用。医生除了按照标准问题提问外,还可以根据患者情况进一步追问、核实和澄清信息。
这种灵活性有助于提高诊断准确性,但也可能导致不同访谈之间出现更多差异,从而降低重测一致性。
换句话说,前一种工具可能看起来“更稳定”,却未必“更准确”;后一种工具可能结果波动更大,却能更深入地了解患者真实状况。
该研究未区分“全结构化”与“半结构化”访谈,存在不足。
精神疾病诊断还缺少“验血指标”
即便是SCID的设计者弗斯特本人,也并不认为结构式访谈是理想方案。
他表示,几十年来,精神医学界一直期待能够像其他医学专科一样,通过客观生物指标来辅助甚至完成诊断。
例如,通过血液检测、脑影像学检查或遗传学标志物,判断一个人是否患有某种精神疾病。
然而,这一期待至今仍未实现。
正如弗斯特所说:
“这个愿景,我们已经期盼了整整50年。”
或许该放弃“有病或没病”的二分法
除了寻找更客观的检测手段,本研究作者还提出了另一种思路。
她认为,未来精神健康评估或许不应局限于“患病”与“未患病”的二元分类。
现实中的心理问题往往并非泾渭分明。很多人的症状介于健康与疾病之间,严重程度也会随着时间不断变化。
因此,与其简单地给出一个“有”或“没有”的诊断标签,不如从症状的连续谱系出发,评估个体当前所处的位置以及受到影响的程度。
事实上,这种“谱系化”(spectrum)思维已经越来越多地出现在精神医学研究之中。
这项新研究并不意味着精神疾病诊断失去了价值。相反,它提醒我们:当前的诊断工具仍有局限,诊断结果并非绝对客观的“标准答案”。
对于患者而言,诊断应被看作理解自身问题和制定治疗方案的起点,而不是一个永远固定不变的标签。随着研究不断推进,未来的精神疾病评估方式,或许会比今天更加精准,也更加贴近人类心理活动本身的复杂性。