タイトル
“A machine-learning algorithm for neonatal seizure recognition: a multicentre, randomised, controlled trial.”
Pavel, Andreea M., et al. The Lancet Child & Adolescent Health (2020).
原文はこちら
論文を一言でまとめると
診断アルゴリズムを利用した方が従来のEEGと比較し新生児発作の検出率が優るわけではなかったが、発作時間の識別率が向上した。
Methods
[場所/施設]
アイルランド、オランダ、スウェーデン、英国にある8箇所のNICU
[Patients]
対象施設に入院している修正36-44週の新生児のうち、発作が目撃されたあるいは発作の発症リスクが高いという理由でEEGモニタリングを要している新生児
[Intervention]
新生児発作識別アルゴリズム(ANSeR)と呼ばれるソフトウェアを用いて脳波モニタリングを行った。
[Comparison]
脳波モニタリングのみ
[Outcome]
※具体的には、感度(発作を認めた新生児のうち正しく臨床診断した割合)、特異度(発作を認めなかった新生児のうち正しく臨床診断した割合)、誤検出率(脳波で確認されなかった新生児のうち発作を認めたと診断された新生児の割合)
[Definition]
2人の医師が脳波から発作ありと認識した時間が30秒以上一致した発作が1つでもあった場合に、脳波上で新生児発作ありと診断した。
[デザイン]
ランダム化比較試験
※研究者、臨床診断する医師、被験者の家族は割り付けを知っている。神経生理学者と生物統計学者はマスクされている。
結果まとめ
・ランダム化割り付けをうけた対象者は264人で、モニタリング時間が2時間未満などの除外があり、解析対象者は258人であった(介入群128人vs対照群130人)。修正週数の中央値は40週(四分位範囲修正39-41週)、Apgarスコア5分値の中央値は6(四分位範囲4-9)だった。低酸素性虚血性脳症と診断された新生児は介入群で74人/128人、対照群で56人/130人だった。開始時の中央値は介入群で生後32.1時間(四分位範囲13.6-61.3時間)、対照群で生後28.0時間(四分位範囲14.0-68.8時間)だった。
・脳波で発作性変化を認めた新生児は介入群で32人/128人(25%)、対照群で38人/130人(29.2%)でほとんど差がなかった。
・感度は介入群81.3% (95%CI 66.7-93.3) vs 対照群89.5% (95%CI 78.4-97.5)、特異度は介入群84.4% (95%CI 76.9-91.0) vs 対照群89.1% (95%CI 82.5-94.7)、誤検出率は介入群36.6%(95%CI 22.7-52.1) vs 対照群22.% (95%CI 11.6-35.9)だった。絶対差は感度が-8.2%(95%CI -25.0-7.7%)、特異度が-4.8%(95%CI -14.1-4.6%)、誤検出率が13.9%(95%CI -5.2-32.7%)でいずれも有意差はなかった。
・脳波で発作性変化を認めた合計時間は介入群で268時間、対照群で391時間だった。発作時間と診断された時間の割合は介入群で177時間/268時間(66.0%)、対照群で177時間/391時間(45.3%)であり、絶対差は20.8% (95%CI 3.6-37.1)で有意差を認めた。
・新生児発作がなかったにも関わらず少なくとも1種類の抗けいれん薬を処方された新生児は介入群で10人/96人(10.4%)、対照群で4人/92人(4.3%)、絶対差は6.1% (95%CI -0.3-13.5%)で有意差はなかった。
・以上より、筆者らはANSeRにより新生児発作の診断率は上昇しなかったものの発作時間の認識率は向上した、と結論付けている。
[Limitation]
・2人の医師で30秒以上一致したもののみを新生児発作と診断したため、30秒以下の発作は含まれていない。
・発作をみるのではなく発作時間を用いて解析したため、実用本位になってしまった。
・NICUがあわただしい環境であるため、認識された新生児発作の全てが記録されているわけではない可能性がある。
[読んだ感想]
・機械学習による診断アルゴリズムだけ、と通常の脳波モニタリングで非劣性であれば臨床的価値が高いですが、この論文では追加してもあまり意味なかったという結果でした。
・発作時間を捉えられている割合が高くなったとのことだが、この計算の分母と分子の意味が詳しく説明されておらず、本当に価値があるのか不明だった。