片手間(⁉️)にやっているリサーチで
10万件を超える患者データを扱っている
全ての情報を電子カルテなり、その他巨大なデータベースから
自動的に引っ張ってくることになるが
取りたい情報をどう定義するかがとても重要
例えば術後の心臓発作のリスク分類に使うRCRIは
よく過去のリサーチで使われてきたが
大きなデータベースにRCRIがレポートされているはずはない
つまり、RCRIの各項目を一つ一つ抜き出す必要がある
例えば一つの項目である、腎不全もしくは検査値(Cr)の値が2以上などは
ICD-9やICD-10コードと検査値を両方抜いてきて定義するのか
では、どのICDコードを使うのか
母体のデータベースにCrの値がなかったらそもそもどうするか
など、いちいち過去の論文やら文献の情報をひたすら探すのと
データベースの特徴(検査値がないものも多数あり)
Cr値がその入院中になければ、じゃぁ1年以内のものを使うのか
それとも1ヶ月以内か2年以内か
1ヶ月以内ならMissing dataが増えるだろうし、
2年以内とかすると信頼性に乏しいか?でもMissing dataよりはまし?とか
(実際2年以内の最寄りのCrで検索してもらったら、あまりに一件あたりの処理量が多くなって、10万以上の患者を処理するのに相当な時間がかかるから1年以内でやったら相当な時間短縮になったとか)
特に電子カルテから引き抜く時は
データ担当の人が書いた検索プログラムが
本当に狙ったものを正確に引き抜いてくれているか
にも注意せねばならず
なんども話し合いながら結構二人で頑張った。
しかし、どうしてもハイリスク手術のICDコードもしくはCPTコードだけは
自分たちでリストを作成する他なかった
過去のどの論文を見ても、こうやりました
とは報告してあっても、なぜかICDかCPTのリストが提供されていない
結構散々調べたので90%以上断言できるが
Largeデータ解析でRCRIを使用している場合の
ハイリスク手術のデータの抜き方は
絶対に研究によってバラバラ(つまりそこに科学的信頼性はない)
しかも、本来の定義として、腹腔内(Intra-peritoneal)、胸腔内(Intra-Thoracic)、鼠径より上の血管(Supra-inguinalVascular)手術とするはずのところを
研究によっては
腹部(abdominal)・胸腔(Thoracic)・血管(Vascular)手術(非心臓手術において)
と定義してあるような拙いものも普通にあり(「内」と「鼠径上部」とかないだけで分類が一気に簡単になる)
そういうものがまともな雑誌に通っているから
ある意味驚きでもある
幸い、周術期科に経験のある人がいたので聞いたが
やはり、参考にできる資料はあっても
これというリストはないので
最終的には自分たちでリストを作ったらしい(そして彼は責任著者ではないので、そのリストがどれだけ正確かも知らない。知らない方が幸せだろう。)
解析はもう自分でやり終えて
(あっていれば)しょぼいなりに有意な結果は出ているので
あとは統計の人に彼らのやり方でやってもらうだけ
コメント
コメントを投稿