大学のリサーチ・DAYの締め切りが昨日だった😨
2週間ほど前に、総合内科地方会に出した抄録を出すだけでは履歴書的に何も足しにならない(すぐにでも就活が始まるしできるだけ盛りたい願望あり)
ということで
大学病院で施行された術前心エコーのガイドライン前後で手術当日のキャンセル率がどう変わったか
について解析するプロジェクトのデータ解析をしてみた
手術件数にして10万件以上、一件あたり項目が20個くらいある全ての文字情報を、数字に変換するために(ほぼ全ての情報が取り出し可能な電カルEPICは本当に素晴らしい)
エクセルで計算式を書いて変換していったが
一月に医学部4年生が計算式のプロトタイプを作ってくれていたので
そのおかげでかなり細かい指示が書けるようになった👍
プロトタイプがなければ自分で答えを見つけるのは相当時間かかったはずなので
ファインプレー👏
アウトカム(Dependent Variable)は当日のキャンセル(0か1)なので
Binary logistic regression解析モデルでForward Stepwiseでシンプルに
関連するPredictorsとして
ガイドライン前後(0か1)
そのほか関係しそうなものを諸々入れて
解析したところ
普通にガイドライン前後は統計学的な有意差が出た
しかしR squareが低く(今回の解析モデルはアウトカムを全然予測できていないのだから)、これが低い時は自分は結果を信じられない
とりあえず、Predictorとアウトカムに関係性が認められたが、その関係性はとても弱い
と抄録では型通り報告しておいたが
データ整理の段階で感じた印象とは違う😐
セクションチーフのボスとの定期面談がちょうどあったので
このデータをQuality Improvement的に解析するとどうすれば良いか相談してみた。
P-Chartでやったらどうかと言われ(ボスのコースでやったなぁ、全く覚えていなかったけど)
Youtube見ながらやったら簡単にできた
月単位の時系列でキャンセル率を見ると
ガイドライン発行の2ヶ月くらい前からすでにキャンセル率は減り始めており
発行後も一旦減って、底打ちしてからは、アップダウンで安定しない感じ
全体としてはガイドライン前後でキャンセル率は変わったという表現は一緒でも
データの見方を変えると、おそらくガイドラインが直接の要因ではなかったことが
推察できる(関係はあるのだろうけれど)。
ここら辺がデータ解析の面白さを感じるところである一方
前・後を比較した前向き・後ろ向き解析の危うさを再認識
数百から10万件にもなると入れる項目なんでもかんでも間接的にでも関連して入れば統計学的な有意差が出てしまう。
これを論文化する時は、ちゃんと統計学者にTimeLag解析なりやってもらった方が良さそうだ(これは総合内科のボスが前に指摘してくれていた)
2週間ほど前に、総合内科地方会に出した抄録を出すだけでは履歴書的に何も足しにならない(すぐにでも就活が始まるしできるだけ盛りたい願望あり)
ということで
大学病院で施行された術前心エコーのガイドライン前後で手術当日のキャンセル率がどう変わったか
について解析するプロジェクトのデータ解析をしてみた
手術件数にして10万件以上、一件あたり項目が20個くらいある全ての文字情報を、数字に変換するために(ほぼ全ての情報が取り出し可能な電カルEPICは本当に素晴らしい)
エクセルで計算式を書いて変換していったが
一月に医学部4年生が計算式のプロトタイプを作ってくれていたので
そのおかげでかなり細かい指示が書けるようになった👍
プロトタイプがなければ自分で答えを見つけるのは相当時間かかったはずなので
ファインプレー👏
アウトカム(Dependent Variable)は当日のキャンセル(0か1)なので
Binary logistic regression解析モデルでForward Stepwiseでシンプルに
関連するPredictorsとして
ガイドライン前後(0か1)
そのほか関係しそうなものを諸々入れて
解析したところ
普通にガイドライン前後は統計学的な有意差が出た
しかしR squareが低く(今回の解析モデルはアウトカムを全然予測できていないのだから)、これが低い時は自分は結果を信じられない
とりあえず、Predictorとアウトカムに関係性が認められたが、その関係性はとても弱い
と抄録では型通り報告しておいたが
データ整理の段階で感じた印象とは違う😐
セクションチーフのボスとの定期面談がちょうどあったので
このデータをQuality Improvement的に解析するとどうすれば良いか相談してみた。
P-Chartでやったらどうかと言われ(ボスのコースでやったなぁ、全く覚えていなかったけど)
Youtube見ながらやったら簡単にできた
月単位の時系列でキャンセル率を見ると
ガイドライン発行の2ヶ月くらい前からすでにキャンセル率は減り始めており
発行後も一旦減って、底打ちしてからは、アップダウンで安定しない感じ
全体としてはガイドライン前後でキャンセル率は変わったという表現は一緒でも
データの見方を変えると、おそらくガイドラインが直接の要因ではなかったことが
推察できる(関係はあるのだろうけれど)。
ここら辺がデータ解析の面白さを感じるところである一方
前・後を比較した前向き・後ろ向き解析の危うさを再認識
数百から10万件にもなると入れる項目なんでもかんでも間接的にでも関連して入れば統計学的な有意差が出てしまう。
これを論文化する時は、ちゃんと統計学者にTimeLag解析なりやってもらった方が良さそうだ(これは総合内科のボスが前に指摘してくれていた)
コメント
コメントを投稿