Reliability Engineering入門:施設の保全を「壊れたら直す」から「壊れる前に知る」へ

はじめに:「なぜ、いつも金曜の夜に壊れるのか」
製薬施設のエンジニアなら、一度はこう思ったことがあるはずです。
金曜日の夕方、週末の生産計画を確認し、「今週も無事に終わりそうだ」と安堵した瞬間、保全担当者から連絡が入る。
「チラーが停止しました。クリーンルームの温度が上昇しています」
そこからの展開は、経験者なら想像がつくでしょう。緊急対応チームの招集、メーカーへの夜間対応依頼、代替冷却手段の検討、環境モニタリングの強化、逸脱報告書の作成、製造への影響評価——週末は消えます。
そして月曜日の朝、報告書を書きながら思うのです。「なぜ事前に兆候を掴めなかったのか」と。
答えはシンプルです。兆候が無かったのではありません。兆候を“拾う仕組み”と、“判断に変える仕組み”が無かっただけです。
今日は、製薬施設における保全の進化——「壊れたら直す」から「壊れる前に知る」への転換を、実務者の視点で整理します。
結論(先に3行)
- 突発故障の約60〜70%は、振動・温度・電流などの基礎データで事前に兆候を捉えることが可能です。
- 状態基準保全(CBM)を導入した現場では、ダウンタイムが20〜30%改善した事例もあります。
- 振動計1台と記録の仕組みがあれば、重要設備の上位20%からすぐに始められます。
FMEAの基礎:3つの問いで「壊れ方」を洗い出す
FMEAはコンポーネントごとに、次を整理します。
- どう壊れるか(故障モード)
- 壊れたら何が起きるか(影響)
- どれくらい危ないか(優先度)
製薬施設の保全が抱える構造的な問題
多くの製薬施設では、TBM(Time-Based Maintenance:時間基準保全)が中心です。
メーカー推奨や社内基準に基づき、「○ヶ月ごとに交換」「○年ごとにオーバーホール」という計画を立て、実行する方式です。
TBMは“最低限の再現性”を作るには有効ですが、次の限界が出ます。
- 過剰保全と過少保全が同時に起きる同じ型式でも運転時間・負荷・環境が違えば劣化速度は変わります。TBMはそれを吸収できず、まだ使える部品を捨てる一方で、厳しい条件の設備は予定前に限界を迎えることがあります。
- 計画外の異常には弱い異物噛み込み、絶縁劣化、制御部品の突然故障など、“時間で予測しにくい”要因は一定数あります。TBMだけでは「兆候を拾って先回りする」設計になりにくい。
- コスト最適化が難しい早すぎる交換(部品・工数)と、遅すぎる交換(突発停止・逸脱・緊急対応)のバランスを、本当の意味で最適化するには“状態データ”が必要になります。
Reliability Engineeringとは何か
Reliability Engineering(信頼性工学)は、設備やシステムが「必要な機能を、必要な期間、必要な条件で」果たす確度を高めるための体系です。
本質は、次の一文に集約できます。
「状態を知り、最適なタイミングで最適な処置をする」
保全の進化:4つのレベル
レベル1:事後保全(Reactive)
壊れてから直す。突発対応・逸脱対応の負担が大きくなりやすい。
レベル2:予防保全(Preventive / TBM)
定期交換で安定性は上がるが、最適化には限界がある。
レベル3:状態基準保全(CBM:Condition-Based)
振動、温度、差圧、電流などの状態指標を見て、タイミングを判断する。
レベル4:予知保全(PdM:Predictive)
トレンドやモデルで残存寿命(どれくらい先まで持つか)を推定し、計画停止・在庫・工数まで最適化する。
製薬施設では、まずCBMを基盤にし、重要設備だけPdMへ拡張するのが現実的です。全設備PdMは投資過多になりやすい一方、TBMのみでは“計画外の痛み”が残ります。
CBM実践:何を、どう測るか(代表例)
ここでは“万能解”ではなく、現場で始めやすい代表例を示します。設備仕様・運転条件により、測るべき指標は調整してください。
AHU(空調機)
・ファン振動:ベアリング劣化の代表指標
・フィルター差圧:目詰まりの進行
・モーター電流:負荷変化の兆候
・コイル入出口温度差:熱交換性能劣化の兆候
チラー
・吸入/吐出圧力、温度:冷媒系・熱交換器の異常兆候
・振動:圧縮機の状態把握
・オイル分析(可能なら):摩耗・劣化兆候
・COPなど効率トレンド:システム劣化の早期検知
ポンプ
・振動:ベアリング、キャビテーション、アンバランス
・吐出圧力・流量:性能劣化
・シール部漏れ:日常点検で拾える“早い兆候”
・モーター温度:過負荷・劣化の兆候
用水(PW/WFIなど)
・差圧(膜・フィルター):ファウリング兆候
・導電率・TOCのトレンド:劣化・汚染兆候(設計・規格に沿って運用)
CBM導入ステップ:小さく始めて確実に成果を出す
フェーズ1:重要設備を決める(目安1ヶ月)
故障影響度/頻度/復旧時間/GMP影響の4軸でスコアリングし、上位から着手。
フェーズ2:ベースラインを取る(目安2–3ヶ月)
“正常時の数値”を押さえる。最初は月1回測定+Excelで十分です。
フェーズ3:トレンドを見る(目安3–6ヶ月)
増加傾向、急変、季節変動を区別しながら、注意・要対応のルールを決めます。
(例:ベースライン比で注意域/対応域を設定。ただし閾値は設備ごとに最適化)
フェーズ4:TBMを見直す(目安6ヶ月以降)
“全台一律交換”から“個別判断”へ。延長する台と前倒しする台を分ける。
フェーズ5:PdMへ拡張(目安1年以降)
残存寿命推定、計画停止への織り込み、在庫最適化へ進める。
GMP環境での注意点(要点)
・保全戦略の変更は、原則として手順変更(SOP)に関わるためChange Controlが必要になることが多い。
・測定器の管理は“目的に応じて”。品質に直接影響するGMP計器とは区別しつつも、測定値の信頼性を担保する運用(点検・校正・トレーサビリティ)は必要。
・データは「いつ/誰が/どこで/どう測ったか」が追跡できる形が望ましい(ALCOA+の考え方は参考になる)。
ROIについて:断定ではなく「試算の型」を持つ
CBM/PdMの効果は、設備の重要度、故障頻度、停止損失の大きさで大きく変わります。従って「必ず何%削減」と断定するより、次の“試算の型”で社内合意を作るのが現実的です。
・突発停止の年間件数 × 1件当たりの総コスト(修理+緊急対応+逸脱対応+生産影響)
・過剰交換の年間コスト(部品+工数)
・導入コスト(測定器+教育+工数)
この3点を置けば、施設ごとの“納得感あるROI”を出せます。
まとめ:「予測不能」ではなく「予測していなかった」
突発故障の多くは、事前兆候が“どこか”に出ています。
問題は、それを拾い、判断し、計画に落とす仕組みが無いことです。
ポータブル振動計1台、Excel1枚、月に半日の測定。ここから始められます。
今日から始められる3つのアクション
- 過去3年の突発故障を棚卸しする(設備・原因・影響・コスト)
- 重要設備を3つだけ選び、ベースライン測定を始める
- 1ヶ月後に同じ点で再測定し、変化を“見える化”する
著者について
ダリウシ ロスタミ | イーテック合同会社 代表
製薬・食品業界で35年のオペレーショナルエンジニアリング経験を持つ。
主な経験:
- エンジニアリング部門のリーダーとして、新規施設立ち上げプロジェクトを統括
- バリデーション(IQ/OQ/PQ)、コミッショニングの管理体制構築と技術サポート
- Reliability Engineeringプログラムの導入と運用体制の確立
- エネルギー最適化戦略の策定とクロスファンクショナルチームのマネジメント
- GMP環境での変更管理・逸脱管理システムの構築
専門分野: エネルギー最適化、GMPコンプライアンス、バリデーション、Reliability Engineering、設備投資計画、工場レイアウト設計、プロセス改善、組織マネジメント
現在は東京を拠点に、製薬施設を中心とした包括的なエンジニアリングコンサルティングを提供。「技術と人をつなぐ」ことをモットーに、持続可能な改善と組織づくりを支援している。
お問い合わせ: 工場の省エネとコミュニケーション改善についてのご相談は、こちらからお気軽にどうぞ。初回相談(30分)は無料です。

