İçeriğe geç

Kurulum ve Dağıtım

Bu bölüm BT yöneticileri için “5 dakikada fizibilite” hedefiyle yazılmıştır.

  • Ayrık çalışma katmanı (halka açık web ve klinik uygulama ayrımı)
  • PostgreSQL + pgvector
  • Redis + kuyruk işçileri
  • OCR + gömme + LLM sağlayıcı bağlantısı
KatmanvCPURAMNot
Web çalışma katmanı24 GBDüşük-orta trafik pilot
İşçi çalışma katmanı24 GBOCR ve gömme yüküne göre artar
PostgreSQL28 GBpgvector sorguları için disk IOPS kritik
Redis12 GBKuyruk derinliği ve ani yük izlenmeli

Gerçek kapasite hastane veri hacmine göre değişir. Pilot aşamada aşağıdaki metrikler ölçülmelidir:

  • Saatlik doküman içe alma adedi
  • Ortalama sorgu gecikmesi
  • Eşzamanlı operatör sayısı
SenaryoÖnerilen yolNot
Hızlı pilotYönetilen sağlayıcıHızlı kurulum, yönetişim onayları gerekli
Veri egemenliği ağırlıklıYerinde model servisiOperasyonel bakım sorumluluğu artar
Ağdan yalıtılmış koşulYerel model yığınıPerformans/tuning için ek kapasite gerekir

Ağdan yalıtılmış kurulumda sağlayıcı seçimi ve model dağıtım politikaları dağıtım öncesi netleştirilmelidir.

Yedekleme ve geri dönüş planı için /docs/deployment/backup-and-recovery/ sayfasını zorunlu referans olarak kullanın.