본 논문은 거짓 데이터 주입 및 서비스 거부 공격과 같은 사이버 공격 환경에서 비선형 시스템에 대한 모델 프리 제어기의 성능을 비교 분석했어요. 정확도, 비용, 강건성을 위해 4가지 강화 학습 보상 방식을 분석한 결과, 리아푸노프 보상이 낮은 추적 오차와 함께 최상의 강건성을 제공하는 것으로 나타났어요. 지수 모드 또한 적절한 훈련 조건에서 좋은 균형을 제공하며, 점진적 및 선형 보상은 더 빠르게 수렴하지만 강건성이 떨어지는 것으로 확인됐어요.