跳转到内容

执行相关问题

Q1:执行超时如何排查?

⚠️ 四大诱因

  1. 进程被杀 --> 资源回收失败
  2. 线程过载 --> CPU使用率>90%
  3. 网络阻塞 --> 采样数据延迟
  4. 配置错误 --> 超时阈值过低

🔍 定位工具

bash
# 查看系统负载  
top -H -p <执行进程PID>  
  
# 检查采样延迟  
cat /opt/AngusTester/data/exec/执行ID/runner.log

Q2:启动失败如何解决?

🚫 三类故障场景

故障类型表现特征解决方案
节点不可用"找不到可用节点"重启执行代理服务(AngusAgent)
代理异常"连接被拒绝"检查端口防火墙设置
脚本错误配置验证失败先运行脚本和场景调试

📍 诊断路径
执行详情页 → 错误日志 → 查看"失败原因码"

Q3:如何实时监控执行状态?

📊 四维监控面板

  1. 执行进度 --> 进度条百分比
  2. 资源消耗 --> CPU/内存曲线
  3. 采样质量 --> 数据点/5秒
  4. 异常告警 --> 实时弹窗

🚨 关键阈值

  • 内存使用>80% → 自动降频采样
  • 进度停滞5分钟 → 暂停执行

Q4:执行卡住如何恢复?

🔄 三级恢复机制

  1. 自动续传:超时30秒无响应自动重启
  2. 手动干预:控制台 → 执行监控 → 强制续传
  3. 日志诊断:查看控制日志分析或导出执行快照分析线程堆栈

💡 预防措施:
开启预检模式提前验证资源可用性

Q5:如何提升执行稳定性?

🛡️ 五维加固方案

优化方向配置建议
资源隔离限制单任务最大线程数
超时策略设置2倍采样间隔时长
心跳检测5秒/次状态上报
资源预留保留20%系统资源

基于 GPL-3.0 许可发布