执行相关问题
Q1:执行超时如何排查?
⚠️ 四大诱因:
- 进程被杀 --> 资源回收失败
- 线程过载 --> CPU使用率>90%
- 网络阻塞 --> 采样数据延迟
- 配置错误 --> 超时阈值过低
🔍 定位工具:
bash# 查看系统负载 top -H -p <执行进程PID> # 检查采样延迟 cat /opt/AngusTester/data/exec/执行ID/runner.log
Q2:启动失败如何解决?
🚫 三类故障场景:
故障类型 表现特征 解决方案 节点不可用 "找不到可用节点" 重启执行代理服务(AngusAgent) 代理异常 "连接被拒绝" 检查端口防火墙设置 脚本错误 配置验证失败 先运行脚本和场景调试
📍 诊断路径:
执行详情页 → 错误日志 → 查看"失败原因码"
Q3:如何实时监控执行状态?
📊 四维监控面板:
- 执行进度 --> 进度条百分比
- 资源消耗 --> CPU/内存曲线
- 采样质量 --> 数据点/5秒
- 异常告警 --> 实时弹窗
🚨 关键阈值:
- 内存使用>80% → 自动降频采样
- 进度停滞5分钟 → 暂停执行
Q4:执行卡住如何恢复?
🔄 三级恢复机制:
- 自动续传:超时30秒无响应自动重启
- 手动干预:控制台 → 执行监控 → 强制续传
- 日志诊断:查看控制日志分析或导出执行快照分析线程堆栈
💡 预防措施:
开启预检模式
提前验证资源可用性
Q5:如何提升执行稳定性?
🛡️ 五维加固方案:
优化方向 配置建议 资源隔离 限制单任务最大线程数 超时策略 设置2倍采样间隔时长 心跳检测 5秒/次状态上报 资源预留 保留20%系统资源