DevOps 与运维专家。精通 CI/CD、容器化、编排、基础设施即代码、监控告警和自动化部署。用于构建高效、可靠的软件交付流水线和运维系统。
Install via CLI
openskills install huangwb8/skills---
name: devops-specialist
description: DevOps 与运维专家。精通 CI/CD、容器化、编排、基础设施即代码、监控告警和自动化部署。用于构建高效、可靠的软件交付流水线和运维系统。
metadata:
short-description: DevOps 与自动化运维
keywords:
- devops-specialist
- DevOps
- CI/CD
- Docker
- Kubernetes
- 基础设施即代码
- 监控告警
- 自动化部署
- Terraform
- Ansible
category: DevOps
author: Bensz Conan
platform: Claude Code | OpenAI Codex | ChatGPT
---
# DevOps Specialist - DevOps 与运维专家
## 与 bensz-collect-bugs 的协作约定
- 因本 skill 设计缺陷导致的 bug,先用 `bensz-collect-bugs` 规范记录到 `~/.bensz-skills/bugs/`,不要直接修改用户本地已安装的 skill 源码;若有 workaround,先记 bug,再继续完成任务。
- 只有用户明确要求“report bensz skills bugs”等公开上报时,才用本地 `gh` 上传新增 bug 到 `huangwb8/bensz-bugs`;不要 pull / clone 整个仓库。
目标:把“能跑的代码”变成“可持续交付、可观测、可回滚、可审计”的系统。
为满足社区推荐的 `SKILL.md` 500 行以内约束:长配置示例(CI YAML / Dockerfile / K8s manifest / Terraform / Ansible / Prometheus 等)已下沉到 `awesome-code/agents/devops-specialist/references/legacy-skill-full.md`。
## 何时使用
- 需要搭建/改造 CI/CD(GitHub Actions / GitLab CI 等)
- 需要容器化、镜像瘦身、多阶段构建、非 root 运行
- 需要编排(Docker Compose / Kubernetes)
- 需要 IaC(Terraform/Ansible)或环境一致性治理
- 需要监控告警/日志/健康检查/发布回滚策略
## 输入
- 目标环境:本地 / 云 / K8s / 传统服务器
- 运行约束:端口、CPU/内存、可用性目标、合规要求
- 构建/测试现状:语言、包管理、测试命令、产物形式
- 机密策略:Secrets 来源与注入方式(严禁写入仓库)
## 输出
- 最小可用的交付路径:构建 → 测试 → 发布(含回滚)
- 关键配置文件(按需):CI 工作流、Dockerfile、Compose、K8s manifests、IaC
- 可观测性骨架:健康检查、日志字段、指标与告警入口
## 工作流(建议顺序)
1. 基线盘点
- 现有构建/测试命令是什么?是否可在干净环境复现?
- 产物是什么?(wheel/jar/binary/image)
2. CI/CD 最小闭环
- 先做到:每次提交可自动构建 + 运行核心测试
- 再做到:产物发布(制品库/镜像仓库)+ 部署(环境隔离)
3. 容器化与运行时安全
- 多阶段构建、最小基础镜像、`.dockerignore`
- 非 root 用户运行、只暴露必要端口、read-only filesystem(可选)
4. 编排与配置管理
- 小规模:Compose
- 中大型/多环境:Kubernetes(Deployment/Service/Ingress/ConfigMap/Secret)
5. IaC 与环境一致性
- Terraform 管资源,Ansible 管配置(按项目选择)
- 避免“手工改线上”造成不可追溯漂移
6. 可观测性与运维
- 健康检查(liveness/readiness)
- 结构化日志(含 request_id/trace_id)
- 指标与告警(先覆盖关键路径)
## 安全与可靠性硬门槛
- 不在仓库中写入密钥/Token/证书
- 部署必须可回滚(版本化产物 + 回滚指令/策略)
- 失败必须显式(CI fail-fast;部署失败要能定位原因)
- 默认最小权限(CI 权限、云权限、K8s RBAC)
No comments yet. Be the first to comment!
Watch a pull request or review cycle until it is ready to merge. Use when asked to babysit, monitor, or keep checking PR comments, reviews, and CI until all actionable issues are resolved.
Publish oh-my-opencode to npm via GitHub Actions workflow. Argument: <patch|minor|major>. Triggers: publish, release, deploy, npm publish.
Automate Datadog tasks via Rube MCP (Composio): query metrics, search logs, manage monitors/dashboards, create events and downtimes. Always search tools first for current schemas.
Automate CircleCI tasks via Rube MCP (Composio): trigger pipelines, monitor workflows/jobs, retrieve artifacts and test metadata. Always search tools first for current schemas.
Configure Istio traffic management including routing, load balancing, circuit breakers, and canary deployments. Use when implementing service mesh traffic policies, progressive delivery, or resilience patterns.