募集終了リモートワークオンライン面談可

【AWS】監視運用インフラエンジニア

50万円/月額想定年収:600万円

業務委託契約

職務内容

■業務内容 主に次の業務内容をチームで取り組みます。 ・ 監視パラメータの設計、設定、設定変更 ・ 電話ローテーションによるアラート対応 ・ 運用業務フローの検討・策定・改善実施 ・ サービス(プロダクト)毎の現状を把握し、最適な運用を考える - アラートの多い箇所の改善案を提案し、改善を実施 - アプリケーション(主にOSS系プロダクト)の保守 - プラグイン検証、設定変更検証、変更実施 ・ クラウド環境(AWS)でのバックアップと復元操作 - 現状のバックアップ手法でよいか検討・提案・実施 - 今後、AWS以外のパブリッククラウドが増える可能性があります ・ バックアップやメンテナンスに必要なツール作成(shスクリプト、Golang、etc...) ・ アラート対応 - 監視システムから上がってきたアラートを確認し、一次対応(手順書に基づいた対応)を実施します。 - 一次対応で解決しない場合は二次対応(手順書のない対応)を実施します。 ・ 障害再発防止 - 恒久対策やワークアラウンドを考え、適用実施します。 ・ 業務改善 - 自分たちが使うツール作成・フロー・ドキュメント整備及び改善諸々 ■担当頂くサービス 担当頂く監視対象には以下のサービス群があります。 ・Jira, Confluence, Crowd ・Gerrit, GitMirror ・Nextcloud ・Coverity, Black Duck ・Jenkins, GitLab ・Qlik Sense, Enterprise Architect系ミドルウェア, Simple AD管理用Windowsサーバー ・お客様開発のウェブアプリケーション ・各種AWSサービスのメトリクス、CloudWatch ・クラフトマンの自社サービス ・Grafana, Kibana等の監視基盤 ■アピールポイント ・開発部隊が1000人規模かつ複数の大きな処理を伴うサービス群の監視運用の経験が積めます ・EC2運用からk8s運用まで幅広い運用実績を積んで頂けます ・理想の運用体制への提案のしやすさと、それを実施するための裁量権 ・1次対応はできるだけ自動化、2次対応以降のマネジメントサービスにおいては障害要因をできるだけ改善し取り除いていく攻めの運用保守のスタイルです ・Linux, Windowsの正常稼働を保ち、セキュリティを保つ方法が身につきます ・インフラ経験が18年以上のベテランエンジニアがチームにいます ・技術とチームを大切にする文化です ・ツールやコードを駆使して賢く楽をしようというスタンスです ■仕事の進め方 よくある監視運用チームではなく、1次対応はできるだけ自動化していくように運用開発をしていきます。 既存の監視運用業務はありますが、これから監視運用チームを再構築していくため、 現状、完成された監視運用ではなく、我々で監視運用を作っていくフェーズになります。 さらに、ただ引き継ぐだけでなく、より自動化し、管理しやすい環境へ一緒に作り上げていければと思います。 ・アジャイル開発のスクラム手法でスプリントごとにゴールを定めながら仕事を進めます ・チケットとドキュメントをベースに仕事を進めます ・1週間に1回、スプリントミーティングを実施して状況を確認します ・毎日、状況確認や課題解決のための短いミーティングを実施します ■求める人物像 ・AWS/インフラ自動化に高い関心がある方 ・物事に対してチームで取り組めていける方 ■勤務時間 9:00〜18:00(実働8時間・160時間/月) 勤務時間調整可 ・電話ローテーションに参加して頂きます  ・連絡用ツールとして会社からiPhone + Apple Watch を貸与します ・シフト勤務をお願いする場合があります  ・障害対応やインフラメンテナンス時に休日作業や深夜作業をお願いする場合があります  ・代休を取得いただいたり、勤務時間調整を行っています

必須スキル

■必須スキル 【経験】 ・オンプレ・クラウド問わずにインフラエンジニアもしくはシステム保守のご経験を2年以上(規模問わず) ・インフラの障害対応経験 【スキル】 Linux ・Linuxの基本的なコマンドが扱える ・Linuxでウェブサーバーやメールサーバーといったサーバーの概念を理解 ・認証(LDAPなど)の基本概念を理解している ・またはLPIC/LinuC Lv1 or 2 相当のスキル保持者 ※ また、下記1-4のうち1つ以上のスキルがあること(実務経験や年数は問わず) 1. Docker ・Dockerコマンドや docker-compose を使ってコンテナを起動、終了するなどの基本的な操作ができる ・yamlファイルを読むことができる、作成や修正ができる 2. Windowsサーバー ・Windowsサーバーの基本的な操作ができる ・RDPツールなど問題なく利用することができる ・Windowsのローカルユーザー、Active Directoryユーザーの概念を理解 3. ネットワーク ・IPアドレスの基本概念を理解している ・DNSの基本概念を理解している ・ルーティングやスイッチングの基本を理解している ・またはCCNA相当のスキル保持者 4. Git ・基本的なGitコマンドが使用できる ・コミットルールやブランチの理解 ・Mergeができて、コンフリクト解決ができる ■歓迎スキル ・IaC(TerraformやCloudFormationなど)の使用経験 ・バックエンド開発経験。言語はGolangであれば尚歓迎 ・Ansibleの使用経験 ・冗長構成システムの運用保守経験 ・Kubernetesの構築または運用経験 ・トラブルシュートのために英文ドキュメントやStack Overflowなどの情報を参照して問題を解決できる ・ドキュメント作成経験(Officeやwikiなどツールは問わず)

その他情報

■ 働き方: フルリモート ■ 稼働日数: 週3日,週5日,週4日 ■ 副業: OK ■ 企業情報: インフラ構築・運用の受託開発企業

担当エージェントの言葉

・AWS上に構築された多岐にわたるサービスの構築・運用経験ができます ・Terraformを使った大規模コードの運用、改善の経験ができます ・Terraformを使ったCI/CDの環境構築に携われます ・既存インフラの設計改善に携われます

情報提供元: Remogu(リモグ)

2年以上前