50 ~ 70万円/月額想定年収:600 ~ 840万円
140~180時間
翌月25日支払い
業務委託契約
新橋
職務内容
下記業務をお任せします。 ・オブザーバビリティの導入と改善 SLI/SLOの実装と運用を推進し、インシデントやエラーバジェットの管理。 ・緊急対応体制の整備 インシデント対応の品質担保のため、緊急対応訓練や再発防止策の策定・実施をリード。 ・負荷テストとボトルネック改善 サービスの負荷予測や負荷テストを設計・実施し、インフラ・アプリケーションのボトルネックを解消。 ・リリースエンジニアリングの改善 リリースプロセスの最適化や自動化、エラーの早期検出と回避を目指し、開発・運用の連携強化。 ・アーキテクチャと信頼性の改善 アプリケーションアーキテクチャの支援やシステムの安定稼働施策の実施および信頼性の向上。 ・継続的改善と自動化・標準化 リファクタリング、自動化、標準化を通じたシステム改善の推進。 ・クラウドインフラの設計と管理 AWSなどのクラウド環境でのスケーラブルで信頼性の高いインフラの設計、実装、管理。 ・パフォーマンス監視とトラブルシューティング システムのパフォーマンスを監視し、複雑な問題のトラブルシューティングを行い、可用性と信頼性を確保。 ・CI/CD環境の改善と自動化 CI/CDパイプラインの改善と自動化、運用負荷の削減を通じて開発者の生産性向上をサポート。 ・SRE文化の醸成とDevOps支援 SRE文化の推進、インフラ設定やコスト最適化、信頼性向上に向けた支援、DevOps領域での改善。 月間4,100万以上のユーザーが使う巨大サービスであり、現在も大きな成長を続けているサービスの信頼性を担保していく重要ポジションです。 AWS
必須スキル
・パブリッククラウドに関する設計構築運用の経験(5年以上) ・Infrastructure as Codeの経験 ・Dockerやkubernetes等のコンテナ技術に関する構築運用経験 ・CI/CDパイプラインの構築運用経験 ・各種モニタリングツールの利用経験 ・Webアプリケーションの開発運用経験
尚可スキル
・Webサービスに関するSRE経験(5年以上) ・Webアプリケーション開発運用経験(3年以上) ・AWS環境での大規模toC向けWebサービスのSRE経験 ・ゼロからSLI/SLOを設計し運用した経験 ・エラーバジェットやポストモーテムなどのSREプラクティスに関する実践経験 ・勉強会やカンファレンスなどの登壇発表経験
商談回数
その他 / オンライン
担当エージェントの言葉
案件の特徴:安定稼働,長期プロジェクト,BtoC,ベテラン歓迎
情報提供元: ギークスジョブ(geechsjob)
7時間前
SNSアカウントでログイン