下記に列挙するデータ専門性とエンジニアリング力を全て保持していること。
[データ専門性]
・SQL:SQLの構文を一通り理解し、記述、実行できる(DML、DOLの理解。、種JOINの使い分け、集計関数とGROUPBY、ASE文、副問合せなど)。加えて数百行のSQLを解読する事が出来る。
・統計:統計検定2級レベルの内容を用いた実務経験を持つ。
・機械学習:教師あり学習モデル、教師なし学習モデルの実務における構築経験を持つ(「はじめてのパターン認識」に相当する内容をイメージ)。また、特徴量エンジニアリング、モデルの性能チューニング、モデルのオフライン性能評価のノウハウを持つ。
[エンジニアリング力]
・システム設計能力:機械学習モデルをシステム導入する際のシステムアーキテクチャの検討が出来る。また、システム稼働中に発生する運用課題を洗い出す事が出来る。
・アプリケーション開発:FlaskやFastAPIなどを利用して、機械学習モデルを本番利用するためのアプリケーションを開発することが出来る。サービス開発担当のアプリケーション開発エンジニアとシステム導入にあたっての技術面の相談が出来る。
・コンピューターサイエンス:IPA基本情報技術者試験レベルのコンピューターサイエンスの知識を保有し、実務で利用する事が出来る。
【効果検証のためのデータ分析開発環境は下記になります。】
●インフラ
○GCP(データ基盤)/AWS(関連システム)
●データパイプライン(ETL)
○CloudComposer(Airflow)
●DWH
○BigQuery
●その他インフラ管理
○Docker
○GKE/GAE/CloudRun
●可視化ツール
○GoogleDataPortal/Tableau
●分析環境
○JupyterNotebook/GoogleColab/GoogleCloudML
●監視
○CloudLogging/StackdriverLogging
●その他
○Git/GitHub/Slack/Notion
SNSアカウントでログイン