70万円/月額想定年収:840万円
業務委託契約
東京都千代田区
■業務内容 多様な教育サービスのデータを用いた機械学習モデル開発を担う機械学習エンジニアのポジションです。 ▼業務概要 ●パーソナライズ学習実現に向けた機械学習モデルの開発。 ●部門内のサービス改善を目的とした機械学習モデルの開発。 ▼業務詳細(モデル構築フェーズ) ●ビジネス要求ヒアリング ●要求を踏まえて機械学習タスクの全体設計 ●タスク開始前の基礎分析 ●モデル構築方針の検討(特徴量選定、手法検討、評価方法検討) ●モデルの実装(ライブラリ利用。最新論文手法の実装) ●モデルの定量・定性評価 ●モデル開発結果のレポーティング ▼業務詳細(モデルのシステム導入フェーズ) ●効果検証のグランドデザインの設計 ●効果検証のために追加取得すべきデータ要件の設計
東京都千代田区
下記に列挙するデータ専門性とエンジニアリング力を全て保持していること。 [データ専門性] ・SQL:SQLの構文を一通り理解し、記述、実行できる(DML、DOLの理解。、種JOINの使い分け、集計関数とGROUPBY、ASE文、副問合せなど)。加えて数百行のSQLを解読する事が出来る。 ・統計:統計検定2級レベルの内容を用いた実務経験を持つ。 ・機械学習:教師あり学習モデル、教師なし学習モデルの実務における構築経験を持つ(「はじめてのパターン認識」に相当する内容をイメージ)。また、特徴量エンジニアリング、モデルの性能チューニング、モデルのオフライン性能評価のノウハウを持つ。 [エンジニアリング力] ・システム設計能力:機械学習モデルをシステム導入する際のシステムアーキテクチャの検討が出来る。また、システム稼働中に発生する運用課題を洗い出す事が出来る。 ・アプリケーション開発:FlaskやFastAPIなどを利用して、機械学習モデルを本番利用するためのアプリケーションを開発することが出来る。サービス開発担当のアプリケーション開発エンジニアとシステム導入にあたっての技術面の相談が出来る。 ・コンピューターサイエンス:IPA基本情報技術者試験レベルのコンピューターサイエンスの知識を保有し、実務で利用する事が出来る。 【効果検証のためのデータ分析開発環境は下記になります。】 ●インフラ ○GCP(データ基盤)/AWS(関連システム) ●データパイプライン(ETL) ○CloudComposer(Airflow) ●DWH ○BigQuery ●その他インフラ管理 ○Docker ○GKE/GAE/CloudRun ●可視化ツール ○GoogleDataPortal/Tableau ●分析環境 ○JupyterNotebook/GoogleColab/GoogleCloudML ●監視 ○CloudLogging/StackdriverLogging ●その他 ○Git/GitHub/Slack/Notion
下記に列挙する項目のいずれかを満たしている事。 [データ専門性] ・機械学習:パターン認識と機械学習(PRML)の上下巻と統計的学習の基礎(ESL)に相当する機械学習の知識。 ・自然言語処理:形態素解析、構文分析、固有表現抽出のアルゴリズムを理解し、使いこなせる。トピックモデル、サポートベクターマシンなどの文書分類手法を理解し、実行出来る。 RNNやLSTMなどを用いたニューラルネット型言語モデルを理解し使いこなせる。 ・DeepLearning:各種トップカンファレンスやarXivの論文を含めたDeepLearning系統の最先端の研究開発動向に精通している。 [エンジニアリング力] ・API開発:機械学習モデルの推論結果を提供するAPIのシステム設計が出来る。(インフラ設計、API仕様策定)。機械学習モデルの推論結果を提供するAPIのシステム運用方針を決められる。 ・データ設計能力:ビジネスプロセスを理解して、データフロー図、論理データモデル、ER図、テーブル定義書を作成することが出来る。モデル開発やオンライン性能検証の際に必要となるログ要件を作成することが出来る。 ・計算量への理解:計算量オーダーの概念を理解し、自身が開発した機械学習モデルの実行時間を見積もる事が出来る。見積もった実行時間や将来の予測対象数の拡大も考慮して、適切な手法選定に活かすことが出来る。 ・バッチ処理実装:機械学習モデルの学習や推論処理実行のためのバッチ処理実装が出来る。後続のサービス開発側のジョブ実行を考慮したジョブ設計が出来る。ジョブのエラーハンドリングを行うための設計が出来る。 [ビジネス力] ・コミュニケーション力:相手の理解度に合わせて説明粒度を調整して説明する能力。
フルリモート,一部リモート可,6ヶ月以上の長期コミット,大規模プロジェクト,BtoB
【稼働日数】 週2日,週3日,週4日,週5日 【募集背景・課題】 ■募集背景・課題,現在、弊社内で保持する学習データやアセスメントデータの活用にも本腰を入れ始めています。,機械学習によるデータ活用の方向性としては、教育業界におけるインパクト創出と既存サービスの成長支援の2パターンで考えています。,例えば下記のようなテーマを想定しています。,・教育業界におけるインパクト創出:個別学習実現のための機械学習モデル開発,・既存サービスの成長支援:弊社サービスにおけるレコメンドモデル開発,またR&D的な取り組みとして、集合研修などリアルな場におけるデータ解析なども検討しています。,これらの実現のために、データ専門性の高い人材を集めたデータサイエンスチームを組成し、体制強化を進めています。,なお、チーム内での役割分担は下記のようにしています。,・データサイエンティスト:データによる新しい価値創造をゴールとするデータ分析やモデル開発を担う。,・機械学習エンジニア:サービス実装をゴールとした機械学習のモデル開発を担う。,・データエンジニア:データ活用の要となるデータ基盤開発と運用を担う。
情報提供元: HiPro Tech(ハイプロテック)
2年前
SNSアカウントでログイン