MLエンジニアは、モデルのトレーニング以外に、日々どのようなツールを実際に使用していますか?
分析
このr/learnmachinelearningのReddit投稿は、MLエンジニアの役割に関する一般的な誤解を浮き彫りにしています。モデルのトレーニングは仕事のごく一部にすぎないことを正しく指摘しています。この投稿では、データクレンジング、特徴量エンジニアリング、デプロイメント、モニタリング、およびメンテナンスに不可欠なツールについてアドバイスを求めています。Pandas、SQL、Kubernetes、AWS、FastAPI/Flaskなどの言及されたツールは確かに重要ですが、モデルモニタリング(例:Evidently AI、Arize AI)、CI/CDパイプライン(例:Jenkins、GitLab CI)、およびデータバージョニング(例:DVC)のツールを含めることで、議論がより有益になる可能性があります。この投稿は、モデル構築以外に必要なスキルの幅を理解するための、意欲的なMLエンジニアにとって良い出発点となります。
重要ポイント
引用・出典
原文を見る"So I’ve been hearing that most of your job as an ML engineer isn't model building but rather data cleaning, feature pipelines, deployment, monitoring, maintenance, etc."