確か Facebook で知ったページだが、機械学習分野の求人面接でもっとも聞かれる20の質問と答えといったところか。とりあえず質問(と答え)をざっと訳してみる。ワタシはその筋に特に通じているわけじゃないので、誤訳があったらゴメン!
- 機械学習技術の手法を3つ挙げてください(教師あり学習、教師なし学習、強化学習)
- 教師あり学習が扱う問題には何があるでしょう(分類問題、回帰問題)
- 教師あり学習と教師なし学習でもっともよく使用される技術をいくつか挙げてください(重回帰分析やロジスティック回帰など)
- 分類や回帰の技術を適用する必要があるかどうやって決めますか?
- 機械学習における次元削減とはなんでしょう?
- データセット上で次元削減を行う手法を挙げてください(因子分析や主成分分析など)
- NLP とは何でしょうか。NLP と機械学習の関係を説明してください(NLP は自然言語処理(natural language processing)のこと)
- 機械学習で不均衡データをどう扱いますか?
- 最小二乗法(Ordinary Least Square:OLS)で回帰を行う際の前提はなんでしょう?
- 機械学習とディープラーニングの違いを説明してください
- データセットにおける欠測データをどう処理しますか?
- 機械学習ソリューションを終わらせるために終端を構築するもっとも一般的なステップをいくつか挙げてください
- 機械学習アルゴリズムの現実世界での応用をいくつか挙げてください
- データマイニングと機械学習の違いはなんでしょうか?
- 機械学習の分野であなたが直近に読んだ本や研究論文を教えてください
- 機械学習のアルゴリズムにおける F1 スコアの重要性を教えてください
- 決定木アルゴリズムにおける枝刈りはなんでしょう、またどうやって決定木を剪定するのでしょうか?
- なぜアンサンブル学習が利用されるのでしょうか?
- どんなときにアンサンブル学習を行うべきでしょうか?
- アンサンブル手法における二つのパラダイムを教えて下さい
これくらいの質問にスラスラ答えられるようにならないといかんのかねぇ。大変だ。
ちょこっとだけ回答まで手を出しているが、詳しい回答については原文をあたってくだされ。
[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)
- 作者:Sebastian Raschka,Vahid Mirjalili
- 発売日: 2018/03/16
- メディア: 単行本(ソフトカバー)