一颗蔬菜

我虽是只猫却也常常思考

机器学习的编程语言

  • Python
  • C++
  • Scala

机器学习的常用框架

  • 统计学习:Spark(ml/mllib) scikit-learn Mahout
  • 深度学习:TensorFlow、Caffe、Keras(x on Spark & SparkNet)
使用Spark的好处
  • 技术栈统一:便于整合Spark的四个模块
  • 机器学习模型的训练是迭代过程,Spark基于内存的计算效率更高
  • 天然的分布式:弥补单机算力的不足,具备弹性扩容的能力
  • 原型即产品:Spark可直接适用在生产环境中
  • 支持主流深度学习框架运行在Spark上
  • 自带矩阵计算和机器学习库,算法全面

机器学习项目的选型要点

  • 充分考虑生产环境与业务场景
  • 尽量选择文档更详尽,资料更完备,社区更活跃的开源项目
  • 考虑研发团队情况,力求技术栈精简统一,避免冗杂

发表评论

正在加载 Emoji