数据科学家

  • 北京
  • 面议
  • 本科及以上
  • 面议

刷新日期: 2019-07-17  截止日期: 2019-08-16

职位描述

【职位描述】:
* 能够基于用户在线行为数据建立多模型复合分析模型,从而实现behavioral targeting, look-alike modeling,anomaly detection,recommendation等在商业问题上运用
* 协助工程师在大型集群上部署模型,协助实现模型的高效和并发
【任职资格】:
* 计算机科学、应用数学、统计学、经济学、物理学、天文学、商业分析、信息系统、数据科学或相关本科或以上学历
* 良好的团队合作精神与沟通能力
* 具备很强的工程能力,执行力强
* 有很强的好奇心
【技能要求】:
必须要求:
* 对常见机器学习模型,如有监督模型k-NN, Naïve Bayes, Linear Regression, Logistic Regression (包含LASSO和RIDGE), Regression/Decision Tree, GBDT, Random Forest,全连接神经网络;无监督模型如k-means,DBSCAN, PCA有坚实的理论基础,能熟练推导模型公式 (以上列出的算法为必考考点)
* 熟练掌握机器学习的基本概念和方法:Type I/II error, activation function (ReLU, Sigmoidal), SGD, VC (Vapnik-Chervonenkis) dimension, information entropy, cross entropy, KL (Kullback-Leibler) divergence, cross validation, boosting, bagging, L1/L2 regularization, backward-propagation (以上列出的概念为必考考点)
* 熟练使用Python,Pandas,Sklearn,XGBoost(python API),LightGBM(python API)等编程语言和软件包
* 在项目或者课程中使用过常见的特征筛选(feature selection)和特征降维(dimension reduction)的方法
* 熟悉不平衡样本的处理方法
* 在项目或者课程中,使用Shiny/ggplot, Dash(python)/Seaborn/Plotly等数据可视化工具
* 具备阅读英文技术文档和学术文献的能力(笔试和内部考核考试为全英文)
额外加分项:
* 在项目或者课程中,使用过pyspark或者dask等分布式计算平台者优先
* 在项目或者课程中,使用过TensorFlow等深度学习平台者优先
* 具备征信/风控/计算广告相关经验,熟悉行业中特征工程方法者优先

立即投递
相似职位推荐 查看更多
招聘动态查看更多
  • 上海
  • 本科及以上
  • 4天/周
  • 上海
  • 本科及以上
  • 4天/周
  • 上海
  • 本科及以上
  • 4天/周
  • 成都
  • 本科及以上
  • 5天/周
  • 上海
  • 本科及以上
  • 4天/周
  • 上海
  • 本科及以上
  • 面议