机器学习模型种类

分类任务:常见的模型包括逻辑回归、决策树、随机森林、支持向量机、神经网络等;

  1. 信用评级:将客户的信用情况划分为优秀、良好、一般、差等等不同的评级类别。

  2. 欺诈检测:将交易行为划分为合法和欺诈两种类别。

  3. 图像识别:将图像中的物体或者场景划分为不同的类别,比如动物、交通工具、风景等等。

  4. 垃圾邮件过滤:将邮件划分为垃圾邮件和非垃圾邮件两种类别。

  5. 医学诊断:将患者的症状和疾病分为不同的类别,比如心脏病、糖尿病、癌症等等。

回归任务:常见的模型包括线性回归、岭回归、Lasso 回归、决策树回归、神经网络等;

  1. 房价预测:根据房屋的各种属性(面积、位置、年龄等等)来预测房价。

  2. 股票价格预测:根据历史股价数据和相关因素(公司业绩、行业走势等等)来预测股票价格。

  3. 药物疗效预测:根据患者的症状和药物剂量等因素来预测药物的疗效。

  4. 能源需求预测:根据历史能源使用数据和相关因素(天气、季节等等)来预测未来能源需求。

  5. 交通流量预测:根据历史交通数据和相关因素(时间、天气、节假日等等)来预测未来交通流量。

聚类任务:常见的模型包括 K-Means、谱聚类、层次聚类等;

  1. 市场细分:根据用户行为和偏好,将消费者细分为不同的群体,以便更好地定位和服务不同的客户。

  2. 图像分析:将相似的像素分组到同一类中,以便识别和提取图像中的特定对象。

  3. 生物学:对基因表达式数据进行聚类分析,以便识别与特定生物过程相关的基因群。

  4. 推荐系统:将用户分组到具有相似偏好的群体中,以便向他们提供个性化的推荐。

  5. 搜索引擎:将相关的搜索结果分组到一起,以便为用户提供更好的搜索体验。

降维任务:常见的模型包括主成分分析(PCA)、t-SNE 等; 异常检测任务:常见的模型包括离群点检测(Outlier detection)、异常检测(Anomaly detection)等; 推荐系统任务:常见的模型包括基于内容的推荐、协同过滤、矩阵分解等。

Scikit—learn常用模型函数

分类模型:

sklearn.linear_model.LogisticRegression
sklearn.naive_bayes.GaussianNB
sklearn.tree.DecisionTreeClassifier
sklearn.ensemble.RandomForestClassifier
sklearn.svm.SVC
sklearn.neighbors.KNeighborsClassifier

回归模型:

sklearn.linear_model.LinearRegression
sklearn.linear_model.Ridge
sklearn.tree.DecisionTreeRegressor
sklearn.ensemble.RandomForestRegressor
sklearn.svm.SVR
sklearn.neighbors.KNeighborsRegressor

聚类模型:

sklearn.cluster.KMeans
sklearn.cluster.DBSCAN
sklearn.cluster.AgglomerativeClustering

降维模型:

sklearn.decomposition.PCA
sklearn.manifold.TSNE
sklearn.decomposition.NMF