机器学习模型种类
分类任务:常见的模型包括逻辑回归、决策树、随机森林、支持向量机、神经网络等;
信用评级:将客户的信用情况划分为优秀、良好、一般、差等等不同的评级类别。
欺诈检测:将交易行为划分为合法和欺诈两种类别。
图像识别:将图像中的物体或者场景划分为不同的类别,比如动物、交通工具、风景等等。
垃圾邮件过滤:将邮件划分为垃圾邮件和非垃圾邮件两种类别。
医学诊断:将患者的症状和疾病分为不同的类别,比如心脏病、糖尿病、癌症等等。
回归任务:常见的模型包括线性回归、岭回归、Lasso 回归、决策树回归、神经网络等;
房价预测:根据房屋的各种属性(面积、位置、年龄等等)来预测房价。
股票价格预测:根据历史股价数据和相关因素(公司业绩、行业走势等等)来预测股票价格。
药物疗效预测:根据患者的症状和药物剂量等因素来预测药物的疗效。
能源需求预测:根据历史能源使用数据和相关因素(天气、季节等等)来预测未来能源需求。
交通流量预测:根据历史交通数据和相关因素(时间、天气、节假日等等)来预测未来交通流量。
聚类任务:常见的模型包括 K-Means、谱聚类、层次聚类等;
市场细分:根据用户行为和偏好,将消费者细分为不同的群体,以便更好地定位和服务不同的客户。
图像分析:将相似的像素分组到同一类中,以便识别和提取图像中的特定对象。
生物学:对基因表达式数据进行聚类分析,以便识别与特定生物过程相关的基因群。
推荐系统:将用户分组到具有相似偏好的群体中,以便向他们提供个性化的推荐。
搜索引擎:将相关的搜索结果分组到一起,以便为用户提供更好的搜索体验。
降维任务:常见的模型包括主成分分析(PCA)、t-SNE 等; 异常检测任务:常见的模型包括离群点检测(Outlier detection)、异常检测(Anomaly detection)等; 推荐系统任务:常见的模型包括基于内容的推荐、协同过滤、矩阵分解等。
Scikit—learn常用模型函数
分类模型:
sklearn.linear_model.LogisticRegression
sklearn.naive_bayes.GaussianNB
sklearn.tree.DecisionTreeClassifier
sklearn.ensemble.RandomForestClassifier
sklearn.svm.SVC
sklearn.neighbors.KNeighborsClassifier
回归模型:
sklearn.linear_model.LinearRegression
sklearn.linear_model.Ridge
sklearn.tree.DecisionTreeRegressor
sklearn.ensemble.RandomForestRegressor
sklearn.svm.SVR
sklearn.neighbors.KNeighborsRegressor
聚类模型:
sklearn.cluster.KMeans
sklearn.cluster.DBSCAN
sklearn.cluster.AgglomerativeClustering
降维模型:
sklearn.decomposition.PCA
sklearn.manifold.TSNE
sklearn.decomposition.NMF